找到95,210个数据集

分类: 互联网数据 格式: ZIP

过滤结果
  • 维基百科讨论页评论数据集个人攻击标签

    2025年4月21日 30 25 10

    维基百科讨论页评论数据集个人攻击标签 数据来源:互联网公开数据 标签:维基百科,讨论页,个人攻击,毒性评论,自然语言处理,机器学习,数据集 数据概述:...
    packageimg
  • 维基百科英文版百万地点坐标数据集

    2025年4月24日 30 13 1

    维基百科英文版百万地点坐标数据集 数据来源:互联网公开数据 标签:维基百科,地点,坐标,数据分析,教育,语言,历史,地理 数据概述:...
    packageimg
  • 维基百科统计学文章数据集

    2025年4月14日 30 21 5

    维基百科统计学文章数据集 数据来源:互联网公开数据 标签:维基百科,统计学,概率论,统计推断,数据分析,实验设计,统计方法,统计模型 数据概述: 本数据集收录了与统计学相关的维基百科文章的URL和标题,涵盖概率论、统计推断、数据分析、实验设计以及各种统计方法和模型等广泛主题,为研究统计学领域提供了丰富的信息资源。 数据用途概述:...
    packageimg
  • 维基百科管理员请求投票数据集

    2025年4月14日 30 11 5

    维基百科管理员请求投票数据集 数据来源:互联网公开数据 标签:维基百科,管理员请求,投票数据,网络分析,社区分析,用户行为,文本分析 数据概述:...
    packageimg
  • 维基百科电影剧情摘要数据集

    2025年4月20日 30 24 4

    维基百科电影剧情摘要数据集 数据来源:互联网公开数据 标签:电影,剧情,摘要,自然语言处理,文本分析,电影推荐,文化研究 数据概述: 本数据集基于JustinR在Kaggle发布的维基百科电影剧情数据集,包含了数以千计的电影及其完整剧情。在此基础上,我们使用DistilBART-...
    packageimg
  • 维基百科电影剧情向量嵌入数据集

    2025年4月26日 30 27 3

    维基百科电影剧情向量嵌入数据集 数据来源:互联网公开数据 标签:电影剧情,向量嵌入,自然语言处理,数据挖掘,机器学习,文本分析 数据概述:...
    packageimg
  • 维基百科标题多语言翻译数据集

    2025年5月31日 30 17 2

    维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:...
    packageimg
  • 维基百科文章数据集

    2025年5月30日 30 11 5

    维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,文本分析,数据挖掘,NLP,英语,开源数据 数据概述:...
    packageimg
  • 维基百科文章主题标签数据集

    2025年4月26日 30 29 10

    维基百科文章主题标签数据集 数据来源:互联网公开数据 标签:维基百科,文章,主题标签,自然语言处理,文本分类,信息检索 数据概述:...
    packageimg
  • 维基百科数据集

    2025年4月15日 30 28 9

    维基百科数据集 数据来源:互联网公开数据 标签:维基百科,开放数据,知识库,多语言,历史数据,内容分析,用户贡献 数据概述:...
    packageimg
  • 维基百科推广文章数据集

    2025年6月1日 30 24 10

    维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -...
    packageimg
  • 维基百科图像分类数据集

    2025年4月15日 30 25 4

    维基百科图像分类数据集 数据来源:互联网公开数据 标签:维基百科,图像分类,人物识别,性别分类,图像标注 数据概述:...
    packageimg
  • 维基百科名人传记翻译数据集

    2025年4月15日 30 11 3

    维基百科名人传记翻译数据集 数据来源:互联网公开数据 标签:机器翻译,性别准确性,上下文信息,英文,西班牙文,德文,语言处理,数据集分析 数据概述:...
    packageimg
  • 维基百科医学问答数据集

    2025年4月15日 30 27 5

    维基百科医学问答数据集 数据来源:互联网公开数据 标签:医学问答,波斯语,自然语言处理,问答系统,医学知识,知识提取 数据概述:...
    packageimg
  • 维基百科加密货币文章数据集

    2025年4月14日 30 22 2

    维基百科加密货币文章数据集 数据来源:互联网公开数据 标签:加密货币,维基百科,文章数据,机器学习,问答系统,摘要,对话,实体识别 数据概述:...
    packageimg
  • 维基百科分子性质数据集

    2025年4月15日 30 18 5

    维基百科分子性质数据集 数据来源:互联网公开数据 标签:化学分子,性质数据,药物发现,结构-性质关系,化学相似性 数据概述:...
    packageimg
  • 维基百科全球连环杀手案件与人物信息数据集

    2025年4月14日 30 10 6

    维基百科全球连环杀手案件与人物信息数据集 数据来源:互联网公开数据 标签:连环杀手,犯罪,谋杀,人物档案,犯罪统计,维基百科,杀人犯,犯罪学,社会学,历史 数据概述:...
    packageimg
  • 维基百科人物内容数据集

    2025年6月1日 30 14 1

    维基百科人物内容数据集 数据来源:互联网公开数据 标签:维基百科,人物,内容分析,文本挖掘,知识图谱,自然语言处理,数据分析 数据概述:...
    packageimg
  • 维基百科产品名称提及数据集

    2025年4月15日 30 24 2

    维基百科产品名称提及数据集 数据来源:互联网公开数据 标签:维基百科,产品名称,提及频率,时间序列,市场分析,产品趋势,自然语言处理 数据概述: 本数据集收录了维基百科页面中提及的产品名称及其出现频率,涵盖多个时间点的数据。数据集通过对维基百科文章的分析,提取出不同产品名称的提及情况,为了解市场趋势和产品影响力提供了宝贵的数据支持。 数据用途概述:...
    packageimg
  • 维基百科主题与类别数据集

    2025年6月1日 30 11 4

    维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political...
    packageimg