找到12,111个数据集

标签: 自然语言处理

过滤结果
  • 僧伽罗语新闻文章数据集

    2025年4月14日   

    僧伽罗语新闻文章数据集 数据来源:互联网公开数据 标签:僧伽罗语,新闻,多分类,文本数据,机器学习,自然语言处理,斯里兰卡新闻,开源数据集 数据概述: 本数据集基于斯里兰卡知名新闻网站Hiru...
    packageimg
  • 推特用户对特定实体的情感分析数据集

    2025年4月14日   

    推特用户对特定实体的情感分析数据集 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本挖掘,自然语言处理,机器学习,情感分类,实体识别 数据概述: 本数据集专注于推特数据的实体级情感分析。对于每条推文(消息)及其在其中提到的特定实体,数据集旨在确定用户对该实体表达的情感。 数据集将情感分为三个类别: 积极:推文表达了对实体的积极看法。...
    packageimg
  • 美国仇恨犯罪分类数据集1963-2021

    2025年4月14日   

    美国仇恨犯罪分类数据集1963-2021 数据来源:互联网公开数据 标签:仇恨犯罪,分类分析,美国,时间序列,自然语言处理,预测建模 数据概述: 本数据集包含3700条来自Google Trend的CSV记录,涵盖了1963年至2021年间美国的仇恨犯罪事件。每条记录包括新闻标题、日期、地点和URL等关键信息,为研究和防范仇恨犯罪提供了宝贵的数据支持。...
    packageimg
  • 图鲁语YouTube视频评论情感分析数据集

    2025年4月14日   

    图鲁语YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:图鲁语,YouTube,评论,情感分析,自然语言处理,文本数据,情感分类 数据概述:...
    packageimg
  • Reddit平台热门科技子版块帖子互动数据分析数据集

    2025年4月14日   

    Reddit平台热门科技子版块帖子互动数据分析数据集 数据来源:互联网公开数据 标签:Reddit,科技,社区,社交媒体,帖子,互动,情感分析,自然语言处理 数据概述:...
    packageimg
  • 康德著作数据集

    2025年4月14日   

    康德著作数据集 数据来源:互联网公开数据 标签:康德,哲学,伦理学,道德学,形而上学,自然语言处理,文本分析 数据概述: 本数据集收录了伊曼努尔·康德的主要著作,涵盖了伦理学、道德学和形而上学等领域。数据集包含一个自增列和四个重要的信息列,包括著作标题、出版日期以及原始文本和清理后的文本。这些文本数据为研究康德哲学思想提供了丰富的资源。 数据用途概述:...
    packageimg
  • 网络攻击性言论数据集

    2025年4月14日   

    网络攻击性言论数据集 数据来源:互联网公开数据 标签:仇恨言论,攻击性言论,社交媒体,内容审核,自然语言处理,文本分析,社会问题 数据概述:...
    packageimg
  • arXiv论文摘要与嵌入向量每日更新数据集

    2025年4月14日   

    arXiv论文摘要与嵌入向量每日更新数据集 数据来源:互联网公开数据 标签:arXiv,论文,摘要,嵌入向量,自然语言处理,机器学习,科研,学术,每日更新 数据概述: 本数据集包含每日arXiv论文的标题、摘要以及对应的嵌入向量。数据集每天更新,其中不包含周六、周日及节假日的论文。嵌入向量的计算方法详见提供的Notebook文件。...
    packageimg
  • 德语问答数据集

    2025年4月14日   

    德语问答数据集 数据来源:互联网公开数据 标签:德语问答,自然语言处理,机器学习,问答系统,数据标注,德语分析,跨语言学习 数据概述:...
    packageimg
  • Steam游戏评论关键要素标注数据集-英语评论-2024

    2025年4月14日   

    Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg
  • 推特情感分析STS-Gold数据集

    2025年4月14日   

    推特情感分析STS-Gold数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,社交媒体,情感极性,机器学习,自然语言处理 数据概述: 本数据集由Saif等人(2013)创建,包含2026条推文及其对应的ID和情感极性标签。这些推文用于训练情感分析模型。若使用本数据集,请引用原论文。 原论文引用:Saif, H., Fernandez,...
    packageimg
  • 印度时报新闻数据集

    2025年4月14日   

    印度时报新闻数据集 数据来源:互联网公开数据 标签:印度时报,政治新闻,媒体分析,新闻趋势,情感分析,命名实体识别,主题建模,自然语言处理 数据概述:...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg
  • 学术引用意图分类数据集

    2025年4月14日   

    学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface...
    packageimg
  • 亚马逊产品评论情感分析数据集

    2025年4月14日   

    亚马逊产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,产品评论,情感分析,消费者反馈,市场研究,自然语言处理,数据分析 数据概述: 本数据集包含了亚马逊平台上各类产品的客户评论,涵盖了广泛的消费产品,提供了宝贵的消费者意见和情感见解。数据集中的评论内容丰富多样,有助于了解不同产品在消费者心中的表现和评价。 数据用途概述:...
    packageimg
  • wikiHow文章读者反馈与文章特征关联数据集

    2025年4月14日   

    wikiHow文章读者反馈与文章特征关联数据集 数据来源:互联网公开数据 标签:wikiHow,文章质量,读者反馈,自然语言处理,机器学习,文章分析,内容评估 数据概述:...
    packageimg
  • 垃圾邮件分类邮件数据集

    2025年4月14日   

    垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:...
    packageimg
  • 斯瓦希里语自然语言处理数据集

    2025年4月14日   

    斯瓦希里语自然语言处理数据集 数据来源:互联网公开数据 标签:斯瓦希里语,自然语言处理,网络内容检测,机器学习,深度学习,人工智能,文本分类,数据安全 数据概述:...
    packageimg
  • 葡萄牙语文本到SQL查询生成数据集2023

    2025年4月14日   

    葡萄牙语文本到SQL查询生成数据集2023 数据来源:互联网公开数据 标签:葡萄牙语,文本到SQL,自然语言处理,机器学习,数据库 数据概述: 本数据集是b-mc2/sql-create-context数据集的葡萄牙语翻译版本,基于WikiSQL和Spider数据集构建。数据集包含了葡萄牙语问题、SQL CREATE...
    packageimg
  • 阿拉伯语推特情感分析数据集

    2025年4月14日   

    阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:...
    packageimg