找到16,256个数据集

标签: 自然语言处理

过滤结果
  • Goodreads图书数据分析与评价数据集

    2025年4月15日   

    Goodreads图书数据分析与评价数据集 数据来源:互联网公开数据 标签:图书,评价,阅读,书籍,文学,评论,评分,读者,数据分析 数据概述: 本数据集包含了来自Goodreads网站的图书数据,旨在为读者提供全面的书籍信息和评价。数据核心内容存储在csv文件,包含以下字段: * title: 图书标题。 * author: 图书作者。 *...
    packageimg
  • 社交媒体虚假声明检测与分类声明数据集

    2025年4月15日   

    社交媒体虚假声明检测与分类声明数据集 数据来源:互联网公开数据 标签:虚假声明检测,社交媒体,文本分类,深度学习,信息真实性,声明分析,自然语言处理 数据概述: 本数据集旨在解决社交媒体平台上虚假信息和假新闻的传播问题,通过收集和整理声明文本及其相关元数据,构建了一个用于检测虚假声明的结构化数据集。数据集包含以下字段: - ID:唯一标识符 -...
    packageimg
  • 合成数学多选题数据集

    2025年4月15日   

    合成数学多选题数据集 数据来源:互联网公开数据 标签:合成数据,数学题,多选题,教育技术,数学误解,检索模型,重排序模型 数据概述: 本数据集包含了EEDI竞赛数据以及约10,000道合成的数学多选题,旨在用于训练检索器和重排序器,以检测给定错误答案中的数学误解。该数据集与“eedi-mcq-...
    packageimg
  • 印度及周边地区抑郁症与非抑郁症推文数据集2019-2020

    2025年4月15日   

    印度及周边地区抑郁症与非抑郁症推文数据集2019-2020 数据来源:互联网公开数据 标签:抑郁症,非抑郁症,推文,情感分析,印度,印度次大陆,情感词典,自然语言处理 数据概述:...
    packageimg
  • Reddit跨板块帖子分析数据集1963-2021

    2025年4月15日   

    Reddit跨板块帖子分析数据集1963-2021 数据来源:互联网公开数据 标签:Reddit,帖子,社区分析,自然语言处理,情感分析,话题建模,社交媒体研究 数据概述:...
    packageimg
  • YouTube视频统计数据集

    2025年4月15日   

    YouTube视频统计数据集 数据来源:互联网公开数据 数据集简介: 本数据集通过 YouTube API...
    packageimg
  • 同理心语段标注数据集

    2025年4月15日   

    同理心语段标注数据集 数据来源:互联网公开数据 标签:同理心,医疗保健,情感分析,语义标注,自然语言处理,情感理解,语言学研究,护理交流 数据概述:...
    packageimg
  • 语言模型对比数据集

    2025年4月15日   

    语言模型对比数据集 数据来源:互联网公开数据 标签:语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能 数据概述: 本数据集包含从Govinfo网站收集的90个问题及其正确答案,并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1...
    packageimg
  • Reddit社区自杀风险帖子检测数据集

    2025年4月15日   

    Reddit社区自杀风险帖子检测数据集 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,风险评估,自然语言处理 数据概述:...
    packageimg
  • 心理健康对话数据集

    2025年4月15日   

    心理健康对话数据集 数据来源:互联网公开数据 标签:心理健康,对话数据,合成数据,OpenAI,ChatGPT,咨询对话 数据概述: 本数据集包含1297条模拟的心理健康对话记录,这些对话是通过OpenAI的ChatGPT生成的。每条对话由问题和答案对转换而成的完整对话组成,经过提示工程优化,旨在模拟真实的咨询对话场景。 数据用途概述:...
    packageimg
  • 非监督学习自然语言处理数据集

    2025年4月15日   

    非监督学习自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,非监督学习,问答系统,TF-IDF,文档检索 数据概述: 本数据集用于非监督学习中的问答系统训练。数据集中的每一行代表一个文档,适用于通过向量模型和TF-IDF方法检索用户查询的答案。该数据集包含大量的文本信息,为构建有效的问答系统提供了丰富的训练素材。 数据用途概述:...
    packageimg
  • 豪斯医生剧集数据集

    2025年4月15日   

    豪斯医生剧集数据集 数据来源:互联网公开数据 标签:豪斯医生,电视剧,IMDB,剧集信息,季度,集数,剧情,音轨 数据概述: 本数据集提供了广受欢迎的电视剧《豪斯医生》在其全部播出时段内的详细剧集信息。每个记录条目包括季度号、集数、IMDB链接、剧集标题以及简要剧情概述。数据涵盖了8个季度,共计176集。 季度:标识剧集所属的季度。...
    packageimg
  • 旁遮普地区恐怖袭击事件推文数据集

    2025年4月15日   

    旁遮普地区恐怖袭击事件推文数据集 数据来源:互联网公开数据 标签:恐怖袭击,社交媒体,情感分析,地区差异,时间序列分析,国际关系,公共情绪 数据概述:...
    packageimg
  • Flipkart手机用户评论情感分析数据集

    2025年4月15日   

    Flipkart手机用户评论情感分析数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,用户反馈,电商,文本数据,自然语言处理,产品评价 数据概述: 本数据集包含了来自 Flipkart...
    packageimg
  • 中文有毒语言数据集

    2025年4月15日   

    中文有毒语言数据集 数据来源:互联网公开数据 标签:中文,有毒语言,文本分析,机器学习,自然语言处理,伦理问题,多级分类,基准测试 数据概述:...
    packageimg
  • COVID-19推特情绪分析数据集

    2025年4月15日   

    COVID-19推特情绪分析数据集 数据来源:互联网公开数据 标签:COVID-19,推特,情绪分析,机器学习,数据处理,社会情感,地理标记 数据概述:...
    packageimg
  • Reddit谎言推特谎言信息传播分析数据集-每周更新

    2025年4月15日   

    Reddit谎言推特谎言信息传播分析数据集-每周更新 数据来源:互联网公开数据 标签:推特,社交媒体,谎言,Reddit,信息传播,时间序列,文本分析 数据概述:...
    packageimg
  • 中国酒店评论数据集

    2025年4月15日   

    中国酒店评论数据集 数据来源:互联网公开数据 标签:酒店评论,中国,客户反馈,正面评价,负面评价,旅游分析,客户满意度 数据概述: 本数据集包含了7000多条中国酒店的评论数据,其中包括5000多条正面评论和2000多条负面评论。数据全面覆盖了不同客户对酒店的反馈和评价,为了解中国酒店行业的客户满意度和改进方向提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • 波尔多葡萄酒品评数据集

    2025年4月15日   

    波尔多葡萄酒品评数据集 数据来源:互联网公开数据 标签:葡萄酒,波尔多,品评数据,自然语言处理,NLP,风味特征,感官分析,21世纪 数据概述:...
    packageimg
  • 尼泊尔语文本情感分析数据集

    2025年4月15日   

    尼泊尔语文本情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,文本分类,自然语言处理,语言学,情感标签 数据概述: 本数据集包含了尼泊尔语的句子,并附带了情感标签。数据集旨在用于尼泊尔语文本的情感分析任务。每个句子都对应一个情感标签,用于区分句子的情感倾向。 情感标签定义如下: 1:正面情感 0:负面情感 2:中性情感 数据用途概述:...
    packageimg