找到11,966个数据集

标签: 自然语言处理

过滤结果
  • 文档嵌入技术研究数据集

    2025年4月15日   

    文档嵌入技术研究数据集 数据来源:互联网公开数据 标签:文档嵌入,自然语言处理,机器学习,数据可视化,文本分析,技术研究,zstandard压缩 数据概述:...
    packageimg
  • CounselChat心理咨询对话数据集

    2025年4月15日   

    CounselChat心理咨询对话数据集 数据来源:互联网公开数据 标签:心理咨询,对话,NLP,自然语言处理,情感分析,文本数据,CounselChat,语料库 数据概述: 本数据集收录了从 CounselChat 网站抓取的心理咨询对话数据。 CounselChat...
    packageimg
  • 印度及全球虚假与真实职位列表数据集1963-2021

    2025年4月15日   

    印度及全球虚假与真实职位列表数据集1963-2021 数据来源:互联网公开数据 标签:职位列表,印度,全球,虚假职位,真实职位,就业市场,自然语言处理 数据概述:...
    packageimg
  • 英国脱欧媒体舆论新闻文本数据集2016-2023

    2025年4月15日   

    英国脱欧媒体舆论新闻文本数据集2016-2023 数据来源:互联网公开数据 标签:英国脱欧,媒体舆论,文本分析,自然语言处理,新闻文本,舆论演变,主题建模 数据概述:...
    packageimg
  • 洋葱网讽刺新闻媒体内容数据集当前

    2025年4月15日   

    洋葱网讽刺新闻媒体内容数据集当前 数据来源:互联网公开数据 标签:讽刺新闻,洋葱网,媒体内容,自然语言处理,文本分类,数据分析 数据概述: 本数据集收录了洋葱网(The Onion)发布的讽刺新闻内容,包括新闻标题、发布时间及详细内容。数据集涵盖当前时间段内的新闻内容,展示了洋葱网独特的讽刺风格和媒体内容创作特点。 数据用途概述:...
    packageimg
  • 缅甸农业知识库数据集

    2025年4月15日   

    缅甸农业知识库数据集 数据来源:互联网公开数据 标签:缅甸农业,自然语言处理,指令调优语言模型,低资源语言,农作物,园艺,化学农药,植物病理学,气候变化,有机肥料 数据概述:...
    packageimg
  • 数据2023年电影产业数据分析数据集

    2025年4月15日   

    数据2023年电影产业数据分析数据集 数据来源:互联网公开数据 标签:电影数据,电影产业,票房分析,预算预测,导演分析,演员分析,推荐系统,自然语言处理 数据概述: 本数据集收录了超过5000部电影的信息,包括预算、票房收入、演员阵容、导演、制作公司及电影类型等多方面特征。数据集涵盖了从热门到相对小众的电影,提供了电影产业的全面概述。数据收集自The...
    packageimg
  • 情感分析抑郁情绪识别数据集

    2025年4月15日   

    情感分析抑郁情绪识别数据集 数据来源:互联网公开数据 标签:情感分析,抑郁,情绪识别,文本数据,机器学习,自然语言处理,情感标签 数据概述: 本数据集包含文本数据,其中“text_id”列用于存储情感文本,而“is_depression”列则作为标签,用于指示该情感是否被归类为抑郁情绪。如果情感被判定为抑郁,则标签值为1;否则,标签值为0。...
    packageimg
  • Reddit宗教文本分类数据集

    2025年4月15日   

    Reddit宗教文本分类数据集 数据来源:互联网公开数据 标签:Reddit, 宗教, 文本分类, 自然语言处理, 社交媒体, 文本数据, 宗教信仰 数据概述:...
    packageimg
  • 顶级15款手机应用用户反馈数据集

    2025年4月15日   

    顶级15款手机应用用户反馈数据集 数据来源:互联网公开数据 标签:用户反馈,手机应用,自然语言处理,文本分类,主题建模,用户情感,用户偏好,趋势分析 数据概述:...
    packageimg
  • 韩国语词汇频率数据集

    2025年4月15日   

    韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean...
    packageimg
  • 英语-法语翻译数据集

    2025年4月15日   

    英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:...
    packageimg
  • 推特用户MBTI人格类型数据集

    2025年4月15日   

    推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -...
    packageimg
  • 七十士译本数据集

    2025年4月15日   

    七十士译本数据集 数据来源:互联网公开数据 标签:七十士译本,旧约圣经,希伯来文,希腊文,圣经翻译,NLP,自然语言处理,文本分析 数据概述:...
    packageimg
  • 印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月

    2025年4月15日   

    印尼新闻网站DetikNews每日头条数据集-2015年1月至2020年10月 数据来源:互联网公开数据 标签:印尼新闻,头条,DetikNews,新闻分析,自然语言处理,媒体研究,时间序列,印尼语 数据概述:...
    packageimg
  • 符号相关性数据集用于LLM

    2025年4月15日   

    符号相关性数据集用于LLM 数据来源:互联网公开数据 标签:LLM,符号相关性,知识语言关系,自然语言处理,机器学习,研究数据 数据概述:...
    packageimg
  • 矛盾侦探瓦森翻译数据集

    2025年4月15日   

    矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear...
    packageimg
  • 预处理抑郁数据集

    2025年4月15日   

    预处理抑郁数据集 数据来源:互联网公开数据 标签:抑郁症,心理健康,文本分析,情感分析,社交媒体,自然语言处理,情感状态 数据概述:...
    packageimg
  • 英语时态分类数据集

    2025年4月15日   

    英语时态分类数据集 数据来源:互联网公开数据 标签:英语时态,自然语言处理,机器学习,句子分类,语法分析 数据概述: 本数据集包含标注了相应时态类别的英文句子,适用于自然语言处理(NLP)和机器学习项目中的时态分类任务。每个条目包括一个句子及其对应的时态数值标签,覆盖了多种时态类型,为研究和开发提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • LLM科学考试数据集-多样化数据源整合-竞赛专用

    2025年4月15日   

    LLM科学考试数据集-多样化数据源整合-竞赛专用 数据来源:互联网公开数据 标签:LLM, 科学考试, 数据集, 机器学习, 自然语言处理, 文本生成, 考试, 训练数据, MMLU, ChatGPT, Wikipedia 数据概述: 本数据集是为 LLM (大型语言模型, Large Language Model) 科学考试竞赛准备的, 包含了 6...
    packageimg