找到11,688个数据集

标签: 自然语言处理

过滤结果
  • 气候变化问答数据集

    2025年4月14日   

    气候变化问答数据集 数据来源:互联网公开数据 标签:气候变化,对话问答,自然语言处理,人机对话,环境问题,数据集 数据概述:...
    packageimg
  • 社交媒体情感分析数据集-多平台用户发帖-情感分类-通用

    2025年4月14日   

    社交媒体情感分析数据集-多平台用户发帖-情感分类-通用 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本数据,情感分类,情绪识别,自然语言处理,机器学习,文本挖掘 数据概述: 本数据集包含了来自多个在线平台(包括推特、脸书帖子和Reddit帖子)的X条帖子。每条帖子都附带了其所代表的情感类别标签,涵盖了在线交流中广泛的情感表达。 关键字段:...
    packageimg
  • 高评分电影词干与词形还原分析数据集

    2025年4月14日   

    高评分电影词干与词形还原分析数据集 数据来源:互联网公开数据 标签:电影,高评分,词干提取,词形还原,自然语言处理,文本分析,影视研究 数据概述: 本数据集收录了若干高评分电影的基本信息及其概述内容的词干和词形还原处理结果。数据集包含以下字段: - 电影标题:电影的名称 - 电影概述:对电影剧情的简要描述 - 类型列表:电影所属的类型或标签 -...
    packageimg
  • OmdenaFAQ聊天机器人训练数据集

    2025年4月14日   

    OmdenaFAQ聊天机器人训练数据集 数据来源:互联网公开数据 标签:聊天机器人,FAQ,自然语言处理,训练数据,互动网站,项目数据,Omdena 数据概述:...
    packageimg
  • 美国2024年夏季数据科学家职位招聘数据集

    2025年4月14日   

    美国2024年夏季数据科学家职位招聘数据集 数据来源:互联网公开数据 标签:数据科学,招聘,职位,美国,远程,数据分析,数据可视化,文本分析,自然语言处理,机器学习 数据概述: 本数据集抓取自Indeed招聘网站,时间为2024年夏季,关键词为“数据科学家”。数据覆盖了美国所有州的职位招聘信息,包括远程职位,全面反映了该时期的数据科学就业市场状况。...
    packageimg
  • 综合新闻文章数据集

    2025年4月14日   

    综合新闻文章数据集 数据来源:互联网公开数据 标签:新闻文章,自然语言处理,情感分析,主题建模,机器学习,文本分类,命名实体识别 数据概述: 本数据集汇集了来自多个来源的新闻文章,涵盖了包括科技、体育、金融、政治、教育、健康和娱乐在内的多个类别。数据集旨在为自然语言处理(NLP)任务、情感分析、主题建模等机器学习应用提供多样且广泛的数据支持。...
    packageimg
  • 意大利汽车金融公司客户评论数据集

    2025年4月14日   

    意大利汽车金融公司客户评论数据集 数据来源:互联网公开数据 标签:汽车金融,意大利,客户评论,自然语言处理,Toyota,VolksWagen,Opel,PSA 数据概述: 本数据集收录了2021年从谷歌评论中获取的四家意大利汽车金融公司的客户评论,包括Toyota Financial Services Italia、Volkswagen...
    packageimg
  • 产品情感分析数据集2022

    2025年4月14日   

    产品情感分析数据集2022 数据来源:互联网公开数据 标签:产品情感分析,自然语言处理,机器学习,预训练模型,情感分类,文本特征提取 数据概述:...
    packageimg
  • IMDB电影评论情感分析数据集-1万条评论-二元分类

    2025年4月14日   

    IMDB电影评论情感分析数据集-1万条评论-二元分类 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,文本分类,二元分类,自然语言处理,机器学习,情感极性 数据概述:...
    packageimg
  • 刺客信条-奥德赛Steam平台用户评论情感分析数据集

    2025年4月14日   

    刺客信条-奥德赛Steam平台用户评论情感分析数据集 数据来源:互联网公开数据 标签:刺客信条,奥德赛,Steam,游戏评论,情感分析,自然语言处理,用户反馈,游戏测评 数据概述:...
    packageimg
  • 马恒达汽车员工评价数据集1963-2021

    2025年4月14日   

    马恒达汽车员工评价数据集1963-2021 数据来源:互联网公开数据 标签:马恒达汽车,员工评价,工作环境,公司文化,职业发展,工作生活平衡,情感分析,自然语言处理 数据概述: 本数据集收集了来自印度跨国汽车制造公司马恒达汽车员工在Ambition...
    packageimg
  • 数据16K长度文本指令数据集

    2025年4月14日   

    数据16K长度文本指令数据集 数据来源:互联网公开数据 标签:文本指令,自然语言处理,机器学习模型,数据分析,文本分析,情感分析,指令比较 数据概述:...
    packageimg
  • 耐克产品描述数据集

    2025年4月14日   

    耐克产品描述数据集 数据来源:互联网公开数据 标签:耐克,产品描述,自然语言处理,语言模型,训练数据,电子商务,文本分析 数据概述: 本数据集包含从耐克官方网站抓取的400个耐克产品的详细描述信息,包括产品标题、副标题和产品描述三个字段。数据采用CSV格式存储,每一行代表一个产品的相关信息。 数据用途概述:...
    packageimg
  • 孟加拉语文本噪声标注数据集-情感分析应用-2024

    2025年4月14日   

    孟加拉语文本噪声标注数据集-情感分析应用-2024 数据来源:互联网公开数据 标签:孟加拉语,文本,噪声,标注,情感分析,自然语言处理,W-NUT,机器学习,语言学 数据概述: 本数据集为多标签数据集,旨在用于孟加拉语文本中的噪声识别。该数据集由四位母语为孟加拉语的专家标注,标注可信度达到90%。Fleiss'...
    packageimg
  • 数据2017至2020年黎巴嫩社交网络阿拉伯化语言情感分析数据集

    2025年4月14日   

    数据2017至2020年黎巴嫩社交网络阿拉伯化语言情感分析数据集 数据来源:互联网公开数据 标签:情感分析,阿拉伯化语言,社交媒体,黎巴嫩,数据集,自然语言处理,机器学习 数据概述:...
    packageimg
  • IMDB电影评论情感分析数据集-电影评论文本-电影评论文本-电影评论文本

    2025年4月14日   

    IMDB电影评论情感分析数据集-电影评论文本-电影评论文本-电影评论文本 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本分析,机器学习,深度学习,分类,IMDB,电影,评论 数据概述:...
    packageimg
  • 词语难度评估数据集

    2025年4月14日   

    词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean...
    packageimg
  • 亚马逊购物查询数据集2022年

    2025年4月14日   

    亚马逊购物查询数据集2022年 数据来源:互联网公开数据 标签:亚马逊,购物查询,产品搜索,电子商务,用户行为,自然语言处理,推荐系统 数据概述: 本数据集收录了亚马逊平台上的大规模购物查询记录,涵盖2022年期间的用户搜索数据。数据包括用户的查询文本、查询时间戳、查询结果的相关产品信息等,为提升产品搜索性能提供了丰富的基准数据。 数据用途概述:...
    packageimg
  • 土耳其土耳其语推特字符数据集

    2025年4月14日   

    土耳其土耳其语推特字符数据集 数据来源:互联网公开数据 标签:土耳其,推特,社交媒体,文本分析,自然语言处理,情感分析,字符数据 数据概述: 本数据集包含从Twitter API及其他多种来源收集的土耳其语推文,并经过伦理标注处理。数据集中的400个类别已被简化为30个类别,旨在为文本分析和自然语言处理任务提供丰富的数据基础。 数据用途概述:...
    packageimg
  • BBC印地语新闻文章数据集

    2025年4月14日   

    BBC印地语新闻文章数据集 数据来源:互联网公开数据 标签:印地语新闻,新闻文本,自然语言处理,NLP,情感分析,语言模型,新闻分类 数据概述: 本数据集包含通过Python网络爬虫技术从BBC印地语新闻网站采集的大量新闻文章,涵盖了多个新闻类别。每个新闻条目包含以下三个核心字段: 标题(Headline):新闻文章的标题,用于概括新闻的主要内容。...
    packageimg