找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 数据2022年世界杯推特数据集

    2025年4月14日   

    数据2022年世界杯推特数据集 数据来源:互联网公开数据 标签:世界杯,2022,足球,社交媒体,推特,数据分析,情感分析 数据概述: 本数据集包含了2022年世界杯首日的30,000条推文,使用Snscrape工具和Hugging Face Hub中的cardiffnlp/twitter-roberta-base-sentiment-...
    packageimg
  • 多年代视频游戏评论数据分析集2002-2023

    2025年4月14日   

    多年代视频游戏评论数据分析集2002-2023 数据来源:互联网公开数据 标签:视频游戏,评论分析,游戏设计,行业趋势,玩家偏好,NLP,机器学习,数据可视化 数据概述:...
    packageimg
  • IMDB电影及其关键词分析数据集

    2025年4月14日   

    IMDB电影及其关键词分析数据集 数据来源:互联网公开数据 标签:IMDB, 电影, 关键词提取, 自然语言处理, 影视分析 数据概述: 本数据集基于IMDB(Internet Movie...
    packageimg
  • 呼吸数据VR头戴式设备健康监测数据集

    2025年4月14日   

    呼吸数据VR头戴式设备健康监测数据集 数据来源:互联网公开数据 标签:呼吸监测,VR设备,PPG信号,加速度计,健康监测,机器学习,数据采集,生物信号 数据概述: 本数据集由Emteq Labs开发,通过emteqPRO系统采集,结合VR传感器口罩与Pico Neo 2 Eye...
    packageimg
  • 印度艾哈迈达巴德酒店用户点评数据集

    2025年4月14日   

    印度艾哈迈达巴德酒店用户点评数据集 数据来源:互联网公开数据 标签:酒店点评,用户评价,艾哈迈达巴德,印度,酒店排名,情感分析,自然语言处理,文本分析,酒店管理 数据概述:...
    packageimg
  • 数据200-20新闻组文本分类数据集

    2025年4月14日   

    数据200-20新闻组文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,新闻组,文本预处理,机器学习,监督学习 数据概述: 本数据集是一个经过预处理的文本数据集合,来源为scikit-learn提供的20...
    packageimg
  • 印度Reddit社区帖子内容分类数据集

    2025年4月14日   

    印度Reddit社区帖子内容分类数据集 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,帖子,内容分析,分类,机器学习,自然语言处理,社区,标签 数据概述: 本数据集包含了来自印度Reddit社区的帖子数据。数据通过Reddit...
    packageimg
  • 阿拉伯文文本摘要数据集

    2025年4月14日   

    阿拉伯文文本摘要数据集 数据来源:互联网公开数据 标签:阿拉伯文,文本摘要,自然语言处理,机器学习,数据集,Kaggle 数据概述:...
    packageimg
  • 孟加拉医学数据集

    2025年4月14日   

    孟加拉医学数据集 数据来源:互联网公开数据 标签:孟加拉语,医学,命名实体识别,专科分类,自然语言处理,医疗保健,症状识别,健康问题 数据概述:...
    packageimg
  • 全球商品目录数据集2023

    2025年4月14日   

    全球商品目录数据集2023 数据来源:互联网公开数据 标签:商品目录,产品分类,市场研究,自然语言处理,电子商务,文本分析 数据概述:...
    packageimg
  • 老友记所有对白数据集

    2025年4月14日   

    老友记所有对白数据集 数据来源:互联网公开数据 标签:老友记,对白,剧本,对话分析,情感分析,自然语言处理,聊天机器人 数据概述:...
    packageimg
  • 收据布局数据集SSD300V2-CSV

    2025年4月14日   

    收据布局数据集SSD300V2-CSV 数据来源:互联网公开数据 标签:收据,布局分析,图像识别,文本提取,深度学习,计算机视觉,数据标注 数据概述:...
    packageimg
  • 英文歌曲歌词数据集

    2025年4月14日   

    英文歌曲歌词数据集 数据来源:互联网公开数据 标签:英文歌曲,歌词,音乐分析,文本挖掘,文化研究 数据概述: 本数据集收录了大量英文歌曲的歌词文本,涵盖不同时期和各种风格的音乐作品。数据集为研究英语文化的表达方式、音乐风格的演变以及歌词中的情感和主题提供了丰富的文本资源。 数据用途概述:...
    packageimg
  • COVID-19疫苗推特数据集

    2025年4月14日   

    COVID-19疫苗推特数据集 数据来源:互联网公开数据 标签:COVID-19,疫苗,推特,公共卫生,社会舆论,数据分析,公众情绪 数据概述: 本数据集包含关于Pfizer疫苗接种的推特帖子,涵盖2020年至2021年期间的相关讨论。数据集包含四个关键字段:用户名(Username)、描述文本(Description...
    packageimg
  • 巴西学生自动简短答案评分数据集2018

    2025年4月14日   

    巴西学生自动简短答案评分数据集2018 数据来源:互联网公开数据 标签:自动评分,简短答案,巴西学生,教育技术,机器学习,数据分析 数据概述:...
    packageimg
  • 客户支持训练数据集用于LLM虚拟助手

    2025年4月14日   

    客户支持训练数据集用于LLM虚拟助手 数据来源:互联网公开数据 标签:客户支持,LLM,虚拟助手,意图识别,实体提取,问答对,语言生成,训练数据,NLP应用 数据概述:...
    packageimg
  • 单词难度数据集

    2025年4月14日   

    单词难度数据集 数据来源:互联网公开数据 标签:单词难度,语言学习,教育研究,自然语言处理,难度评估,学习者分析,教育工具,英语学习,认知科学,词汇研究 数据概述:...
    packageimg
  • YouTube评论仇恨言论检测数据集-KevinSamuels视频评论-LLaMa模型标注

    2025年4月14日   

    YouTube评论仇恨言论检测数据集-KevinSamuels视频评论-LLaMa模型标注 数据来源:互联网公开数据 标签:仇恨言论, YouTube评论, 女性歧视, 情感分析, 自然语言处理, 机器学习, Kevin Samuels, 社交媒体, 文本数据 数据概述: 本数据集通过抓取Kevin...
    packageimg
  • 冠状病毒疾病COVID-19全球疫情数据集2020-2023

    2025年4月14日   

    冠状病毒疾病COVID-19全球疫情数据集2020-2023 数据来源:互联网公开数据 标签:冠状病毒,COVID-19,全球疫情,时间序列,健康数据分析,流行病学研究,疫情地图 数据概述:...
    packageimg
  • 天堂II音乐数据集

    2025年4月14日   

    天堂II音乐数据集 数据来源:互联网公开数据 标签:天堂II,音乐,艺术家,专辑,曲目,音乐特征,流行度,热度,舞曲性,能量,音调,响度,模式,语音性,乐器性,现场性,愉悦度,节奏,时间签名,音乐流派 数据概述:...
    packageimg