找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 印度尼西亚社交媒体新冠疫情情绪分析数据集-2020年至今

    2025年4月15日   

    印度尼西亚社交媒体新冠疫情情绪分析数据集-2020年至今 数据来源:互联网公开数据 标签:新冠疫情,社交媒体,推特,情绪分析,印度尼西亚,文本数据,机器学习,舆情监测 数据概述:...
    packageimg
  • 即时通讯应用评价数据集

    2025年4月15日   

    即时通讯应用评价数据集 数据来源:互联网公开数据 标签:即时通讯应用,客户评价,多语言数据,谷歌Play商店,文本分析,情感分析,自然语言处理 数据概述...
    packageimg
  • 森林之子游戏用户评价数据集2003-2023

    2025年4月15日   

    森林之子游戏用户评价数据集2003-2023 数据来源:互联网公开数据 标签:游戏评价,Steam,森林之子,用户反馈,游戏分析,游戏评论 数据概述: 本数据集收录了自《森林之子》(Sons of the Forest)上线以来至2023年3月18日期间的所有英文Steam用户评价。《森林之子》是一款由Valve...
    packageimg
  • 越南字符脑电波数据集

    2025年4月15日   

    越南字符脑电波数据集 数据来源:互联网公开数据 标签:脑电波,越南字符,神经科技,脑机接口,机器学习,医疗康复,语言处理,性别研究,数据集 数据概述: 本数据集包含了从141名男性志愿者(年龄15至70岁)收集的脑电波(EEG)信号,用于对94个越南字符的脑波信号进行分类。数据通过NeuroSky Mindwave Mobile...
    packageimg
  • 钦定版圣经数据集

    2025年4月15日   

    钦定版圣经数据集 数据来源:互联网公开数据 标签:圣经,基督教,旧约,新约,希伯来语,希腊语,文学技巧,平行主义,回文结构,箴言,谜语 数据概述:...
    packageimg
  • 巴基斯坦新闻头条数据集2020年1月1日-2021年3月11日

    2025年4月15日   

    巴基斯坦新闻头条数据集2020年1月1日-2021年3月11日 数据来源:互联网公开数据 标签:巴基斯坦,新闻头条,时政新闻,社会问题,数据分析,媒体研究 数据概述:...
    packageimg
  • MrBeast油管视频转录文本数据集

    2025年4月15日   

    MrBeast油管视频转录文本数据集 数据来源:互联网公开数据 标签:MrBeast, YouTube, 视频转录, 文本分析, 情感分析, 内容分析, 社交媒体, 数据集 数据概述: 本数据集包含了MrBeast...
    packageimg
  • 葡萄牙语假新闻数据集

    2025年4月15日   

    葡萄牙语假新闻数据集 数据来源:互联网公开数据 标签:假新闻,葡萄牙语,新闻分类,文本分析,机器学习,信息真实性,媒体研究 数据概述:...
    packageimg
  • 疾病文章数据集

    2025年4月15日   

    疾病文章数据集 数据来源:互联网公开数据 标签:疾病,文章,文本处理,自然语言处理,Spacy,BERT,机器学习 数据概述:...
    packageimg
  • 土耳其语文本分类预处理数据集

    2025年4月15日   

    土耳其语文本分类预处理数据集 数据来源:互联网公开数据 标签:文本分类,土耳其语,预处理,机器学习,自然语言处理,文本挖掘 数据概述:...
    packageimg
  • 印尼形容词情感数据集

    2025年4月15日   

    印尼形容词情感数据集 数据来源:互联网公开数据 标签:印尼语,形容词,情感分析,自然语言处理,文本挖掘,词典数据 数据概述: 本数据集包含从《大印尼语词典》(KBBI)中提取的形容词及其情感标签。数据集分为两个文件:indonesian-adjective-sentiment-raw.csv 和 indonesian-adjective-...
    packageimg
  • 北极猴乐队歌曲歌词数据集

    2025年4月15日   

    北极猴乐队歌曲歌词数据集 数据来源:互联网公开数据 标签:音乐,歌词,北极猴乐队,歌曲分析,专辑,文本数据,流行音乐 数据概述: 本数据集收录了英国摇滚乐队北极猴(Arctic...
    packageimg
  • 社交媒体Twitter巴西葡萄牙语情感分析数据集

    2025年4月15日   

    社交媒体Twitter巴西葡萄牙语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,葡萄牙语,巴西,社交媒体文本,自然语言处理,文本分类,情绪识别 数据概述 本数据集为 Caramelo-Smile-V3 模型的情感分析训练数据,完全基于巴西葡萄牙语(PT-BR)。数据集构建自 Twitter...
    packageimg
  • 阿拉伯语词典数据集

    2025年4月15日   

    阿拉伯语词典数据集 数据来源:互联网公开数据 标签:阿拉伯语,词典,现代阿拉伯语,古典阿拉伯语,NLP,语言研究,词库应用 数据概述: 本数据集收录了两部全面的阿拉伯语词典:《现代阿拉伯语词典》(2008年,Ahmed Mukhtar...
    packageimg
  • 进击的巨人IMDb用户评论情感分析数据集

    2025年4月15日   

    进击的巨人IMDb用户评论情感分析数据集 数据来源:互联网公开数据 标签:进击的巨人,IMDb,动漫,用户评论,情感分析,自然语言处理,文本挖掘,评论数据 数据概述: 本数据集包含2098条关于动漫《进击的巨人》(Shingeki no...
    packageimg
  • 文档嵌入技术研究数据集

    2025年4月15日   

    文档嵌入技术研究数据集 数据来源:互联网公开数据 标签:文档嵌入,自然语言处理,机器学习,数据可视化,文本分析,技术研究,zstandard压缩 数据概述:...
    packageimg
  • Netflix剧集烂番茄评分与评论数据分析数据集

    2025年4月15日   

    Netflix剧集烂番茄评分与评论数据分析数据集 数据来源:互联网公开数据 标签:Netflix,剧集,烂番茄,评分,评论,网络爬虫,数据分析,媒体,娱乐 数据概述:...
    packageimg
  • CounselChat心理咨询对话数据集

    2025年4月15日   

    CounselChat心理咨询对话数据集 数据来源:互联网公开数据 标签:心理咨询,对话,NLP,自然语言处理,情感分析,文本数据,CounselChat,语料库 数据概述: 本数据集收录了从 CounselChat 网站抓取的心理咨询对话数据。 CounselChat...
    packageimg
  • 美国食品药品监督管理局FDA483表格关键信息提取与聚类数据集

    2025年4月15日   

    美国食品药品监督管理局FDA483表格关键信息提取与聚类数据集 数据来源:互联网公开数据 标签:FDA,Form483,检查报告,文本提取,关键信息,聚类分析,AWS Textract,数据挖掘,医疗器械,药品 数据概述: 本数据集旨在为研究美国食品药品监督管理局(FDA)483表格的检查结果提供数据支持。数据来源于使用AWS Textract从FDA...
    packageimg
  • TikTok应用用户评论情感分析数据集-GooglePlayStore2024

    2025年4月15日   

    TikTok应用用户评论情感分析数据集-GooglePlayStore2024 数据来源:互联网公开数据 标签:TikTok, 用户评论, 情感分析, Google Play Store, 应用评价, 用户体验, 社交媒体, 文本挖掘, 数据分析 数据概述: 本数据集包含从 Google Play Store 收集的 100,000 条 TikTok...
    packageimg