-
Kickstarter项目描述文本与项目成功状态数据集-2017年
Kickstarter项目描述文本与项目成功状态数据集-2017年 数据来源:互联网公开数据 标签:众筹项目,Kickstarter,自然语言处理,项目成功预测,文本分析,机器学习,项目描述,文本分类 数据概述:...
-
TED演讲数据集含演讲稿-LIWC和MFT分析
TED演讲数据集含演讲稿-LIWC和MFT分析 数据来源:互联网公开数据 标签:TED演讲,公共演讲,语言分析,道德基础理论,数据可视化,文本挖掘,自然语言处理,心理语言学 数据概述:...
-
日本报纸新闻数据集
日本报纸新闻数据集 数据来源:互联网公开数据 标签:日本媒体,新闻文本,时间序列,多语言 corpus,新闻分析,文本挖掘,语言研究 数据概述: 本数据集收录了2005年7月至2021年10月期间日本主流报纸网站及历史报纸 dataset...
-
音乐作品歌词数据集-歌曲及歌词信息-55K-首歌曲
音乐作品歌词数据集-歌曲及歌词信息-55K-首歌曲 数据来源:互联网公开数据 标签:歌词,歌曲,音乐,艺术家,文本数据,音乐分析,文本挖掘 数据概述:...
-
全球352种语言形态标注数据集
全球352种语言形态标注数据集 数据来源:互联网公开数据 标签:语言学,形态学,词形变化,多语种,自然语言处理,Unimorph,特征标注 数据概述:...
-
-
斯瓦希里语新闻分类数据集
斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
-
-
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日 数据来源:互联网公开数据 标签:TED演讲,文本,转录,演讲稿,自然语言处理,文本分析,主题分割,内容分析 数据概述:...
-
多社交媒体平台新闻热度数据集
多社交媒体平台新闻热度数据集 数据来源:互联网公开数据 标签:新闻热度,社交媒体,情感分析,多平台数据,新闻传播,时间序列,大数据分析 数据概述: 本数据集包含2015年11月至2016年7月期间,在四个不同主题(经济、微软、奥巴马和巴勒斯坦)下收集的约10万条新闻记录。数据来源于UCI Machine Learning...
-
Twitter社交媒体情感分析数据集
Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:...
-
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:...
-
-
Instagram应用评论数据集
Instagram应用评论数据集 数据来源:互联网公开数据 标签:Instagram, 应用评论, 用户反馈, 用户行为, 评分数据, 时间戳, 应用版本, 社交媒体分析 数据概述: 本数据集包含从Google...
-
ChatGPT话题推特情感分析数据集-2022年11月至2023年2月
ChatGPT话题推特情感分析数据集-2022年11月至2023年2月 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,情感分析,自然语言处理,人工智能,用户行为,话题讨论 数据概述:...
-
俄罗斯幽默笑话主题分类数据集
俄罗斯幽默笑话主题分类数据集 数据来源:互联网公开数据 标签:笑话,俄罗斯,幽默,文本分类,自然语言处理,情感分析,语言文化,喜剧 数据概述: 本数据集包含大量俄罗斯幽默笑话的文本内容,旨在为文本分类任务提供训练和测试数据。数据集中的每个笑话都附带了文本信息,可用于预测笑话的主题或进行情感分析。 数据用途概述:...
-
亚马逊服饰推荐系统数据集
亚马逊服饰推荐系统数据集 数据来源:互联网公开数据 标签:服饰推荐,亚马逊,NLP,深度学习,图像识别,产品推荐,电子商务 数据概述: 本数据集包含了亚马逊平台上服饰产品的详细信息,包括产品描述、用户行为数据、历史推荐记录以及相关文本和图像数据。数据集旨在为研究和开发服饰推荐系统提供基础支持,帮助优化推荐算法,提升用户购物体验。 数据用途概述:...
-
-
Reddit百万笑话语料库数据集-2020年4月1日前
Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:...
-
IWSLT2017英语-中文翻译数据集
IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging...



