-
人工智能生成虚假播客数据集2023
人工智能生成虚假播客数据集2023 数据来源:互联网公开数据 标签:播客,人工智能,虚假内容,垃圾邮件,SEO,媒体分析,技术伦理 数据概述: 本数据集收录了部分在Listen Notes播客数据库添加过程中被标记为人工智能生成的虚假播客。这些“播客”主要使用Notebook...
-
佩里-罗丹宇宙飞船数据集
佩里-罗丹宇宙飞船数据集 数据来源:互联网公开数据 标签:佩里-罗丹,宇宙飞船,科幻小说,银河帝国,太空探索,科技发展,外星文明 数据概述: 本数据集收录了科幻小说《佩里-罗丹》(Perry...
-
土耳其语社交媒体攻击性语言识别数据集
土耳其语社交媒体攻击性语言识别数据集 数据来源:互联网公开数据 标签:土耳其语,社交媒体,攻击性语言,数据增强,文本分类,自然语言处理,情感分析 数据概述:...
-
-
Hinglish印地语-英语混合语机器翻译数据集
Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish...
-
英德阿拉伯文本翻译数据集
英德阿拉伯文本翻译数据集 数据来源:互联网公开数据 标签:文本翻译,语言学,英语,德语,阿拉伯语,多语言数据集,语言对比 数据概述: 本数据集包含从英语翻译到德语和阿拉伯语的多语言文本内容。数据集涵盖了广泛的文本类型,适用于语言学研究、机器翻译模型训练以及跨语言信息处理等领域。其中,阿拉伯语翻译部分来源于特定的数据集。 数据用途概述:...
-
餐厅评论情感分析分类数据集
餐厅评论情感分析分类数据集 数据来源:互联网公开数据 标签:餐厅评论,情感分析,自然语言处理,文本分类,机器学习,监督学习,情感识别 数据概述:...
-
英语至印地文罗马化翻译数据集
英语至印地文罗马化翻译数据集 数据来源:互联网公开数据 标签:英语,印地文,罗马化,翻译,31字母,化学,生物,地理 数据概述: 本数据集用于将英语翻译成印地文的罗马化形式。数据集中使用了31个字母来转写梵文字母的印地文,包括26个拉丁字母a-...
-
疫苗相关推文数据集
疫苗相关推文数据集 数据来源:互联网公开数据 标签:疫苗,推文,COVID-19,公众意见,社交媒体分析,健康信息,数据收集 数据概述: 本数据集收集了全球范围内关于COVID-19疫苗的近期推文数据,涵盖的主要疫苗包括Pfizer/BioNTech, Sinopharm, Sinovac, Moderna, Oxford/AstraZeneca,...
-
-
南方公园台词文本数据集1997-2019
南方公园台词文本数据集1997-2019 数据来源:互联网公开数据 标签:南方公园,台词,自然语言处理,文本分析,电视剧,角色对话,时间序列 数据概述:...
-
-
Reddit讽刺新闻真伪辨析数据集
Reddit讽刺新闻真伪辨析数据集 数据来源:互联网公开数据 标签:Reddit, NotTheOnion, 讽刺新闻, 真伪辨别, 社交媒体, 新闻分析, 幽默, 数据挖掘 数据概述:...
-
推特讽刺检测LSTM语境分析数据集-2020
推特讽刺检测LSTM语境分析数据集-2020 数据来源:互联网公开数据 标签:讽刺检测,LSTM,推特,语境分析,自然语言处理,数据集,不平衡数据,平衡数据 数据概述: 本数据集包含用于讽刺检测的研究数据,特别针对推特平台上的内容。数据集分为两个版本:不平衡数据集(English...
-
印度巴哈萨语语料库情感标签数据集
印度巴哈萨语语料库情感标签数据集 数据来源:互联网公开数据 标签:情感分析,巴哈萨语,文本分类,机器学习,自然语言处理,社会媒体监控,客户服务 数据概述:...
-
-
情感分析数据集EvalML-PS-06-基于RoBERTa模型-多版本
情感分析数据集EvalML-PS-06-基于RoBERTa模型-多版本 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本分类,RoBERTa,模型比较,机器学习,数据集 数据概述: 本数据集为EvalML-...
-
数据2021美国总统就职典礼推特数据集
数据2021美国总统就职典礼推特数据集 数据来源:互联网公开数据 标签:特朗普,拜登,卡玛拉哈里斯,美国大选,总统就职典礼,美国总统,第一夫人,推特,公众意见,政治趋势 数据概述:...
-
YouTube阿姆哈拉语视频评论情感分析数据集
YouTube阿姆哈拉语视频评论情感分析数据集 数据来源:互联网公开数据 标签:阿姆哈拉语,YouTube,视频评论,情感分析,自然语言处理,情感极性,文本数据 数据概述: 本数据集包含了从YouTube上抓取的阿姆哈拉语电影和视频片段的评论数据,数据通过YouTube 2.0...
-
股票价格与新闻情感分析数据集
股票价格与新闻情感分析数据集 数据来源:互联网公开数据 标签:股票价格预测,新闻情感分析,股票市场,金融数据分析,投资决策,自然语言处理 数据概述:...



