-
生成电子邮件垃圾邮件数据集
生成电子邮件垃圾邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据标注,合成数据,网络安全,文本数据,NLP,情感分析 数据概述: 本数据集包含一个CSV文件,该文件包含300条生成的电子邮件垃圾邮件消息。每个文件行代表一封单独的电子邮件,包括其标题和正文。该数据集旨在促进垃圾邮件电子邮件的分析和检测。...
-
印度尼泊尔酒店评论数据集多语言版
印度尼泊尔酒店评论数据集多语言版 数据来源:互联网公开数据 标签:酒店评论,印度,尼泊尔,多语言,客户反馈,旅游分析 数据概述: 本数据集包含了印度和尼泊尔酒店的客户评论,评论内容分别以泰米尔语、尼泊尔语和英语呈现。数据集涵盖了大量不同语言的评论,为研究多语言客户反馈提供了丰富素材。 数据用途概述:...
-
性别偏见西班牙语数据集
性别偏见西班牙语数据集 数据来源:互联网公开数据 标签:性别偏见,社交媒体分析,西班牙语,文本分类,数据标注,网络偏见,社会研究 数据概述: 本数据集包含超过1900条标注为有偏见或无偏见的西班牙语推文。这些数据是为减少互联网上性别偏见的黑客马拉松活动特别收集和标注的,旨在帮助识别和分析社交媒体中的性别偏见问题。 数据用途概述:...
-
StackOverflow跨站点问题相似性研究数据集
StackOverflow跨站点问题相似性研究数据集 数据来源:互联网公开数据 标签:Stack Overflow,问答社区,问题相似性,跨站点,自然语言处理,文本挖掘,数据分析,软件开发 数据概述: 本数据集包含了Stack Overflow (SO) 以及 Stack Overflow 英文站点 (SOES) 的跨站点问题数据,主要用于研究不同...
-
-
全国中医药知识图谱构建与应用大赛数据集2023
全国中医药知识图谱构建与应用大赛数据集2023 数据来源:互联网公开数据 标签:中医药,知识图谱,实体识别,关系抽取,知识融合,Neo4j,医学研究,大数据应用 数据概述:...
-
模拟城市-建造App用户评论情感分析数据集
模拟城市-建造App用户评论情感分析数据集 数据来源:互联网公开数据 标签:App评论,情感分析,用户反馈,模拟城市,游戏,Google Play,自然语言处理,文本分析,用户体验 数据概述: 本数据集收录了来自Google Play商店中模拟城市:建造(SimCity...
-
疫苗接种推文数据集2021-02
疫苗接种推文数据集2021-02 数据来源:互联网公开数据 标签:疫苗接种,推特,公共舆论,COVID-19,健康传播,社交媒体分析 数据概述: 本数据集收录了2021年2月2日从Twitter上抓取的推文,这些推文使用了vaccination, vaccine 或 covidvaccine...
-
翻译数学问题数据集
翻译数学问题数据集 数据来源:互联网公开数据 标签:数学问题,翻译, Bengali, English, 语言模型, 机器翻译, 取回增强生成, 少样本学习 数据概述:...
-
-
来自Twitter的阿拉伯语讽刺推文数据集
来自Twitter的阿拉伯语讽刺推文数据集 数据来源:互联网公开数据 本数据集由 Abufarha 等研究者在 WANLP 2021 Shared Task 中发布,旨在推动阿拉伯语自然语言处理领域中讽刺识别与情感分类任务的研究。项目地址:https://github.com/iabufarha/ArSarcasm-v2 数据内容: 数据集收集自...
-
全球点唱机计划-Cantometrics音乐文化编码数据集
全球点唱机计划-Cantometrics音乐文化编码数据集 数据来源:互联网公开数据 标签:Cantometrics,音乐,文化,编码,民俗,全球点唱机,社会,歌曲,元数据,表演艺术 数据概述:...
-
姓名与国家来源数据集
姓名与国家来源数据集 数据来源:互联网公开数据 标签:姓名,国家,起源,多样性,NLP,自然语言处理,知识图谱,人名识别,文化研究,数据生成 数据概述:...
-
不适当词汇分类数据集
不适当词汇分类数据集 数据来源:互联网公开数据 标签:词汇分类,情感分析,不适当词汇,自然语言处理,英语,Singlish 数据概述: 本数据集包含被分类为正面或负面的词汇列表,所有收录的词汇已经过预处理。数据集中每个词汇附带有情感值,用以描述该词汇是否为不适当的。数据集中的词汇包括英语和Singlish两种语言,为研究和分析词汇情感提供了双语基础。...
-
欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语
欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-...
-
-
AAAI会议接受论文数据集
AAAI会议接受论文数据集 数据来源:互联网公开数据 标签:AAAI会议,接受论文,文本挖掘,自然语言处理,学术研究,会议评审,关键词分析 数据概述: 本数据集收录了AAAI会议150篇接受论文的详细信息,每篇论文包含标题、摘要和关键词。该数据集旨在支持文本挖掘任务,帮助研究人员分析和理解AAAI会议的评审过程和政策。 数据用途概述:...
-
新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月
新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月 数据来源:互联网公开数据 标签:酒店评论,滨海湾金沙,TripAdvisor,用户评价,文本分析,NLP,情感分析,旅游,新加坡 数据概述:...
-
生物信息学启动子识别数据集1963-2021
生物信息学启动子识别数据集1963-2021 数据来源:互联网公开数据 标签:生物信息学,启动子预测,基因调控,机器学习,生物技术,基因组学,基因表达 数据概述:...
-
巴西流媒体平台情感分析数据集
巴西流媒体平台情感分析数据集 数据来源:互联网公开数据 标签:巴西,流媒体平台,情感分析,市场研究,消费者行为,内容偏好,Reddit数据 数据概述: 本数据集包含2023年至2024年间巴西用户关于主要流媒体平台(Netflix、Disney+和Amazon...



