-
-
命名实体识别数据集
命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,预训练语言模型,文本标注,机器学习,数据科学,Kaggle数据集 数据概述: 本数据集主要用于运行基于预训练语言模型的命名实体识别(NER)任务的笔记本。数据集包含三个关键字段:1. 文本内容(Text),2. 实体标注(Labels),3....
-
乌克兰在线购物用户反馈数据集
乌克兰在线购物用户反馈数据集 数据来源:互联网公开数据 标签:用户反馈,在线购物,乌克兰,自然语言处理,数据分析,消费者意见,电子商务 数据概述:...
-
乌尔都-普什图双语词典数据集
乌尔都-普什图双语词典数据集 数据来源:互联网公开数据 标签:乌尔都语,普什图语,双语词典,自然语言处理,机器翻译,语言研究 数据概述: 乌尔都-...
-
新冠疫苗新闻Reddit讨论评论数据集
新冠疫苗新闻Reddit讨论评论数据集 数据来源:互联网公开数据 标签:新冠疫苗, Reddit, 评论, 疫情, 社交媒体, 舆情分析, 文本数据, 疫苗接种 数据概述:...
-
Goodreads热门书籍描述与标签数据集
Goodreads热门书籍描述与标签数据集 数据来源:互联网公开数据 标签:书籍推荐,图书,描述,标签,Goodreads,阅读,文本分析,热门书籍 数据概述: 本数据集整合了Goodreads平台排名前2000位的书籍信息,包括书籍描述和标签。数据集基于goodbooks-10k数据集,通过Goodreads...
-
Indiegogo众筹平台项目表现数据集-2011-2020
Indiegogo众筹平台项目表现数据集-2011-2020 数据来源:互联网公开数据 标签:众筹,Indiegogo,项目,融资,创业,成功率,地理位置,时间序列,项目分类,文本分析 数据概述:...
-
YALICKJ维基百科带上下文数据集
YALICKJ维基百科带上下文数据集 数据来源:互联网公开数据 标签:维基百科,上下文,数据集,自然语言处理,机器学习,文本分析 数据概述: 本数据集基于YALICKJ在Kaggle上提供的维基百科数据集,并增加了由Chris Notebook生成的上下文列。数据集包含了维基百科页面的文本内容及其对应的上下文信息,适用于自然语言处理和机器学习任务。...
-
二选一趣味问答投票题库与结果统计数据集
二选一趣味问答投票题库与结果统计数据集 数据来源:互联网公开数据 数据集说明: 本数据集收录了一系列“Would You Rather”(你更愿意……还是……)风格的趣味选择题,以及每个选项所获得的投票数量。该类型问题常用于社交互动、心理偏好测试或娱乐性调查,具有轻松有趣的特点,同时也可反映群体偏好和决策倾向。...
-
AI生成简历数据集
AI生成简历数据集 数据来源:互联网公开数据 标签:AI生成,简历,多样性,测试数据,职业发展,技能分析,教育背景,工作经验,地理位置 数据概述: 本数据集包含由Gemini...
-
美国国家科学基金会自然语言处理活跃奖项数据集
美国国家科学基金会自然语言处理活跃奖项数据集 数据来源:互联网公开数据 标签:自然语言处理,NSF,科研资助,项目申请,技术趋势,学术研究,资金分配 数据概述:...
-
ACL论文集摘要数据集2016-2018
ACL论文集摘要数据集2016-2018 数据来源:互联网公开数据 标签:ACL,论文摘要,自然语言处理,EMNLP,学术研究 数据概述: 本数据集收录了ACL Anthology中EMNLP会议2016年至2018年的已接受论文摘要。数据集中的摘要信息从arXiv中提取,如适用。数据由acl-anthology...
-
拉马衍那史诗图像数据集
拉马衍那史诗图像数据集 数据来源:互联网公开数据 标签:拉马,悉多,印度神话,图像数据,图像生成,Bing图像生成器,宗教文化 数据概述: 本数据集包含与印度史诗《拉马衍那》中的主要角色——神祇拉马和女神悉多相关的图像,以及用于生成这些图像的提示语。图像由Bing图像生成器创建,涵盖了不同场景和表现形式下的拉马和悉多形象。 数据用途概述:...
-
美国Reddit政治讨论文本数据集-2024
美国Reddit政治讨论文本数据集-2024 数据来源:互联网公开数据 标签:Reddit,政治,评论,文本,情感分析,美国,社交媒体,舆情,话题,数据挖掘 数据概述: 本数据集包含来自Reddit平台上r/Politics子版块的帖子和评论文本数据,涵盖了关于美国政治的讨论。数据通过Reddit...
-
Reddit科技与科学领域缩略词数据集
Reddit科技与科学领域缩略词数据集 数据来源:互联网公开数据 标签:缩略词,科技,科学,Reddit,社交媒体,文本分析,数据挖掘,自然语言处理 数据概述:...
-
加沙冲突马克龙立场BBC评论数据集
加沙冲突马克龙立场BBC评论数据集 数据来源:互联网公开数据 标签:加沙冲突,马克龙,公众意见,社交媒体评论,情感分析,主题分析,趋势分析,NLP,伦理考量 数据概述: 本数据集包含超过1000条匿名评论,来源于BBC新闻Facebook帖子,讨论法国总统埃马纽埃尔·马克龙对加沙冲突的态度。该数据集提供了公众对这一敏感国际问题反应和情感的重要见解。...
-
-
Reddit书籍讨论热度和情感分析数据集
Reddit书籍讨论热度和情感分析数据集 数据来源:互联网公开数据 标签:Reddit,书籍,社交媒体,情感分析,用户行为,流行度,文本数据,评论分析 数据概述:...
-
英雄联盟短篇故事分析数据集
英雄联盟短篇故事分析数据集 数据来源:互联网公开数据 标签:英雄联盟,电子竞技,短篇故事,角色背景,游戏文化,故事分析,文学作品 数据概述: 本数据集收录了《英雄联盟》游戏中角色的240篇短篇故事,这些故事发布在Riot...
-
DCS世界战役产品数据集
DCS世界战役产品数据集 数据来源:互联网公开数据 标签:DCS世界,战役产品,文本分析,NLP,游戏数据,产品信息 数据概述: 本数据集包含DCS世界战役产品的原始文本数据,涵盖除价格外的所有公开信息,这些信息客户可以在DCS-...



