-
数据1000对孟加拉语到俄语翻译数据集
数据1000对孟加拉语到俄语翻译数据集 数据来源:互联网公开数据 标签:孟加拉语,俄语,翻译,语言学研究,机器翻译,语料库,双语系统,自然语言处理 数据概述:... -
罗马乌尔都语仇恨言论检测数据集
罗马乌尔都语仇恨言论检测数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,仇恨言论,社交媒体评论,数据融合,文本分析,自然语言处理 数据概述: 本数据集是由三个数据集合并而成,分别是RomanUrduDataSet、HS-RU-20和roman-Urdu-abusive-comment-... -
交互式数据分析笔记本自然语言到代码生成数据集
交互式数据分析笔记本自然语言到代码生成数据集 数据来源:互联网公开数据 标签:自然语言处理,代码生成,交互式笔记本,机器学习,数据科学 数据概述:... -
多语言对话数据集
多语言对话数据集 数据来源:互联网公开数据 标签:多语言对话, AI训练, 自然语言处理, 跨语言系统, 会话分析, 聊天机器人, 多语言支持 数据概述: 本数据集是一个用于多语言对话模型训练的资源,包含中文、英文、韩语和日语四种主要语言的对话记录。数据集涵盖了广泛的对话场景,提供了结构化和多样化的会话数据,为开发跨语言对话系统提供了坚实的基础。... -
-
十年厨艺竞技节目厨神当街剧集数据集
十年厨艺竞技节目厨神当街剧集数据集 数据来源:互联网公开数据 标签:厨艺竞技,节目分析,食材选择,自然语言处理,评委评分,剧集汇总 数据概述:... -
-
文本分类器数据集
文本分类器数据集 数据来源:互联网公开数据 标签:文本分类,语音转录,动作识别,对象识别,位置识别,机器学习,自然语言处理,数据标注 数据概述: 本数据集包含了从音频文件中提取的文本转录内容,记录了描述某一动作或过程的文字信息。数据集旨在提供用于识别动作、对象和位置的文本特征,支持训练相应的机器学习算法。 数据用途概述:... -
人工智能辅助检测论文数据集-中小学作文文本-2024
人工智能辅助检测论文数据集-中小学作文文本-2024 数据来源:互联网公开数据 标签:人工智能,检测,论文,写作,教育,机器学习,自然语言处理,ChatGPT,学术诚信 数据概述: 本数据集旨在推动关于人工智能(AI)检测写作的研究,特别关注中小学作文。... -
-
僧伽罗语新闻文章数据集
僧伽罗语新闻文章数据集 数据来源:互联网公开数据 标签:僧伽罗语,新闻,多分类,文本数据,机器学习,自然语言处理,斯里兰卡新闻,开源数据集 数据概述: 本数据集基于斯里兰卡知名新闻网站Hiru... -
推特用户对特定实体的情感分析数据集
推特用户对特定实体的情感分析数据集 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本挖掘,自然语言处理,机器学习,情感分类,实体识别 数据概述: 本数据集专注于推特数据的实体级情感分析。对于每条推文(消息)及其在其中提到的特定实体,数据集旨在确定用户对该实体表达的情感。 数据集将情感分为三个类别: 积极:推文表达了对实体的积极看法。... -
美国仇恨犯罪分类数据集1963-2021
美国仇恨犯罪分类数据集1963-2021 数据来源:互联网公开数据 标签:仇恨犯罪,分类分析,美国,时间序列,自然语言处理,预测建模 数据概述: 本数据集包含3700条来自Google Trend的CSV记录,涵盖了1963年至2021年间美国的仇恨犯罪事件。每条记录包括新闻标题、日期、地点和URL等关键信息,为研究和防范仇恨犯罪提供了宝贵的数据支持。... -
图鲁语YouTube视频评论情感分析数据集
图鲁语YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:图鲁语,YouTube,评论,情感分析,自然语言处理,文本数据,情感分类 数据概述:... -
Reddit平台热门科技子版块帖子互动数据分析数据集
Reddit平台热门科技子版块帖子互动数据分析数据集 数据来源:互联网公开数据 标签:Reddit,科技,社区,社交媒体,帖子,互动,情感分析,自然语言处理 数据概述:... -
康德著作数据集
康德著作数据集 数据来源:互联网公开数据 标签:康德,哲学,伦理学,道德学,形而上学,自然语言处理,文本分析 数据概述: 本数据集收录了伊曼努尔·康德的主要著作,涵盖了伦理学、道德学和形而上学等领域。数据集包含一个自增列和四个重要的信息列,包括著作标题、出版日期以及原始文本和清理后的文本。这些文本数据为研究康德哲学思想提供了丰富的资源。 数据用途概述:... -
-
arXiv论文摘要与嵌入向量每日更新数据集
arXiv论文摘要与嵌入向量每日更新数据集 数据来源:互联网公开数据 标签:arXiv,论文,摘要,嵌入向量,自然语言处理,机器学习,科研,学术,每日更新 数据概述: 本数据集包含每日arXiv论文的标题、摘要以及对应的嵌入向量。数据集每天更新,其中不包含周六、周日及节假日的论文。嵌入向量的计算方法详见提供的Notebook文件。... -
-
Steam游戏评论关键要素标注数据集-英语评论-2024
Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...