-
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:... -
ROCStories与故事闭合测试语料库-2011-mrriandmstique
ROCStories与故事闭合测试语料库-2011-mrriandmstique 数据来源:互联网公开数据 标签:ROCStories,故事闭合测试,常识推理,叙事结构学习,故事理解,故事生成,日常事件,常识关系,语料库 数据概述: 本数据集包含ROCStories语料库,这是一个专门为故事闭合测试(Story Cloze... -
卡纳达语评论数据集KannadaReviewDataset-kishorsinnur
卡纳达语评论数据集KannadaReviewDataset-kishorsinnur 数据来源:互联网公开数据 标签:自然语言处理,卡纳达语,数据集,文本分析,情感分析,机器学习,多语言处理,语料库 数据概述:该数据集包含来自卡纳达语互联网平台的大量用户评论,记录了用户对各种产品,服务或内容的评价信息。主要特征如下:... -
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:... -
爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan
爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan 数据来源:互联网公开数据 标签:语料库,古语,中古爱尔兰语,自然语言处理,词典,语言学,历史,文化,文本分析 数据概述: 本数据集为《爱尔兰古语与中古爱尔兰语语料库》(Corpus PalaeoHibernicum,... -
英语-印地语转换语料库数据集
英语-印地语转换语料库数据集 数据来源:互联网公开数据 标签:语料库, 语言转换, 英语, 印地语, 语言处理, 自然语言处理, 翻译模型, 音素脚本, 语言编码 数据概述:... -
COVID-19疫情研究论文多语言标注数据集-rebeccaburwei
COVID-19疫情研究论文多语言标注数据集-rebeccaburwei 数据来源:互联网公开数据 标签:COVID-19,新冠病毒,疫情,研究,论文,语言,多语言,标注,语料库,自然语言处理 数据概述:... -
英语-马拉雅拉姆语言翻译数据集-nihalthomas15
英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:... -
威尔士语词典语料库词汇及语境分析数据集-rtatman
威尔士语词典语料库词汇及语境分析数据集-rtatman 数据来源:互联网公开数据 标签:威尔士语,词典,语言学,语料库,词汇,语言分析,凯尔特语,翻译,双语,单语 数据概述:... -
索马里语文本语料库-清洗后句子数据集-hassen7
索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:... -
斯瓦希里语句子标注数据集-2023-hassen7
斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:... -
Reddit语境与主题分类语料库-linkanjarad
Reddit语境与主题分类语料库-linkanjarad 数据来源:互联网公开数据 标签:语境分类,主题分类,语料库,Reddit,文本分析,自然语言处理,情感分析 数据概述:... -
电影对话语料库第一部分-1963至2021年-ilabyu
电影对话语料库第一部分-1963至2021年-ilabyu 数据来源:互联网公开数据 标签:电影,对话,语料库,自然语言处理,语音识别,数据标注,深度学习 数据概述:... -
日本常用词形频率数据集-2021-rtatman
日本常用词形频率数据集-2021-rtatman 数据来源:互联网公开数据 标签:日语,词形,频率,语料库,词频分析,日语文本,日本语言学,词性分布,跨语言比较 数据概述:... -
斯里兰卡僧伽罗语语境抄袭检测数据集-tharukac
斯里兰卡僧伽罗语语境抄袭检测数据集-tharukac 数据来源:互联网公开数据 标签:抄袭检测,僧伽罗语,学术研究,数据集,文本分析,语料库 数据概述:... -
句子间连接数据集
句子间连接数据集 数据来源:互联网公开数据 标签:跨语言连接,多语言资源,语言对齐,语料库,NLP研究 数据概述: 本数据集记录了不同语言之间的句子配对,主要来源于Tatoeba项目。数据集包含了多种语言的句子及其对应关系,为研究和开发多语言自然语言处理任务提供了宝贵的资源。 数据用途概述:... -
殖民地历史葡萄牙语语料库1500-1936
殖民地历史葡萄牙语语料库1500-1936 数据来源:互联网公开数据 标签:历史葡萄牙语,语料库,词性标注,文学研究,语言演变,欧洲葡萄牙语,巴西葡萄牙语,时间序列 数据概述:... -
阿拉伯诗歌历史与分类数据集6世纪-现代
阿拉伯诗歌历史与分类数据集6世纪-现代 数据来源:互联网公开数据 标签:阿拉伯诗歌,文学,历史,社会,政治,文化,分类,语料库 数据概述:... -
阿尔及利亚网阿拉伯语新闻文章数据集1963-2021
阿尔及利亚网阿拉伯语新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯语新闻,自然语言处理,机器学习,语料库,情感分析,主题分类,命名实体识别 数据概述:... -