-
泰米尔文字字符图像与文化研究数据集
泰米尔文字字符图像与文化研究数据集 数据来源:互联网公开数据 标签:泰米尔语,文字,字符,图像,文化,语言学,字体,视觉,教育 数据概述:... -
纽约时报填字游戏线索与答案数据集
纽约时报填字游戏线索与答案数据集 数据来源:互联网公开数据 标签:填字游戏,纽约时报,英语词汇,文化分析,语言学,历史数据,娱乐教育 数据概述:... -
Kokoro日语语音数据集-Tiny版
Kokoro日语语音数据集-Tiny版 数据来源:互联网公开数据 标签:日语,语音,音频,语音合成,LibriVox,MeCab,UniDic Lite,公共领域,有声书,语言学 数据概述:... -
全球352种语言形态标注数据集
全球352种语言形态标注数据集 数据来源:互联网公开数据 标签:语言学,形态学,词形变化,多语种,自然语言处理,Unimorph,特征标注 数据概述:... -
Reddit百万笑话语料库数据集-2020年4月1日前
Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:... -
单词流行度数据集用于单词拼图创作研究
单词流行度数据集用于单词拼图创作研究 数据来源:互联网公开数据 标签:单词流行度,单词拼图,词频分析,英语,语言学,教育研究,词汇习得 数据概述:... -
-
荷马伊利亚特文本数据集
荷马伊利亚特文本数据集 数据来源:互联网公开数据 标签:荷马,伊利亚特,双语文本,希腊语,英语,翻译,文学分析,语言学,比较文学 数据概述: 本数据集包含荷马史诗《伊利亚特》的双语文本,分别为希腊语原文和英文翻译。数据集由三个表格组成,每个表格包含分析《伊利亚特》所需的必要信息。 希腊文本表:... -
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。... -
尼泊尔语文本情感分析数据集
尼泊尔语文本情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,文本分类,自然语言处理,语言学,情感标签 数据概述: 本数据集包含了尼泊尔语的句子,并附带了情感标签。数据集旨在用于尼泊尔语文本的情感分析任务。每个句子都对应一个情感标签,用于区分句子的情感倾向。 情感标签定义如下: 1:正面情感 0:负面情感 2:中性情感 数据用途概述:... -
哈萨克族姓名数据集
哈萨克族姓名数据集 数据来源:互联网公开数据 标签:哈萨克族,姓名,文化研究,语言学,人口统计,民族学 数据概述: 本数据集收录了哈萨克族中常见的男性和女性姓名,为研究哈萨克族文化、语言和人口结构提供了宝贵的数据资源。数据包含数千个哈萨克族姓名的记录,适用于各种文化和社会科学研究。 数据用途概述:... -
多语言平行语料库释义数据集-73种语言
多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves... -
宾夕法尼亚大学语料库初步版本数据集
宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:... -
数据2021年全球常用表情符号使用频率排名数据集
数据2021年全球常用表情符号使用频率排名数据集 数据来源:互联网公开数据 标签:表情符号,emoji,社交媒体,Unicode,频率分析,数据可视化,语言学,文化交流 数据概述: 本数据集包含了2021年全球范围内最常用的表情符号(emoji)的使用频率排名信息,数据来源于Unicode联盟的Emoji... -
波萨诺瓦歌词数据集
波萨诺瓦歌词数据集 数据来源:互联网公开数据 标签:波萨诺瓦,巴西音乐,歌词,音乐分析,文化研究,语言学 数据概述: 本数据集包含超过5000首波萨诺瓦歌曲的歌词及相关信息,涵盖了波萨诺瓦音乐风格的发展历程。数据集中的每首歌曲都记录了歌曲名称、演唱者、歌词内容、作曲者、歌曲语言等关键信息,为研究波萨诺瓦音乐的文化背景和语言特征提供了丰富的资源。... -
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N.... -
自然故事语料库数据集1963-2021
自然故事语料库数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,阅读时间,语料库,低频语法构型,心理学,语言学 数据概述:... -
当代美国英语语料库数据集
当代美国英语语料库数据集 数据来源:互联网公开数据 标签:美国英语,语料库,语言学,文本分析,文学,新闻,学术,社交媒体,电影字幕,电视字幕 数据概述:... -
单词难度预测数据集
单词难度预测数据集 数据来源:互联网公开数据 标签:语言学,自然语言处理,单词难度,教育,学习辅助,文本分析,难度评估 数据概述: 本数据集来源于公开的 GitHub 项目,包含来自 I159729.csv... -
莎士比亚十四行诗菲律宾语翻译数据集
莎士比亚十四行诗菲律宾语翻译数据集 数据来源:互联网公开数据 标签:莎士比亚,十四行诗,翻译,菲律宾语,Tagalog,文本数据,文学,语言学 数据概述: 本数据集包含威廉·莎士比亚十四行诗的ASCII文本,总共有超过2,450行。原文本从Andrej Karpathy的GitHub仓库minGPT复制而来。随后,我们使用ChatGPT...