找到63个数据集

标签: 语言研究

过滤结果
  • 罗马尼亚过渡书写系统数据集

    2025年6月1日 30 77 22

    罗马尼亚过渡书写系统数据集 数据来源:互联网公开数据 标签:过渡书写系统,罗马尼亚,历史文档,OCR,字符统计,语言研究,文档分析 数据概述:...
    packageimg
  • 数据2020年美国总统辩论数据集

    2025年6月1日 30 136 37

    数据2020年美国总统辩论数据集 数据来源:互联网公开数据 标签:美国总统辩论,2020选举,政治分析,音频录音,文本转录本,语言研究,政治科学 数据概述:...
    packageimg
  • 日语词典数据集JPNDictDataset-abhi5ingh

    2025年5月30日 30 68 36

    日语词典数据集JPNDictDataset-abhi5ingh 数据来源:互联网公开数据 标签:语言学,词典,数据集,日语学习,自然语言处理,教育,翻译,语言研究 数据概述: 该数据集包含来自日语词典的数据,记录了日语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但内容涵盖现代日语常用词汇。...
    packageimg
  • 完整词典数据集Dict-Full-v1Dataset-phong2004

    2025年5月30日 30 132 78

    完整词典数据集Dict-Full-v1Dataset-phong2004 数据来源:互联网公开数据 标签:词典,数据集,自然语言处理,词汇学,语言研究,机器学习,文本分析,教育技术 数据概述: 该数据集包含一个完整且经过整理的词典数据,记录了词汇及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围为词典的最近一次更新时间(具体年份未提供)。...
    packageimg
  • 印度手语数据集IndianSignLanguageDataset-chinmayd20

    2025年5月29日 30 85 33

    印度手语数据集IndianSignLanguageDataset-chinmayd20 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,图像处理,深度学习,人工智能,语言研究,多媒体技术 数据概述: 该数据集包含来自印度手语相关的图像和视频数据,记录了印度手语的词汇、手势和表达方式。主要特征如下:...
    packageimg
  • 印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234

    2025年5月29日 30 144 105

    印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234 数据来源:互联网公开数据 标签:印地语,数据集,语音识别,机器学习,自然语言处理,音素识别,学术资源,语言研究 数据概述:该数据集包含来自印度多所高校的印地语元音和辅音发音数据,记录了不同说话者的发音样本。主要特征如下:...
    packageimg
  • 阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune

    2025年5月29日 30 60 33

    阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,故事集,自然语言处理,机器学习,语言研究,文化遗产,文本分析 数据概述: 该数据集包含来自阿拉伯语故事文本的集合,记录了阿拉伯语故事的内容和结构。主要特征如下:...
    packageimg
  • 印度语文件数据集HindiLanguageFilesDataset-sherinkk

    2025年5月29日 30 51 14

    印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:...
    packageimg
  • 维基百科词语频率统计数据集WikiWordFrequencyDataset-sourav044

    2025年5月28日 30 18 2

    维基百科词语频率统计数据集WikiWordFrequencyDataset-sourav044 数据来源:互联网公开数据 标签:文本分析,词频统计,数据集,自然语言处理,语言研究,机器学习,词汇学,大数据 数据概述: 该数据集包含来自维基百科的文本数据,记录了维基百科中各词语的出现频率。主要特征如下:...
    packageimg
  • 法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd

    2025年5月14日 30 107 3

    法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd 数据来源:互联网公开数据 标签:语言学习,数据集,金额表达,法语,教育技术,自然语言处理,机器学习,语言研究 数据概述: 该数据集包含来自公开语料库的法语金额表达数据,记录了法语中不同金额的书面和口语表达方式。主要特征如下:...
    packageimg
  • 法语和英语双语词典数据集DictionnaireFrançais-AnglaisDataset-dossivil

    2025年4月26日 30 26 13

    法语和英语双语词典数据集DictionnaireFrançais-AnglaisDataset-dossivil 数据来源:互联网公开数据 标签:法语,英语,双语词典,语言学习,词典编纂,语言研究,翻译工具,教育资料 数据概述:该数据集包含来自互联网的法语和英语双语词典数据,记录了法语单词及其对应的英语翻译。主要特征如下:...
    packageimg
  • 西班牙语推特数据集SpanishTweetsDataset-furqanamjad

    2025年4月26日 30 167 42

    西班牙语推特数据集SpanishTweetsDataset-furqanamjad 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据集,语言研究,舆情分析 数据概述: 该数据集包含来自Twitter平台的西班牙语推文数据,记录了用户发布的内容及其相关属性。主要特征如下:...
    packageimg
  • 多语种词汇过滤数据集PolifoniaLexiconAutomaticENFilteredDataset-eiriksteira

    2025年4月26日 30 192 32

    多语种词汇过滤数据集PolifoniaLexiconAutomaticENFilteredDataset-eiriksteira 数据来源:互联网公开数据 标签:词汇学,数据集,自然语言处理,文本过滤,多语种,机器学习,语言研究,教育技术...
    packageimg
  • 英语单词学习数据集EnglishWordLearningDataset-arpitmishra28

    2025年4月26日 30 151 3

    英语单词学习数据集EnglishWordLearningDataset-arpitmishra28 数据来源:互联网公开数据 标签:英语学习,词汇,数据集,语言教育,自然语言处理,教育科技,词汇记忆,语言研究 数据概述: 该数据集包含英语单词及其相关信息,旨在为英语学习者提供词汇学习支持。主要特征如下:...
    packageimg
  • 形容词列表数据集AdjectivesListDataset-jordansiem

    2025年4月26日 30 189 157

    形容词列表数据集AdjectivesListDataset-jordansiem 数据来源:互联网公开数据 标签:词汇,语言研究,数据集,自然语言处理,词典,教育,文本分析,语言学习 数据概述:该数据集包含一个形容词的列表,记录了各种形容词的详细信息。主要特征如下: 时间跨度:数据记录的时间范围未明确,但为现代常用词汇。...
    packageimg
  • 英语与印地语混合语料数据集HinglishDataset-saahir2629

    2025年4月26日 30 54 45

    英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:...
    packageimg
  • 汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki

    2025年4月26日 30 91 20

    汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki 数据来源:互联网公开数据 标签:汉字注音,音译数据,历史文献,语言研究,数据集,汉语语言学,古籍数字化,文本分析 数据概述: 该数据集包含源自历史文献的汉字音译与注音数据,记录了汉字在不同历史时期的读音标注和音译信息。主要特征如下:...
    packageimg
  • 阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli

    2025年4月26日 30 191 86

    阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli 数据来源:互联网公开数据 标签:新闻,阿塞拜疆语,数据集,自然语言处理,文本分析,机器学习,新闻挖掘,语言研究 数据概述: 该数据集包含来自阿塞拜疆当地新闻网站Ayna AZ的新闻文章,记录了近年来的新闻内容。主要特征如下:...
    packageimg
  • 泰米尔经典千句诗数据集ThirukkuralCSVDataset-lalithkishorel

    2025年4月26日 30 143 76

    泰米尔经典千句诗数据集ThirukkuralCSVDataset-lalithkishorel 数据来源:互联网公开数据 标签:泰米尔语,古典文学,数据集,文化研究,文本分析,机器学习,语言研究,诗歌分析 数据概述: 该数据集包含来自泰米尔经典《千句诗》(Thirukkural)的文本数据,记录了这部古代诗歌集的完整内容。主要特征如下:...
    packageimg
  • 英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang

    2025年4月25日 30 164 147

    英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:...
    packageimg