找到63个数据集

标签: 语言研究

过滤结果
  • 达里جة语句子数据集DarijaSentencesDataset-atif10

    2025年4月24日   

    达里جة语句子数据集DarijaSentencesDataset-atif10 数据来源:互联网公开数据 标签:自然语言处理,语言数据集,文本分类,情感分析,机器学习,人工智能,语言研究,非洲语言 数据概述: 该数据集包含来自摩洛哥达里جة语的真实句子数据,记录了该语言的日常用语和表达。主要特征如下:...
    packageimg
  • 印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2

    2025年4月23日   

    印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:...
    packageimg
  • 孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir

    2025年4月23日   

    孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir 数据来源:互联网公开数据 标签:语言学,词汇,数据集,文本分析,自然语言处理,语言研究,机器学习,教育 数据概述: 该数据集包含来自孟加拉语词汇库的数据,记录了孟加拉语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 英法语言对比数据集EnglishandFrenchLanguageComparisonDataset-jayantiprasad

    2025年4月23日   

    英法语言对比数据集EnglishandFrenchLanguageComparisonDataset-jayantiprasad 数据来源:互联网公开数据 标签:语言学,数据集,对比分析,翻译,自然语言处理,机器学习,学术资源,语言研究 数据概述:该数据集包含来自互联网的英法语言对比数据,记录了英语和法语在词汇,语法,语义等方面的不同点。主要特征如下:...
    packageimg
  • 美国手势语言识别数据集WLASLCSVDataset-vsakhil

    2025年4月22日   

    美国手势语言识别数据集WLASLCSVDataset-vsakhil 数据来源:互联网公开数据 标签:手势识别,数据集,计算机视觉,人工智能,机器学习,数据挖掘,多媒体处理,语言研究 数据概述: 该数据集包含来自美国手势语言(WLASL)的视频数据,记录了不同手势的表达方式及其对应的词汇。主要特征如下:...
    packageimg
  • 全球语言词关联研究数据集2011-2018

    2025年4月22日   

    全球语言词关联研究数据集2011-2018 数据来源:互联网公开数据 标签:词关联,参与者数据,语言研究,心理学,词典构建,非商业使用 数据概述:...
    packageimg
  • 英文单词全集数据集-lennartluik

    2025年4月22日   

    英文单词全集数据集-lennartluik 数据来源:互联网公开数据 标签:英文单词,词汇库,英语学习,语言研究,自然语言处理,NLP 数据概述: 本数据集收录了《dwyl/english-...
    packageimg
  • 加拿大儿童双语学习语音语料库-2002年-rtatman

    2025年4月21日   

    加拿大儿童双语学习语音语料库-2002年-rtatman 数据来源:互联网公开数据 标签:双语学习,儿童语音,语言习得,第二语言,英语学习,加拿大,移民儿童,语言研究 数据概述:...
    packageimg
  • 泰米尔语词汇频率分析数据集-aviiciii

    2025年4月21日   

    泰米尔语词汇频率分析数据集-aviiciii 数据来源:互联网公开数据 标签:泰米尔语,词汇频率,自然语言处理,NLP,文本数据,语言研究,机器学习,数据集 数据概述:...
    packageimg
  • 英语演讲政治家数据集

    2025年4月19日   

    英语演讲政治家数据集 数据来源:互联网公开数据 标签:政治家,演讲,历史分析,文本挖掘,语言研究,政策分析,公共关系 数据概述:...
    packageimg
  • 贝罗姆语音数据集

    2025年4月18日   

    贝罗姆语音数据集 数据来源:互联网公开数据 标签:贝罗姆语,语音数据,低资源语言,语音识别,语言研究,文本转语音 数据概述:...
    packageimg
  • 日本报纸新闻数据集

    2025年4月16日   

    日本报纸新闻数据集 数据来源:互联网公开数据 标签:日本媒体,新闻文本,时间序列,多语言 corpus,新闻分析,文本挖掘,语言研究 数据概述: 本数据集收录了2005年7月至2021年10月期间日本主流报纸网站及历史报纸 dataset...
    packageimg
  • 意大利启蒙运动问答数据集

    2025年4月15日   

    意大利启蒙运动问答数据集 数据来源:互联网公开数据 标签:意大利启蒙运动,哲学,文化,问答,文本分析,语言研究,历史文献 数据概述: 本数据集包含意大利启蒙运动时期作者的文本片段。这些文本用于微调Gemma 2模型,以保留意大利启蒙运动的思想和语言特色。意大利启蒙运动起源于十八世纪下半叶,是一场涉及认识论、伦理学和政治学等领域讨论的文化和哲学运动。...
    packageimg
  • 特朗普演讲字幕数据集

    2025年4月15日   

    特朗普演讲字幕数据集 数据来源:互联网公开数据 标签:特朗普演讲,字幕,语音识别,文本分析,心理学,语言研究,自动字幕,YouTube 数据概述:...
    packageimg
  • 每日韩语对话数据集2017-2020

    2025年4月15日   

    每日韩语对话数据集2017-2020 数据来源:互联网公开数据 标签:韩语学习,对话数据,双语对照,教育工具,语言研究,文本挖掘,自然语言处理 数据概述: 本数据集包含了2017年12月4日至2020年8月19日期间,从Naver Dictionary每日对话栏目中提取的韩语-...
    packageimg
  • 阿拉伯语词典数据集

    2025年4月15日   

    阿拉伯语词典数据集 数据来源:互联网公开数据 标签:阿拉伯语,词典,现代阿拉伯语,古典阿拉伯语,NLP,语言研究,词库应用 数据概述: 本数据集收录了两部全面的阿拉伯语词典:《现代阿拉伯语词典》(2008年,Ahmed Mukhtar...
    packageimg
  • 乌尔都-普什图双语词典数据集

    2025年4月15日   

    乌尔都-普什图双语词典数据集 数据来源:互联网公开数据 标签:乌尔都语,普什图语,双语词典,自然语言处理,机器翻译,语言研究 数据概述: 乌尔都-...
    packageimg
  • 泰语文本处理数据集

    2025年4月15日   

    泰语文本处理数据集 数据来源:互联网公开数据 标签:自然语言处理,泰语,文本分析,语料库,语言研究,机器学习,数据稀缺,创业生态,商业分析,投资趋势,行业分布 数据概述: 本数据集旨在支持泰语文本处理和自然语言处理(NLP)研究。数据集包含泰...
    packageimg
  • 星际之门-SG-1剧本语料库

    2025年4月14日   

    星际之门-SG-1剧本语料库 数据来源:互联网公开数据 标签:星际之门,SG-1,剧本,对话,电视剧,文本分析,文化研究,语言研究 数据概述: 本数据集包含了星际之门:SG-1从第一季到第六季(直到丹尼尔升天且不再为主要角色)的所有对话和指令内容。数据集覆盖了超过5年的电视剧集,为研究电视剧中的对话模式、角色互动及文化背景提供了丰富的文本材料。...
    packageimg
  • 俄罗斯街头俚语引用数据集

    2025年4月14日   

    俄罗斯街头俚语引用数据集 数据来源:互联网公开数据 标签:俄罗斯,街头俚语,引用,社会文化,语言研究,幽默 数据概述: 本数据集收录了从多个俄罗斯网站收集的“街头俚语”引用,这些引用反映了俄罗斯社会文化和语言的某些方面。数据集中的引用可能包括一些重复或相似的表达,因为它们是从不同的来源收集而来,可能存在语言的变体或不同的表达方式。 数据用途概述:...
    packageimg