找到667个数据集

标签: 语言学

过滤结果
  • 希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray

    2025年4月25日   

    希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray 数据来源:互联网公开数据 标签:希伯来语,情感分析,文本数据,自然语言处理,机器学习,语言学,数据集,NLP 数据概述: 该数据集包含来自互联网的希伯来语文本数据,用于情感分析任务。主要特征如下: 时间跨度:...
    packageimg
  • Bootstrap100问题200题集语气变化数据集20240319-asalan

    2025年4月25日   

    Bootstrap100问题200题集语气变化数据集20240319-asalan 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,语气识别,机器学习,文本挖掘,语言学,数据分析 数据概述:该数据集包含来自Bootstrap项目的100个问题,每个问题有200个不同语气变化的题集记录,适用于语气识别和文本分析等任务。主要特征如下:...
    packageimg
  • 阿拉伯语拼写数据集SpellArabicDataset-twproject

    2025年4月25日   

    阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas

    2025年4月25日   

    社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述: 该数据集包含了来自社交媒体平台的文本数据,并标注了是否包含仇恨言论。主要特征如下:...
    packageimg
  • 阿萨姆语女声语音数据集-miralmaradiya

    2025年4月25日   

    阿萨姆语女声语音数据集-miralmaradiya 数据来源:互联网公开数据 标签:语音识别,数据集,语音合成,阿萨姆语,自然语言处理,声学模型,语言学,音频数据 数据概述:该数据集包含阿萨姆语女声的语音数据,记录了不同说话者朗读的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不确定,具体取决于数据集的构建时间。...
    packageimg
  • 罗塞塔石碑数据集RosettaSetDataset-iezepov

    2025年4月25日   

    罗塞塔石碑数据集RosettaSetDataset-iezepov 数据来源:互联网公开数据 标签:古埃及,象形文字,罗塞塔石碑,语言学,翻译,数据集,历史,文化遗产 数据概述: 该数据集包含与罗塞塔石碑相关的数据,主要记录了石碑上的三种文字(古希腊文,世俗体,象形文字)的对照信息。主要特征如下:...
    packageimg
  • 手写波斯数字识别数据集HandwrittenPersianNumeralsRecognitionDataset-kushasabzevari

    2025年4月25日   

    手写波斯数字识别数据集HandwrittenPersianNumeralsRecognitionDataset-kushasabzevari 数据来源:互联网公开数据 标签:手写识别,波斯数字,数据集,图像分析,机器学习,视觉识别,人工智能,语言学 数据概述:该数据集包含来自多个来源的手写波斯数字图像,记录了波斯数字0到9的手写样本。主要特征如下:...
    packageimg
  • 阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune

    2025年4月25日   

    阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯文化,民间故事,文本分析,自然语言处理,情感分析,语言学,文化研究,叙事学 数据概述:该数据集包含来自Raid项目收集的阿拉伯民间故事,记录了阿拉伯地区的各种民间故事和传说。主要特征如下:...
    packageimg
  • 俄罗斯诗歌数据集RussianPoetryDataset-mira318

    2025年4月25日   

    俄罗斯诗歌数据集RussianPoetryDataset-mira318 数据来源:互联网公开数据 标签:诗歌,文学,俄语,数据集,文本分析,自然语言处理,文化研究,语言学 数据概述: 该数据集包含来自俄罗斯的诗歌作品,收录了不同时期,不同作者的诗歌,旨在为研究俄罗斯文学和语言提供数据支持。主要特征如下:...
    packageimg
  • 摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany

    2025年4月25日   

    摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany 数据来源:互联网公开数据 标签:语言学,方言研究,数据集,语音识别,自然语言处理,非洲文化,机器学习,语言分析 数据概述: 该数据集包含来自摩洛哥的方言语音和文本数据,记录了摩洛哥方言的发音,词汇和语法特征。主要特征如下:...
    packageimg
  • 英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya

    2025年4月25日   

    英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,平行语料,语言学,文本分析 数据概述: 该数据集包含了英语和印地语的平行文本数据,旨在用于机器翻译模型的训练和评估。主要特征如下:...
    packageimg
  • 情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong

    2025年4月25日   

    情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong 数据来源:互联网公开数据 标签:情绪词汇,数据集,自然语言处理,文本分析,情感计算,社会心理学,机器学习,语言学 数据概述: 该数据集包含来自多个来源的情绪词汇,记录了不同词汇对应的情绪类别及其相关特征。主要特征如下:...
    packageimg
  • 阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki

    2025年4月25日   

    阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:...
    packageimg
  • 图卢维基百科数据转储2023年数据集-moreducks

    2025年4月25日   

    图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。...
    packageimg
  • 文本清理数据集CleanedTextDataset-rahulk2197

    2025年4月25日   

    文本清理数据集CleanedTextDataset-rahulk2197 数据来源:互联网公开数据 标签:文本清理,数据集,自然语言处理,文本分析,机器学习,文本挖掘,数据预处理,语言学 数据概述:该数据集包含经过清理和标准化处理的文本数据,适用于自然语言处理和文本分析。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • LIWC文本特征分析数据集LIWCFeaturesDataset-bimangiri

    2025年4月25日   

    LIWC文本特征分析数据集LIWCFeaturesDataset-bimangiri 数据来源:互联网公开数据 标签:文本分析,心理学,语言学,数据集,自然语言处理,情绪分析,情感计算,社交媒体 数据概述: 该数据集包含了使用语言调查和字数统计(LIWC)软件处理后的文本特征数据,用于分析文本中的心理,情绪和语言模式。主要特征如下: 时间跨度:...
    packageimg
  • 幽默检测数据集HumorDetectionDataset-amaanmansuri

    2025年4月25日   

    幽默检测数据集HumorDetectionDataset-amaanmansuri 数据来源:互联网公开数据 标签:幽默检测,自然语言处理,数据集,机器学习,文本分析,情感识别,人工智能,语言学 数据概述: 该数据集包含来自多个互联网来源的文本数据,记录了不同形式的幽默内容及其标签,适用于幽默检测,文本情感分析等任务。主要特征如下:...
    packageimg
  • 罗马字母转泰卢固文字符数据集RomantoTeluguCharacterConversionDataset-dushyantsingh1

    2025年4月25日   

    罗马字母转泰卢固文字符数据集RomantoTeluguCharacterConversionDataset-dushyantsingh1 数据来源:互联网公开数据 标签:语言转换,字符编码,数据集,泰卢固语,自然语言处理,文本转换,机器学习,语言学 数据概述:...
    packageimg
  • 瓦里纳尔等人情绪维度数据集Valence-Arousal-DominanceDataset-josien

    2025年4月25日   

    瓦里纳尔等人情绪维度数据集Valence-Arousal-DominanceDataset-josien 数据来源:互联网公开数据 标签:情绪分析,情感计算,数据集,心理学,语言学,文本分析,情感词典,认知科学 数据概述:...
    packageimg
  • 僧伽罗语文本情感分析数据集SinhalaTextSentimentAnalysisDataset-dalinaranga

    2025年4月25日   

    僧伽罗语文本情感分析数据集SinhalaTextSentimentAnalysisDataset-dalinaranga 数据来源:互联网公开数据 标签:情感分析,文本挖掘,僧伽罗语,自然语言处理,数据集,机器学习,语言学,舆情分析 数据概述: 该数据集包含了僧伽罗语文本数据,用于情感分析任务。主要特征如下:...
    packageimg