找到17个数据集

分类: 互联网数据 标签: 多语言文本

过滤结果
  • 联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge

    2025年5月30日 30 190 2

    联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge 数据来源:互联网公开数据 标签:联合国,演讲,数据集,文本分析,自然语言处理,政治研究,国际关系,多语言文本 数据概述: 该数据集包含来自联合国大会的演讲记录,经过处理后适用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:...
    packageimg
  • 俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh

    2025年5月29日 30 65 58

    俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:...
    packageimg
  • 多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat

    2025年5月28日 30 196 99

    多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,多语言文本,字幕数据,机器学习,文本分类,情感分析,数据集,人工智能 数据概述:...
    packageimg
  • 多语言数据集Multy-LangDatasets-embarkiomar

    2025年5月19日 30 133 117

    多语言数据集Multy-LangDatasets-embarkiomar 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分类,语言模型,人工智能,计算机科学 数据概述: 该数据集包含来自多个语言的数据,记录了不同语言之间的文本对齐和文本分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16

    2025年5月18日 30 123 74

    卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16 数据来源:互联网公开数据 标签:多语言,卡纳达语,英语,数据集,自然语言处理,机器翻译,语言学研究,文本分析 数据概述: 该数据集包含卡纳达语与英语的多语言文本数据,记录了两种语言之间的文本对齐信息。主要特征如下:...
    packageimg
  • 欧盟议会文本标注数据集EUParliamentTextAnnotationDataset-julianschelb

    2025年4月29日 30 173 92

    欧盟议会文本标注数据集EUParliamentTextAnnotationDataset-julianschelb 数据来源:互联网公开数据 标签:文本标注, 命名实体识别, 欧盟议会, 多语言文本, 政治文本分析, 自然语言处理, 机器学习, 文本分类 数据概述: 该数据集包含来自欧洲议会(European...
    packageimg
  • 多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013

    2025年4月29日 30 173 79

    多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013 数据来源:互联网公开数据 标签:文本识别,多语言,语言分类,自然语言处理,机器翻译,文本分析,语料库,印度语 数据概述: 该数据集包含来自多种印度语言的文本片段,旨在用于语言识别任务。主要特征如下:...
    packageimg
  • 维基多语言文本分类数据集-2018

    2025年4月26日 30 60 15

    维基多语言文本分类数据集-2018 数据来源:互联网公开数据 标签:文本分类,多语言,自然语言处理,机器学习,语言识别,维基百科,NLP,数据集 数据概述:...
    packageimg
  • 大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

    2025年4月25日 30 114 56

    大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源:互联网公开数据 标签:语言模型,机器学习,自然语言处理,深度学习,人工智能,文本生成,文本分析,大数据 数据概述: 该数据集包含用于训练大型语言模型(LLM)的文本数据,特别适用于JAX框架下的LLaMA 13B模型。主要特征如下:...
    packageimg
  • 自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365

    2025年4月25日 30 47 40

    自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,机器学习,文本分析,人工智能,语言模型,语义理解 数据概述: 该数据集包含来自多个语言的自然语言处理数据,记录了不同语言的文本内容及其相关信息。主要特征如下:...
    packageimg
  • 自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss

    2025年4月25日 30 20 7

    自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,BERT,数据集,多语言,文本分析,机器学习,深度学习 数据概述:该数据集包含来自多个语言来源的文本数据,适用于自然语言处理中的多分类任务。主要特征如下:...
    packageimg
  • 多语言定制数据集MultilingualCustomDataset-amarendradeo

    2025年4月24日 30 70 3

    多语言定制数据集MultilingualCustomDataset-amarendradeo 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分析,语言模型,文本语料库,跨语言 数据概述: 该数据集包含多种语言的文本数据,旨在支持多语言处理任务,特别是机器翻译和语言模型训练。主要特征如下:...
    packageimg
  • 多语言标记数据集MultilangTokensDataset-pranav51286

    2025年4月23日 30 37 26

    多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:...
    packageimg
  • 印度2022州选举Twitter数据集

    2025年4月21日 30 159 152

    印度2022州选举Twitter数据集 数据来源:互联网公开数据 标签:印度选举, Twitter数据, 政治观点分析, 结果预测, 多语言文本, 数据探索 数据概述:...
    packageimg
  • 多语言印地语NLP数据集

    2025年4月15日 30 41 32

    多语言印地语NLP数据集 数据来源:互联网公开数据 标签:印地语NLP,自然语言处理,机器翻译,情感分析,命名实体识别,文本摘要,语言理解,多语言文本,新闻文章,社交媒体,对话文本 数据概述:...
    packageimg
  • 多语言大型语言模型生成文本数据集1963-2021

    2025年4月15日 30 17 14

    多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:...
    packageimg
  • 多语言文本检测与识别自然语言处理数据集

    2025年4月14日 30 178 14

    多语言文本检测与识别自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,多语言检测,语言识别,机器学习,文本分析,文化多样性,全球连接 数据概述:...
    packageimg