找到79个数据集

标签: 语言技术

过滤结果
  • 孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni

    2025年5月30日 30 129 18

    孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,语言技术,孟加拉语,文本分析,信息提取 数据概述:该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要,适用于文本摘要生成和自然语言处理研究。主要特征如下:...
    packageimg
  • 英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar

    2025年5月30日 30 37 23

    英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,德语,文本翻译,深度学习,语言技术 数据概述: 该数据集来源于WMT(Workshop on Machine...
    packageimg
  • 文本分词数据集RdrSegmenterZalo数据集-thimkth

    2025年5月30日 30 48 38

    文本分词数据集RdrSegmenterZalo数据集-thimkth 数据来源:互联网公开数据 标签:文本分词,数据集,自然语言处理,机器学习,深度学习,语言技术,人工智能 数据概述:该数据集由Zalo团队提供,主要用于训练和评估文本分词模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。...
    packageimg
  • 情感分析数据集SentimentalAnalysisDataset-chandreshsingham

    2025年5月30日 30 204 35

    情感分析数据集SentimentalAnalysisDataset-chandreshsingham 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,情感识别,数据科学,语言技术 数据概述: 该数据集包含来自互联网公开来源的文本数据,记录了用户对产品、服务或内容的情感表达。主要特征如下:...
    packageimg
  • 阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002

    2025年5月29日 30 173 20

    阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语,数据集,机器学习,自然语言处理,文本分类,语言技术,翻译研究,人工智能 数据概述: 该数据集包含阿拉伯语的推广文本数据,记录了不同类型的推广内容及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围未明确,推测为近年数据。...
    packageimg
  • 乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa

    2025年5月29日 30 149 55

    乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,内容挖掘,新闻研究,语言技术 数据概述: 该数据集包含来自乌克兰的新闻文章数据,记录了乌克兰新闻媒体发布的各类新闻内容。主要特征如下:...
    packageimg
  • 文本自动纠错数据集CleanedAutoCorrectDataset-oyounis

    2025年5月28日 30 202 113

    文本自动纠错数据集CleanedAutoCorrectDataset-oyounis 数据来源:互联网公开数据 标签:文本纠错,数据集,自然语言处理,机器学习,文本分析,文本处理,语言技术,人工智能 数据概述:该数据集包含经过清洗和自动纠错处理的文本数据,适用于文本纠错和自然语言处理任务。主要特征如下:...
    packageimg
  • 孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath

    2025年5月28日 30 15 14

    孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,数据集,文本分析,机器学习,语言学,文本挖掘,语言技术 数据概述:该数据集包含来自公开来源的孟加拉语段落数据,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu

    2025年5月28日 30 76 46

    大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,机器学习,文本生成,对话系统,人工智能,语言技术 数据概述:该数据集包含用于训练大型语言模型的提示数据,记录了多种类型的对话和文本生成任务的示例。主要特征如下:...
    packageimg
  • 印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner

    2025年5月28日 30 98 1

    印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,重复检测,语言技术,印地语,文本相似度 数据概述: 该数据集包含印地语文本的重复检测数据,记录了印地语文本中的重复或改写文本对。主要特征如下:...
    packageimg
  • 手写卡纳达语数据集HandwrittenKannadaDataset-rumanabegum

    2025年5月28日 30 38 8

    手写卡纳达语数据集HandwrittenKannadaDataset-rumanabegum 数据来源:互联网公开数据 标签:手写识别,卡纳达语,数据集,图像处理,机器学习,模式识别,人工智能,语言技术 数据概述: 该数据集包含来自公开来源的手写卡纳达语字符数据,记录了手写卡纳达语字母、数字及符号的图像信息。主要特征如下:...
    packageimg
  • 阿拉伯语阅读理解数据集ArabicReadingComprehensionDataset-omniasayed

    2025年5月16日 30 187 32

    阿拉伯语阅读理解数据集ArabicReadingComprehensionDataset-omniasayed 数据来源:互联网公开数据 标签:自然语言处理,阅读理解,机器学习,阿拉伯语,文本分析,语言技术,数据集,人工智能 数据概述: 该数据集包含阿拉伯语的阅读理解数据,记录了阿拉伯语文本与相应的问题及答案。主要特征如下:...
    packageimg
  • 语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001

    2025年4月26日 30 4 0

    语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001 数据来源:互联网公开数据 标签:自然语言处理,语法纠错,数据集,机器学习,文本分析,语言技术,教育技术,人工智能 数据概述: 该数据集包含来自多种来源的文本数据,记录了包含语法错误的句子及其对应的正确句子。主要特征如下:...
    packageimg
  • 错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran

    2025年4月26日 30 46 29

    错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,语料库,错误标注,机器学习,语言技术,文本分析,数据挖掘 数据概述:该数据集包含来自泰米尔语的错误标注语料,记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下:...
    packageimg
  • 阿塞拜疆语情感分析数据集AzerbaijaniSentimentAnalysisDataset-nazimt

    2025年4月26日 30 111 24

    阿塞拜疆语情感分析数据集AzerbaijaniSentimentAnalysisDataset-nazimt 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,语言技术,多语言处理,情感挖掘 数据概述: 该数据集包含来自互联网的阿塞拜疆语文本数据,记录了不同来源的文本内容的情感倾向。主要特征如下:...
    packageimg
  • 词义消歧与词汇语义扩展数据集Dev-WSDDataset-ekanshchauhan9

    2025年4月26日 30 188 144

    词义消歧与词汇语义扩展数据集Dev-WSDDataset-ekanshchauhan9 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,词汇语义,数据集,机器学习,语义分析,人工智能,语言技术 数据概述: 该数据集专注于词义消歧与词汇语义扩展研究,记录了多个词汇在不同上下文中的语义信息。主要特征如下:...
    packageimg
  • 无词干提取文本数据集DatasetTanpaStemming-skripsheet

    2025年4月26日 30 189 53

    无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:...
    packageimg
  • 语法修正数据集GrammarCorrectionDataDataset-uwelcomem

    2025年4月26日 30 106 2

    语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源:互联网公开数据 标签:自然语言处理,语法修正,数据集,机器学习,语言模型,文本分析,人工智能,语言技术 数据概述:该数据集包含来自互联网公开来源的语法修正数据,记录了原始文本及其对应的修正文本。主要特征如下: 时间跨度:数据记录的时间范围为近年。...
    packageimg
  • 拼写校正数据集SpellingCorrectionDataset-antooo511

    2025年4月26日 30 163 48

    拼写校正数据集SpellingCorrectionDataset-antooo511 数据来源:互联网公开数据 标签:拼写校正,数据集,自然语言处理,文本分析,机器学习,语言技术,教育技术,数据挖掘 数据概述: 该数据集专注于记录和分析拼写错误的文本,包含大量带有拼写错误的句子及其对应的正确拼写版本。主要特征如下:...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-adnanzaidi

    2025年4月26日 30 127 67

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-adnanzaidi 数据来源:互联网公开数据 标签:情感分析,数据集,文本挖掘,自然语言处理,机器学习,语言技术,情感计算,多语言研究 数据概述: 该数据集包含罗马乌尔都语文本的情感标注数据,记录了罗马乌尔都语文本内容的情感倾向。主要特征如下:...
    packageimg