-
孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni
2025年5月30日 30 129 18
孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,语言技术,孟加拉语,文本分析,信息提取 数据概述:该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要,适用于文本摘要生成和自然语言处理研究。主要特征如下:... -
英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar
2025年5月30日 30 37 23
英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,德语,文本翻译,深度学习,语言技术 数据概述: 该数据集来源于WMT(Workshop on Machine... -
文本分词数据集RdrSegmenterZalo数据集-thimkth
2025年5月30日 30 48 38
文本分词数据集RdrSegmenterZalo数据集-thimkth 数据来源:互联网公开数据 标签:文本分词,数据集,自然语言处理,机器学习,深度学习,语言技术,人工智能 数据概述:该数据集由Zalo团队提供,主要用于训练和评估文本分词模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。... -
情感分析数据集SentimentalAnalysisDataset-chandreshsingham
2025年5月30日 30 204 35
情感分析数据集SentimentalAnalysisDataset-chandreshsingham 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,情感识别,数据科学,语言技术 数据概述: 该数据集包含来自互联网公开来源的文本数据,记录了用户对产品、服务或内容的情感表达。主要特征如下:... -
阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002
2025年5月29日 30 173 20
阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语,数据集,机器学习,自然语言处理,文本分类,语言技术,翻译研究,人工智能 数据概述: 该数据集包含阿拉伯语的推广文本数据,记录了不同类型的推广内容及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围未明确,推测为近年数据。... -
乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa
2025年5月29日 30 149 55
乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,内容挖掘,新闻研究,语言技术 数据概述: 该数据集包含来自乌克兰的新闻文章数据,记录了乌克兰新闻媒体发布的各类新闻内容。主要特征如下:... -
文本自动纠错数据集CleanedAutoCorrectDataset-oyounis
2025年5月28日 30 202 113
文本自动纠错数据集CleanedAutoCorrectDataset-oyounis 数据来源:互联网公开数据 标签:文本纠错,数据集,自然语言处理,机器学习,文本分析,文本处理,语言技术,人工智能 数据概述:该数据集包含经过清洗和自动纠错处理的文本数据,适用于文本纠错和自然语言处理任务。主要特征如下:... -
孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath
2025年5月28日 30 15 14
孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,数据集,文本分析,机器学习,语言学,文本挖掘,语言技术 数据概述:该数据集包含来自公开来源的孟加拉语段落数据,适用于自然语言处理和机器学习任务。主要特征如下:... -
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu
2025年5月28日 30 76 46
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,机器学习,文本生成,对话系统,人工智能,语言技术 数据概述:该数据集包含用于训练大型语言模型的提示数据,记录了多种类型的对话和文本生成任务的示例。主要特征如下:... -
印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner
2025年5月28日 30 98 1
印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,重复检测,语言技术,印地语,文本相似度 数据概述: 该数据集包含印地语文本的重复检测数据,记录了印地语文本中的重复或改写文本对。主要特征如下:... -
手写卡纳达语数据集HandwrittenKannadaDataset-rumanabegum
2025年5月28日 30 38 8
手写卡纳达语数据集HandwrittenKannadaDataset-rumanabegum 数据来源:互联网公开数据 标签:手写识别,卡纳达语,数据集,图像处理,机器学习,模式识别,人工智能,语言技术 数据概述: 该数据集包含来自公开来源的手写卡纳达语字符数据,记录了手写卡纳达语字母、数字及符号的图像信息。主要特征如下:... -
阿拉伯语阅读理解数据集ArabicReadingComprehensionDataset-omniasayed
2025年5月16日 30 187 32
阿拉伯语阅读理解数据集ArabicReadingComprehensionDataset-omniasayed 数据来源:互联网公开数据 标签:自然语言处理,阅读理解,机器学习,阿拉伯语,文本分析,语言技术,数据集,人工智能 数据概述: 该数据集包含阿拉伯语的阅读理解数据,记录了阿拉伯语文本与相应的问题及答案。主要特征如下:... -
语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001
2025年4月26日 30 4 0
语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001 数据来源:互联网公开数据 标签:自然语言处理,语法纠错,数据集,机器学习,文本分析,语言技术,教育技术,人工智能 数据概述: 该数据集包含来自多种来源的文本数据,记录了包含语法错误的句子及其对应的正确句子。主要特征如下:... -
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran
2025年4月26日 30 46 29
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,语料库,错误标注,机器学习,语言技术,文本分析,数据挖掘 数据概述:该数据集包含来自泰米尔语的错误标注语料,记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下:... -
阿塞拜疆语情感分析数据集AzerbaijaniSentimentAnalysisDataset-nazimt
2025年4月26日 30 111 24
阿塞拜疆语情感分析数据集AzerbaijaniSentimentAnalysisDataset-nazimt 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,语言技术,多语言处理,情感挖掘 数据概述: 该数据集包含来自互联网的阿塞拜疆语文本数据,记录了不同来源的文本内容的情感倾向。主要特征如下:... -
词义消歧与词汇语义扩展数据集Dev-WSDDataset-ekanshchauhan9
2025年4月26日 30 188 144
词义消歧与词汇语义扩展数据集Dev-WSDDataset-ekanshchauhan9 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,词汇语义,数据集,机器学习,语义分析,人工智能,语言技术 数据概述: 该数据集专注于词义消歧与词汇语义扩展研究,记录了多个词汇在不同上下文中的语义信息。主要特征如下:... -
无词干提取文本数据集DatasetTanpaStemming-skripsheet
2025年4月26日 30 189 53
无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:... -
语法修正数据集GrammarCorrectionDataDataset-uwelcomem
2025年4月26日 30 106 2
语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源:互联网公开数据 标签:自然语言处理,语法修正,数据集,机器学习,语言模型,文本分析,人工智能,语言技术 数据概述:该数据集包含来自互联网公开来源的语法修正数据,记录了原始文本及其对应的修正文本。主要特征如下: 时间跨度:数据记录的时间范围为近年。... -
拼写校正数据集SpellingCorrectionDataset-antooo511
2025年4月26日 30 163 48
拼写校正数据集SpellingCorrectionDataset-antooo511 数据来源:互联网公开数据 标签:拼写校正,数据集,自然语言处理,文本分析,机器学习,语言技术,教育技术,数据挖掘 数据概述: 该数据集专注于记录和分析拼写错误的文本,包含大量带有拼写错误的句子及其对应的正确拼写版本。主要特征如下:... -
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-adnanzaidi
2025年4月26日 30 127 67
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-adnanzaidi 数据来源:互联网公开数据 标签:情感分析,数据集,文本挖掘,自然语言处理,机器学习,语言技术,情感计算,多语言研究 数据概述: 该数据集包含罗马乌尔都语文本的情感标注数据,记录了罗马乌尔都语文本内容的情感倾向。主要特征如下:...