-
文本分类IAB类别标注数据集TextClassificationIABCategoryDataset-payne18
文本分类IAB类别标注数据集TextClassificationIABCategoryDataset-payne18 数据来源:互联网公开数据 标签:文本分类, IAB分类, 语料库, 自然语言处理, 机器学习, 类别预测, 文本标注, 语料分析 数据概述:... -
自然语言处理Word2Vec模型文章标题数据集NaturalLanguageProcessingWord2VecModelArticleTitles-al...
自然语言处理Word2Vec模型文章标题数据集NaturalLanguageProcessingWord2VecModelArticleTitles-alisamalakhova 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 词嵌入, Word2Vec, Gensim, 机器学习, 文本挖掘, 语料库 数据概述:... -
圣经文本行内容数据集BibleTextLineContent-vincentbutterfield
圣经文本行内容数据集BibleTextLineContent-vincentbutterfield 数据来源:互联网公开数据 标签:圣经, 文本分析, 宗教, 经典, 自然语言处理, 文本挖掘, 语料库, 文本行 数据概述: 该数据集包含来自圣经文本的数据,记录了圣经不同章节的文本行内容。主要特征如下:... -
越南语用户意图识别数据集VietnameseUserIntentRecognitionDataset-daominhkhanh
越南语用户意图识别数据集VietnameseUserIntentRecognitionDataset-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 文本分类, 越南语, 机器学习, 情感分析, 数据标注, 语料库 数据概述:... -
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399
波斯语文本情感分析数据集PersianTextSentimentAnalysisDataset-anila1191399 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 波斯语, 文本分类, 情绪识别, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含波斯语文本数据,用于情感分析任务。主要特征如下:... -
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29 数据来源:互联网公开数据 标签:语音识别, 文本分析, 语音转录, 文本标注, 自然语言处理, 数据挖掘, 语料库, 文本校对 数据概述: 该数据集包含语音转录文本数据,记录了从语音文件中提取的文本内容。主要特征如下:... -
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya
项目管理实践标准文本分析数据集ProjectManagementPracticeStandardTextAnalysisDataset-maaouiabergaya 数据来源:互联网公开数据 标签:项目管理, 文本分析, 实践标准, PMI, 知识管理, 语料库, 自然语言处理, 文本挖掘 数据概述:... -
-
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:... -
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran
错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,语料库,错误标注,机器学习,语言技术,文本分析,数据挖掘 数据概述:该数据集包含来自泰米尔语的错误标注语料,记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下:... -
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:... -
尼泊尔新闻文章摘要数据集-adarsh203
尼泊尔新闻文章摘要数据集-adarsh203 数据来源:互联网公开数据 标签:新闻文章,摘要,尼泊尔,自然语言处理,文本分析,机器学习,文本摘要,语料库 数据概述: 该数据集包含了尼泊尔新闻文章及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于文章的发布时间。 地理范围:数据主要涵盖尼泊尔地区的新闻报道。... -
数据5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01
5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01 数据来源:互联网公开数据 标签:语料库,句法分析,依存句法,数据集,自然语言处理,人工智能,语言学,计算机科学... -
乌尔都语文本词频统计数据集-乌尔都语文本语料库
乌尔都语文本词频统计数据集-乌尔都语文本语料库 数据来源:互联网公开数据 标签:乌尔都语,文本分析,自然语言处理,词频统计,语料库,语言学,N-gram 数据概述: 本数据集基于在线报纸和书籍的抓取构建的乌尔都语语料库,包含了不同长度的N-gram及其对应的出现频率。数据文件包括:... -
英语语言文本数据集LanguageDataDataset-danruan
英语语言文本数据集LanguageDataDataset-danruan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言学,机器学习,文本挖掘,英语,语料库 数据概述: 该数据集包含来自多种来源的英语文本数据,记录了不同类型的英语文本内容。主要特征如下:... -
文化遗产文本情感分析数据集-raghadsaeed
文化遗产文本情感分析数据集-raghadsaeed 数据来源:互联网公开数据 标签:文化遗产,文本分析,情感分析,自然语言处理,机器学习,文化研究,语料库,情感标注 数据概述:该数据集包含来自互联网的文化遗产相关文本,主要用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期和不同来源的文化遗产相关文本。... -
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:... -
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:... -
达里贾语开放数据集DarijaOpenDataset-youneselbouknify
达里贾语开放数据集DarijaOpenDataset-youneselbouknify 数据来源:互联网公开数据 标签:达里贾语,语言数据,自然语言处理,数据集,语料库,人工智能,机器学习,语言学 数据概述:该数据集包含来自不同来源的达里贾语(摩洛哥阿拉伯语方言)文本数据,记录了日常对话,新闻报道,社交媒体帖子等多种类型的文本内容。主要特征如下:... -
路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9
路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9 数据来源:互联网公开数据 标签:新闻文本,文本分类,机器学习,自然语言处理,数据集,信息检索,语料库,路透社 数据概述: 该数据集包含来自路透社的新闻文章,主要用于文本分类任务。主要特征如下:...