-
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:... -
科学文本分类数据集ScientificTextClassificationDataset-chiragb254
科学文本分类数据集ScientificTextClassificationDataset-chiragb254 数据来源:互联网公开数据 标签:科学文本,数据集,文本分类,机器学习,自然语言处理,数据挖掘,学术研究,信息检索 数据概述:... -
数据1985年阿尔巴尼亚百科全书数据集-ashahini
1985年阿尔巴尼亚百科全书数据集-ashahini 数据来源:互联网公开数据 标签:百科全书,历史,文化,阿尔巴尼亚,数据集,语言学,社会学,人文科学,信息检索 数据概述: 该数据集包含来自1985年出版的《阿尔巴尼亚百科全书》的数据,记录了阿尔巴尼亚的历史,文化,地理,人物,事件等信息。主要特征如下:... -
文档主题模型矩阵数据集DocumentTopicModelMatrixDataset-rhythm004
文档主题模型矩阵数据集DocumentTopicModelMatrixDataset-rhythm004 数据来源:互联网公开数据 标签:主题模型,数据集,自然语言处理,文本分析,机器学习,信息检索,文本挖掘,统计建模 数据概述: 该数据集包含文档主题模型矩阵,记录了文本数据在主题模型下的表示。主要特征如下:... -
无词干提取文本数据集DatasetTanpaStemming-skripsheet
无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:... -
数据2020年6月1日维基百科特色文章数据集-gabrielaltay
2020年6月1日维基百科特色文章数据集-gabrielaltay 数据来源:互联网公开数据 标签:维基百科,特色文章,数据集,自然语言处理,文本分析,信息检索,内容挖掘,知识图谱 数据概述:该数据集包含来自维基百科的特色文章数据,记录了截至2020年6月1日的维基百科特色文章的详细信息。主要特征如下:... -
新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray
新闻杂志分类数据集NewsMagazineClassifierDataset-rushikeshhiray 数据来源:互联网公开数据 标签:新闻分类,数据集,文本挖掘,自然语言处理,机器学习,新闻媒体,信息检索,文本分析 数据概述: 该数据集包含来自多个新闻和杂志来源的文章数据,记录了不同类别新闻和杂志文章的内容信息。主要特征如下:... -
开放数据集元数据分析数据集OpenDatasetMetadataAnalysisDataset-amandaphaladi
开放数据集元数据分析数据集OpenDatasetMetadataAnalysisDataset-amandaphaladi 数据来源:互联网公开数据 标签:元数据,数据集,数据分析,数据治理,数据质量,信息检索,数据挖掘,开放数据 数据概述: 该数据集包含来自多个开放数据平台的元数据信息,用于分析和研究数据集的特征,质量和使用情况。主要特征如下:... -
印度所有学院列表数据集ListofAllIndianCollegesDataset-insolfrac
印度所有学院列表数据集ListofAllIndianCollegesDataset-insolfrac 数据来源:互联网公开数据 标签:教育,学院,数据集,高等教育,资源整理,地理分布,信息检索,统计分析 数据概述: 该数据集包含来自公开教育资源的印度所有学院的详细信息,记录了印度各地学院的全面列表。主要特征如下: 时间跨度:... -
测试查询与真实结果数据集TestQueriesGroundtruthDataset-mahnoorabbasi05
测试查询与真实结果数据集TestQueriesGroundtruthDataset-mahnoorabbasi05 数据来源:互联网公开数据 标签:查询分析,数据集,信息检索,机器学习,搜索引擎,自然语言处理,人工智能,数据科学 数据概述:该数据集包含了一系列测试查询及其真实结果,适用于信息检索,搜索引擎优化和自然语言处理等任务。主要特征如下:... -
Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17
Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述:... -
Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit
Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit 数据来源:互联网公开数据 标签:问答数据,自然语言处理,数据集,文本分析,机器学习,信息检索,知识图谱,社区互动 数据概述: 该数据集包含来自Quora平台的用户提问及回答数据,记录了平台上的问答互动内容。主要特征如下:... -
无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147
无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147 数据来源:互联网公开数据 标签:主题分析,数据集,文本挖掘,自然语言处理,文本分类,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自公开互联网资源的文本数据,记录了不使用TF-IDF方法进行主题分析的文本样本。主要特征如下:... -
灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598
灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598 数据来源:互联网公开数据 标签:灾难管理,问答系统,数据集,自然语言处理,机器学习,信息检索,灾害研究,应急响应 数据概述: 该数据集包含来自公开渠道的灾难相关信息,记录了与各类灾难相关的问答数据。主要特征如下:... -
论文摘要数据集PaperDTSDataset-nbviet
论文摘要数据集PaperDTSDataset-nbviet 数据来源:互联网公开数据 标签:论文,摘要,数据集,文本分析,自然语言处理,机器学习,学术研究,信息检索 数据概述: 该数据集包含来自Paper DTS的数据,记录了论文的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围为不详。 地理范围:数据覆盖范围不详。... -
数据2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz
2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz 数据来源:互联网公开数据 标签:事实核查,数据集,跨领域,机器学习,自然语言处理,文本分类,信息检索,可信度评估 数据概述: 该数据集源自2022年国际交叉语言评估会议(CLEF... -
PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt
PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt 数据来源:互联网公开数据 标签:PDF文件,知识提取,数据集,自然语言处理,机器学习,文本分析,信息检索,学术资源 数据概述:... -
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran
BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,自然语言处理,机器学习,数据挖掘,信息检索,人工智能 数据概述:该数据集包含来自BBC(英国广播公司)的新闻文章,主要用于新闻类别的自动分类。主要特征如下:... -
新闻文章文本数据集-nikkummishra
新闻文章文本数据集-nikkummishra 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,情感分析,信息检索,机器学习,舆情分析 数据概述: 该数据集包含来自多个来源的新闻文章文本数据,记录了各类新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为从特定年份至今。... -
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar 数据来源:互联网公开数据 标签:文档分类,自然语言处理,机器学习,数据集,环境研究,文本分析,生态旅游,信息检索 数据概述: 该数据集包含来自生态旅行领域的文档数据,记录了与生态旅游相关的各类文档的分类信息。主要特征如下:...