-
COVID-19实体识别数据集
2025年6月1日 30 71 55
COVID-19实体识别数据集 数据来源:互联网公开数据 标签:COVID-19,实体识别,自然语言处理,公共卫生,文本挖掘,知识图谱,信息提取 数据概述:... -
巴西新闻文章文本数据集-新闻内容分析-2024
2025年5月31日 30 202 14
巴西新闻文章文本数据集-新闻内容分析-2024 数据来源:互联网公开数据 标签:巴西,新闻,文本,自然语言处理,NLP,金融,信息提取,时事,政治,经济,社会 数据概述: 本数据集包含来自巴西联邦数字图书馆的新闻文章文本,旨在为自然语言处理(NLP)模型构建提供可靠且一致的数据源。数据集涵盖了各种主题的新闻报道,为研究人员提供了丰富的文本数据。... -
CORD-19文本清洗数据集
2025年5月31日 30 129 75
CORD-19文本清洗数据集 数据来源:互联网公开数据 标签:文本清洗,COVID-19,学术研究,自然语言处理,数据预处理,文本挖掘,信息提取 数据概述: 本数据集是对CORD-19(COVID-19 Open Research... -
医疗文档社保号码提取数据集MedicalDocumentSocialSecurityNumberExtractionDataset-chaosmvptr
2025年5月30日 30 176 158
医疗文档社保号码提取数据集MedicalDocumentSocialSecurityNumberExtractionDataset-chaosmvptr 数据来源:互联网公开数据 标签:光学字符识别, OCR, 图像处理, 社保号码, 文本识别, 数据标注, 医疗影像, 信息提取 数据概述:... -
孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni
2025年5月30日 30 2 0
孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,语言技术,孟加拉语,文本分析,信息提取 数据概述:该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要,适用于文本摘要生成和自然语言处理研究。主要特征如下:... -
文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie
2025年5月30日 30 48 45
文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,信息提取 数据概述: 该数据集包含来自多个来源的文本数据,记录了各类文本内容及其相关属性。主要特征如下:... -
金融文章处理数据集FinancialArticlesProcessedDataset-danielstegeman
2025年5月30日 30 48 20
金融文章处理数据集FinancialArticlesProcessedDataset-danielstegeman 数据来源:互联网公开数据 标签:金融,文章,数据处理,自然语言处理,数据集,文本分析,机器学习,信息提取 数据概述: 该数据集包含经过处理的金融文章数据,记录了金融领域的相关文章信息。主要特征如下:... -
新闻摘要生成数据集XLSumCSVDataset-phoenixdev
2025年5月30日 30 119 88
新闻摘要生成数据集XLSumCSVDataset-phoenixdev 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本生成,机器学习,信息提取,人工智能,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻摘要数据,记录了新闻文章及其对应的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2021年。... -
BM25文档检索与信息提取数据集BM25DocumentRetrievalandInformationExtractionDataset-dinhnhattruong
2025年5月30日 30 124 103
BM25文档检索与信息提取数据集BM25DocumentRetrievalandInformationExtractionDataset-dinhnhattruong 数据来源:互联网公开数据 标签:文档检索,信息提取,数据集,信息检索,自然语言处理,机器学习,文本挖掘,数据科学 数据概述:... -
数据2020-2021年Lentaru新闻报道数据集LentaruNewsArticlesDataset2020-2021-nmaria
2025年5月30日 30 163 79
2020-2021年Lentaru新闻报道数据集LentaruNewsArticlesDataset2020-2021-nmaria 数据来源:互联网公开数据 标签:新闻内容,数据集,文本分析,机器学习,自然语言处理,信息提取,媒体研究,趋势分析 数据概述: 该数据集包含来自 Lentaru... -
纽约市新闻数据集NYCNewsDataDataset-srishti280992
2025年5月30日 30 76 70
纽约市新闻数据集NYCNewsDataDataset-srishti280992 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,信息提取,自然语言处理,城市研究,媒体分析,社会研究 数据概述:该数据集包含来自纽约市的新闻数据,记录了纽约市各类新闻事件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。... -
商品图片信息提取数据集ProductImageInformationExtractionDataset-awnishranjan
2025年5月29日 30 97 43
商品图片信息提取数据集ProductImageInformationExtractionDataset-awnishranjan 数据来源:互联网公开数据 标签:图像识别, 文本检测, 信息提取, 商品描述, 计算机视觉, 数据标注, 实体识别, 图像分析 数据概述:... -
维基百科电影剧情数据集WikipediaMoviePlotDataset-mechallenge
2025年5月29日 30 97 57
维基百科电影剧情数据集WikipediaMoviePlotDataset-mechallenge 数据来源:互联网公开数据 标签:电影剧情,数据集,剧情分析,自然语言处理,文本挖掘,机器学习,文化研究,信息提取 数据概述: 该数据集包含来自维基百科的电影剧情数据,记录了全球范围内多部电影的剧情概要信息。主要特征如下:... -
B5-NS二阶标签数据集B5-NS2ndLabelDataset-dragonzhang
2025年5月29日 30 131 88
B5-NS二阶标签数据集B5-NS2ndLabelDataset-dragonzhang 数据来源:互联网公开数据 标签:数据集,标签分类,自然语言处理,文本分析,机器学习,深度学习,情感分析,信息提取 数据概述: 该数据集包含来自B5-NS项目的二阶标签数据,记录了文本内容的分类信息。主要特征如下: 时间跨度:数据记录的时间范围为未指定。... -
新闻分类数据集NewsClassificationsDataset-seyb1t
2025年5月29日 30 23 13
新闻分类数据集NewsClassificationsDataset-seyb1t 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息提取,分类算法,数据挖掘 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了不同类别新闻的内容和分类标签。主要特征如下:... -
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha
2025年5月29日 30 62 12
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha 数据来源:互联网公开数据 标签:新闻,尼泊尔,数据集,文本分析,自然语言处理,机器学习,信息提取,新闻分类 数据概述: 该数据集包含来自尼泊尔的新闻数据,记录了尼泊尔国内外的新闻报道和新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2014年到2020年。... -
新闻文章内容挖掘预处理数据集NewsArticleDataContentMiningPreprocessedDataset-tousifmdaminfaisal
2025年5月29日 30 195 91
新闻文章内容挖掘预处理数据集NewsArticleDataContentMiningPreprocessedDataset-tousifmdaminfaisal 数据来源:互联网公开数据 标签:新闻分析,内容挖掘,数据集,文本分析,自然语言处理,机器学习,数据预处理,信息提取 数据概述:... -
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula
2025年5月29日 30 206 152
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula 数据来源:互联网公开数据 标签:产品数据,数据清洗,机器学习,文本分析,自然语言处理,数据集,数据预处理,信息提取 数据概述: 该数据集包含经过清洗和标准化的产品数据,主要用于训练和评估产品数据清洗模型。主要特征如下:... -
科勒里奇倡议科研论文文本与标签数据集ColeridgeInitiativeUnitedTextsandLabelsDataset-anaidashaginian
2025年5月29日 30 11 0
科勒里奇倡议科研论文文本与标签数据集ColeridgeInitiativeUnitedTextsandLabelsDataset-anaidashaginian 数据来源:互联网公开数据 标签:科研论文,文本数据,自然语言处理,数据标注,学术研究,机器学习,文本分析,信息提取... -
新闻文章内容分析数据集NewsArticleContentAnalysisDataset-haianhjobs
2025年5月28日 30 33 11
新闻文章内容分析数据集NewsArticleContentAnalysisDataset-haianhjobs 数据来源:互联网公开数据 标签:新闻文章, 内容分析, 文本挖掘, 自然语言处理, 文本分类, 信息提取, 舆情分析, 数据集 数据概述:...