-
研究信息检索与科学数据集RissDataset-ResearchInformationRetrievalandScienceDataset-chahine...
研究信息检索与科学数据集RissDataset-ResearchInformationRetrievalandScienceDataset-chahinebendjeddou 数据来源:互联网公开数据 标签:信息检索,科学研究,数据集,学术论文,机器学习,数据分析,学术资源,知识图谱 数据概述:... -
项目DOI记录数据集ProjectDOIRecordDataset-matheualves
项目DOI记录数据集ProjectDOIRecordDataset-matheualves 数据来源:互联网公开数据 标签:DOI,项目管理,数据集,学术研究,数字标识符,科研管理,信息检索,学术出版 数据概述: 该数据集包含来自多个学术项目和研究成果的DOI(数字对象标识符)记录,记录了各类学术项目的唯一标识信息。主要特征如下:... -
灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3
灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:... -
垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha
垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha 数据来源:互联网公开数据 标签:垃圾邮件,情感分析,数据集,文本分类,自然语言处理,机器学习,文本挖掘,信息检索 数据概述: 该数据集包含了电子邮件数据,用于垃圾邮件检测和情感分析任务。主要特征如下:... -
项目文件数据集-justingrima
项目文件数据集-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文档处理,数据挖掘,文本分析,信息检索,版本控制 数据概述: 该数据集包含了一系列项目文件的相关数据,记录了项目中各种类型文件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了项目文件的创建,修改和版本控制时间。... -
用户知识图谱数据集Yu-KTDataset-ayu2anqi
用户知识图谱数据集Yu-KTDataset-ayu2anqi 数据来源:互联网公开数据 标签:知识图谱,用户行为,数据集,机器学习,数据挖掘,信息检索,人工智能,社交网络 数据概述: 该数据集包含来自社交网络平台或用户行为记录的知识图谱数据,记录了用户在平台上的交互行为,信息偏好及社交关系。主要特征如下:... -
网页链接与描述数据集-fan1dy
网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。... -
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips 数据来源:互联网公开数据 标签:自然语言处理,文本增强,数据集,机器学习,深度学习,文本挖掘,语言模型,信息检索 数据概述:... -
BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika
BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻媒体,数据集,文本分析,自然语言处理,信息检索,机器学习,新闻分类,数据分析 数据概述:该数据集包含来自BBC新闻导航系统的数据,记录了新闻文章的详细信息。主要特征如下:... -
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge 数据来源:互联网公开数据 标签:阿拉伯语,文本摘要,数据集,自然语言处理,机器学习,语言学,信息检索,翻译 数据概述: 该数据集包含来自多个来源的阿拉伯语文本数据,旨在用于文本摘要任务的评估和研究。主要特征如下:... -
文档关键词提取数据集Keywords-in-DocumentsDataset-hachemsfarecotrek
文档关键词提取数据集Keywords-in-DocumentsDataset-hachemsfarecotrek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,关键词提取,机器学习,信息检索,文本挖掘,数据科学 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档及其对应的关键词信息。主要特征如下:... -
电子邮件意图识别数据集-nikhilhestabit
电子邮件意图识别数据集-nikhilhestabit 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,电子邮件,意图识别,机器学习,情感分析,信息检索 数据概述: 该数据集包含来自电子邮件的数据,旨在用于电子邮件意图识别任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了多种不同时间段的电子邮件。... -
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806 数据来源:互联网公开数据 标签:机器阅读理解,文档检索,数据集,自然语言处理,信息检索,深度学习,文本匹配,问答系统 数据概述: 该数据集由微软发布,旨在促进机器阅读理解和文档检索领域的研究。数据集的核心是查询-... -
主题建模数据集TopicModelingDataset-quangvinhtrnh
主题建模数据集TopicModelingDataset-quangvinhtrnh 数据来源:互联网公开数据 标签:主题建模,数据集,自然语言处理,文本分析,机器学习,数据挖掘,信息检索,文本挖掘 数据概述: 该数据集专注于主题建模任务,包含来自多个来源的文本数据,用于分析文本内容中的潜在主题。主要特征如下:... -
数据2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu
2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu 数据来源:互联网公开数据 标签:文本检索,COVID-19,数据集,信息检索,自然语言处理,机器学习,数据挖掘,公共卫生 数据概述:... -
僧伽罗语新闻标题数据集-nawarathnadeshan
僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。... -
虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98
虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分析,信息检索,事实核查,新闻传播 数据概述: 该数据集包含用于虚假新闻检测的文本数据,记录了真实新闻和虚假新闻的文本内容。主要特征如下: 时间跨度:... -
新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem
新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem 数据来源:互联网公开数据 标签:新闻,文章分类,数据集,文本分析,机器学习,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的文章数据,记录了不同类别的新闻文章内容及其分类标签。主要特征如下:... -
新闻文本分类数据集-priyabratapanda
新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。... -
新闻数据集NewsDataOneDataset-sammyke
新闻数据集NewsDataOneDataset-sammyke 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,信息检索,自然语言处理,机器学习,数据挖掘,新闻媒体 数据概述: 该数据集包含来自多个新闻媒体平台的数据,记录了各类新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...