-
新闻摘要与原文对照分析数据集NewsSummaryandArticleAnalysis-saiganeshsriram
新闻摘要与原文对照分析数据集NewsSummaryandArticleAnalysis-saiganeshsriram 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 文本分析, 信息检索, 机器翻译, 深度学习, 对比分析 数据概述:... -
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-avanishgadhikar
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-avanishgadhikar 数据来源:互联网公开数据 标签:学术论文, 文本摘要, 自然语言处理, 文本分析, 机器学习, 论文标题, 信息检索, 内容理解 数据概述:... -
能源行业电子邮件分析数据集EnergyIndustryEmailAnalysis-seminursimsek
能源行业电子邮件分析数据集EnergyIndustryEmailAnalysis-seminursimsek 数据来源:互联网公开数据 标签:电子邮件, 文本分析, Enron, 能源行业, 语料库, 词频统计, 自然语言处理, 信息检索 数据概述: 该数据集包含来自 Enron 公司内部的电子邮件数据,记录了 Enron... -
维基百科摘要数据集WikipediaSummaryDataset-pbhaskar2003
维基百科摘要数据集WikipediaSummaryDataset-pbhaskar2003 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,信息检索,文本分析,维基百科,语义理解 数据概述: 该数据集包含来自维基百科的文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
文本表示与特征提取数据集Representation-TFIDF-BoWDataset-filippoalgeri
文本表示与特征提取数据集Representation-TFIDF-BoWDataset-filippoalgeri 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,特征提取,机器学习,信息检索,文本分类,数据挖掘 数据概述: 该数据集专注于文本表示与特征提取技术,记录了利用TF-IDF(词频-... -
问答信息生成与意图识别数据集QuestionGenerationandIntentRecognitionDataset-kharchoufi
问答信息生成与意图识别数据集QuestionGenerationandIntentRecognitionDataset-kharchoufi 数据来源:互联网公开数据 标签:问答生成, 意图识别, 自然语言处理, 文本挖掘, 数据标注, 语义理解, 信息检索, 机器学习 数据概述:... -
越南语问答题数据集VietnameseQuestionAnsweringDataset-dinhnhattruong
越南语问答题数据集VietnameseQuestionAnsweringDataset-dinhnhattruong 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 信息检索, 语义分析, 机器阅读理解, 语料库 数据概述:... -
引用提交数据集CiteSubmissionDataset-zhenghaijuan
引用提交数据集CiteSubmissionDataset-zhenghaijuan 数据来源:互联网公开数据 标签:学术研究,引用分析,数据集,文献管理,信息检索,科研评估,数据挖掘,学术出版 数据概述: 该数据集包含来自学术出版和引用提交系统的数据,记录了学术论文的引用和提交相关信息。主要特征如下:... -
文档分类数据集PhanLoaiVanBanDataset-beosup
文档分类数据集PhanLoaiVanBanDataset-beosup 数据来源:互联网公开数据 标签:文档分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,文本处理 数据概述: 该数据集包含来自多个来源的文档数据,记录了不同类型的文本内容及其分类标签。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
生物医学BERT模型COVID-19文本嵌入数据集BioBERT-COVIDEmbeddingsDataset-sourojit
生物医学BERT模型COVID-19文本嵌入数据集BioBERT-COVIDEmbeddingsDataset-sourojit 数据来源:互联网公开数据 标签:生物医学,自然语言处理,COVID-19,文本嵌入,深度学习,机器学习,BERT模型,信息检索 数据概述:... -
维基百科文章摘要数据集WikipediaArticleSummarizationDataset-nguyentuannguyen
维基百科文章摘要数据集WikipediaArticleSummarizationDataset-nguyentuannguyen 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,深度学习,信息检索,文本分析,语言模型 数据概述: 该数据集包含来自维基百科的文章及其对应的摘要。主要特征如下:... -
越南新闻数据集VietnewsDataset-anhcuongtran
越南新闻数据集VietnewsDataset-anhcuongtran 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,媒体研究,越南文化,信息检索 数据概述:该数据集包含来自越南新闻网站的数据,记录了越南媒体发布的新闻文章,适用于新闻分析、文本挖掘和机器学习等任务。主要特征如下:... -
搜索查询相关性评估数据集SearchQueryRelevanceAssessmentDataset-pipmos
搜索查询相关性评估数据集SearchQueryRelevanceAssessmentDataset-pipmos 数据来源:互联网公开数据 标签:搜索,查询,相关性,文本匹配,信息检索,推荐系统,数据挖掘,机器学习 数据概述:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-maverickss26
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-maverickss26 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 摘要生成, 文本分类, 信息检索, 机器学习, 语料库 数据概述: 该数据集包含来自新闻网站的摘要数据,记录了新闻标题与对应正文的简要描述。主要特征如下:... -
科技论文摘要关键词分析数据集SciencePaperAbstractKeywordAnalysisDataset-dooozo
科技论文摘要关键词分析数据集SciencePaperAbstractKeywordAnalysisDataset-dooozo 数据来源:互联网公开数据 标签:科技论文, 摘要分析, 关键词提取, 自然语言处理, 学术研究, 文本挖掘, 信息检索, 行业应用 数据概述:... -
新闻文章标题发布时间数据集NewsArticleHeadlinePublishDate-shubhamalpha
新闻文章标题发布时间数据集NewsArticleHeadlinePublishDate-shubhamalpha 数据来源:互联网公开数据 标签:新闻, 标题, 时间序列, 文本分析, 数据挖掘, 自然语言处理, 舆情分析, 信息检索 数据概述: 该数据集包含来自ABC新闻的数据,记录了新闻文章的发布日期和标题文本。主要特征如下:... -
越南问答语料库数据集VietnameseQuestionAnsweringCorpus-thowoo
越南问答语料库数据集VietnameseQuestionAnsweringCorpus-thowoo 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 语料库, 信息检索, 文本匹配, 越南语, 语义分析 数据概述: 该数据集包含从互联网收集的越南语问答语料,主要用于训练和评估越南语问答系统。主要特征如下:... -
越南语问答数据集VietnameseQuestionAnsweringDataset-ictworld
越南语问答数据集VietnameseQuestionAnsweringDataset-ictworld 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 信息检索, 知识图谱, 机器阅读, 数据集 数据概述: 该数据集包含来自越南语语料库的问答对,旨在用于训练和评估问答系统。主要特征如下:... -
编程问答知识库数据集ProgrammingQ-AKnowledgeBase-amithsbhat
编程问答知识库数据集ProgrammingQ-AKnowledgeBase-amithsbhat 数据来源:互联网公开数据 标签:编程问答, 知识库, 自然语言处理, 文本生成, 问答系统, 信息检索, 机器学习, 语料库 数据概述: 该数据集包含编程相关的问答对,记录了各种编程问题及其对应的解答。主要特征如下:... -
真假答案检测数据集DetectAnswerisTrueorFalseDataset-elemam
真假答案检测数据集DetectAnswerisTrueorFalseDataset-elemam 数据来源:互联网公开数据 标签:数据集,自然语言处理,机器学习,问答系统,文本分析,逻辑推理,验证系统,信息检索 数据概述: 该数据集包含来自多个来源的问答数据,用于检测答案的真假性。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...