-
企业邮件垃圾分类样本数据集
数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容...
-
COVID-19新闻数据集
COVID-19新闻数据集 数据来源:互联网公开数据 标签:新闻数据,COVID-19,文本分类,自然语言处理,机器学习,疫情分析,信息抽取 数据概述:...
-
问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalD...
问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalDataset-ouaillaamiri02 数据来源:互联网公开数据 标签:问答系统, 知识库构建, 内容检索, 自然语言处理, 文本分析, 信息抽取, 机器学习, 语料库 数据概述:...
-
巴西费拉迪圣安娜市官方公报文本数据集BrazilFeiradeSantanaOfficialGazetteTextDataset-anapaulagomes
巴西费拉迪圣安娜市官方公报文本数据集BrazilFeiradeSantanaOfficialGazetteTextDataset-anapaulagomes 数据来源:互联网公开数据 标签:政府公报, 文本分析, 公文, 巴西, 城市治理, 法律法规, 信息抽取, 政治 数据概述:...
-
法律文本问答数据集LegalTextQuestionAnsweringDataset-shreyasajal
法律文本问答数据集LegalTextQuestionAnsweringDataset-shreyasajal 数据来源:互联网公开数据 标签:法律文本, 问答系统, 信息抽取, 自然语言处理, 文本理解, 知识检索, 机器学习, 合同分析 数据概述:...
-
医患对话问答数据集Doctor-PatientDialogueQuestionAnsweringDataset-ahmedammar24
医患对话问答数据集Doctor-PatientDialogueQuestionAnsweringDataset-ahmedammar24 数据来源:互联网公开数据 标签:医患对话, 自然语言处理, 问答系统, 医疗健康, 文本分析, 语义理解, 信息抽取, 数据标注 数据概述:...
-
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-ddoraemon
越南法律问答数据集VietnamLegalQuestionAnsweringDataset-ddoraemon 数据来源:互联网公开数据 标签:问答系统, 法律咨询, 自然语言处理, 文本检索, 信息抽取, 语义理解, 越南语, 知识库 数据概述: 该数据集包含来自越南法律领域的问答数据,旨在促进越南语法律问答系统的开发与研究。主要特征如下:...
-
事实核查声明文本数据集Fact-checkingClaimTextDataset-ritvik916
事实核查声明文本数据集Fact-checkingClaimTextDataset-ritvik916 数据来源:互联网公开数据 标签:事实核查, 声明文本, 文本分类, 政治声明, 真伪判断, 自然语言处理, 信息抽取, 数据标注 数据概述: 该数据集包含来自事实核查网站的数据,记录了用于事实核查的声明文本。主要特征如下:...
-
越南医疗新闻文本分析数据集VietnamMedicalNewsTextAnalysisDataset-linhmaikhnh
越南医疗新闻文本分析数据集VietnamMedicalNewsTextAnalysisDataset-linhmaikhnh 数据来源:互联网公开数据 标签:医疗新闻, 文本分析, 自然语言处理, 新闻摘要, 情感分析, 信息抽取, 越南语, 数据挖掘 数据概述:...
-
英文文本主张与证据数据集TrainEnglishClaimSpanDataset-ariondas
英文文本主张与证据数据集TrainEnglishClaimSpanDataset-ariondas 数据来源:互联网公开数据 标签:自然语言处理,文本分析,证据提取,主张识别,数据集,机器学习,文本分类,信息抽取 数据概述: 该数据集包含英文文本数据,用于训练和评估文本中主张(claims)及其证据(evidence)的识别模型。主要特征如下:...
-
文本分类实体识别DBpedia数据集TextClassificationEntityRecognitionDBpediaDataset-lotuswhl
文本分类实体识别DBpedia数据集TextClassificationEntityRecognitionDBpediaDataset-lotuswhl 数据来源:互联网公开数据 标签:文本分类, 实体识别, 自然语言处理, 知识图谱, 机器学习, 文本语料, 数据集, 信息抽取 数据概述:...
-
表格转文本生成数据集GoogleTottoDataset-aishikai
表格转文本生成数据集GoogleTottoDataset-aishikai 数据来源:互联网公开数据 标签:自然语言处理,表格数据,文本生成,机器学习,数据集,信息抽取,深度学习,语义理解 数据概述: 该数据集由Google Totto项目提供,专注于表格数据向自然语言文本的转换。主要特征如下:...
-
事实核查声明真伪判断数据集FactVerificationClaimVerdictDataset-alexandraneagu101
事实核查声明真伪判断数据集FactVerificationClaimVerdictDataset-alexandraneagu101 数据来源:互联网公开数据 标签:事实核查, 自然语言处理, 声明真伪, 文本分类, 证据检索, 机器学习, 信息抽取, 知识推理 数据概述:...
-
越南问答数据集VietnameseQuestionAnsweringDataset-khinguynphan
越南问答数据集VietnameseQuestionAnsweringDataset-khinguynphan 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本检索, 信息抽取, 越南语, 语料库, 机器阅读理解, 数据集 数据概述: 该数据集包含来自越南语语料库的问答对,旨在支持越南语问答系统的开发与研究。主要特征如下:...
-
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:...
-
千言实体链接预处理数据集-kejiewang
千言实体链接预处理数据集-kejiewang 数据来源:互联网公开数据 标签:自然语言处理,实体链接,数据集,中文,文本处理,信息抽取,知识图谱,预处理 数据概述: 该数据集包含经过预处理的中文文本数据,旨在用于实体链接任务。数据的主要特征如下: 时间跨度:数据未明确标注时间范围,主要聚焦于文本内容本身。...
-
政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart
政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart 数据来源:互联网公开数据 标签:命名实体识别, 缩写识别, 文本分析, 自然语言处理, 机器学习, 政府机构, 数据标注, 语料库构建 数据概述:...
-
社交媒体灾难事件文本数据集SocialMediaDisasterEventTextDataset-thahseerck
社交媒体灾难事件文本数据集SocialMediaDisasterEventTextDataset-thahseerck 数据来源:互联网公开数据 标签:自然语言处理,文本分类,灾难事件,推特数据,机器学习,情感分析,信息抽取,数据挖掘 数据概述: 该数据集包含来自推特(Twitter)平台的文本数据,记录了与灾难事件相关的推文信息。主要特征如下:...
-
VK公司新闻文本命名实体识别数据集VKNERDataset-alexeylyamzin
VK公司新闻文本命名实体识别数据集VKNERDataset-alexeylyamzin 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,数据集,俄语,机器学习,信息抽取,语言模型 数据概述: 该数据集包含来自VK公司新闻文章的文本数据,用于命名实体识别任务。主要特征如下: 时间跨度:数据记录的时间跨度为特定年份的新闻文章。...
-
越南问答数据集VietnameseQuestionAnsweringDataset-hungnquyen
越南问答数据集VietnameseQuestionAnsweringDataset-hungnquyen 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本检索, 信息抽取, 越南语, 文本匹配, 知识库, 语料库 数据概述: 该数据集包含来自越南语问答系统的数据,记录了问题、上下文和答案信息,用于训练和评估越南语问答模型。主要特征如下:...



