-
数据提取竞赛数据集DataExtractionCompetitionDataset-shirshaka
数据提取竞赛数据集DataExtractionCompetitionDataset-shirshaka 数据来源:互联网公开数据 标签:数据提取,竞赛数据,数据集,信息提取,机器学习,自然语言处理,数据挖掘,人工智能 数据概述: 该数据集来源于一次数据提取竞赛,专注于从文本、表格或其他非结构化数据中提取结构化信息。主要特征如下:... -
简历文本清洗数据集ResumeCorpusCleanedDataset-joanirudh
简历文本清洗数据集ResumeCorpusCleanedDataset-joanirudh 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本清洗,人力资源,信息提取,职业发展 数据概述: 该数据集包含经过清洗处理的简历文本数据,记录了个人简历中的关键信息。主要特征如下:... -
英语新闻文本分析数据集EnglishNewsTextAnalysisDataset-directioner
英语新闻文本分析数据集EnglishNewsTextAnalysisDataset-directioner 数据来源:互联网公开数据 标签:新闻,文本分析,数据集,自然语言处理,机器学习,语料库,数据挖掘,信息提取 数据概述: 该数据集包含来自各大新闻媒体和新闻聚合平台的英语新闻文本,记录了不同主题和类型的新闻报道。主要特征如下:... -
大型新闻语料库数据集GigawordCorpusDataset-arngowda
大型新闻语料库数据集GigawordCorpusDataset-arngowda 数据来源:互联网公开数据 标签:新闻语料,数据集,自然语言处理,文本分析,机器学习,语言模型,人工智能,信息提取 数据概述: 该数据集包含来自全球各大新闻机构的新闻报道文本,记录了海量新闻文章的全文内容。主要特征如下:... -
自然语言处理与话题建模数据集NLPTopicModellingDataset-hj5992
自然语言处理与话题建模数据集NLPTopicModellingDataset-hj5992 数据来源:互联网公开数据 标签:自然语言处理,话题建模,数据集,文本分析,机器学习,文本挖掘,语义分析,信息提取 数据概述: 该数据集包含自然语言处理领域的话题建模数据,记录了文本内容及其对应的话题标签。主要特征如下:... -
维基百科旅行模板提取数据集-dkayton
维基百科旅行模板提取数据集-dkayton 数据来源:互联网公开数据 标签:维基百科,旅行,模板,文本挖掘,自然语言处理,数据集,信息提取,知识图谱 数据概述: 该数据集包含从维基百科中提取的旅行相关模板数据,记录了旅行相关的结构化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于维基百科数据的更新。... -
维基百科操作指南数据集WikihowDataset-smsrikanthreddy
维基百科操作指南数据集WikihowDataset-smsrikanthreddy 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,文本分类,信息提取,人工智能,教育研究 数据概述:该数据集包含来自维基百科操作指南(Wikihow)网站的文章数据,记录了各类操作步骤和指南的详细信息。主要特征如下:... -
图像信息提取标注数据集ImageInformationExtractionAnnotationDataset-datadixit
图像信息提取标注数据集ImageInformationExtractionAnnotationDataset-datadixit 数据来源:互联网公开数据 标签:图像识别, 信息提取, 视觉问答, 文本标注, 机器学习, 数据集构建, 计算机视觉, 深度学习 数据概述:... -
标准新闻文本分析数据集TheStandardNewsTextAnalysisDataset-polapob
标准新闻文本分析数据集TheStandardNewsTextAnalysisDataset-polapob 数据来源:互联网公开数据 标签:新闻分析,文本挖掘,数据集,自然语言处理,机器学习,数据挖掘,信息提取,新闻研究 数据概述: 该数据集包含来自标准新闻来源的新闻文章文本数据,记录了新闻内容的详细信息。主要特征如下:... -
命名实体识别验证数据集NERCapstoneFinalValidationDataset-vibhagangolli
命名实体识别验证数据集NERCapstoneFinalValidationDataset-vibhagangolli 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,人工智能,信息提取,深度学习 数据概述:... -
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,人工智能,信息提取,文本处理,教育技术 数据概述: 该数据集包含来自维基百科“如何”类文章的文本及其对应的摘要,记录了各类操作指南和教程的详细内容和简明摘要。主要特征如下:... -
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,文本分类,语义分析,中文处理,信息提取 数据概述: 该数据集包含来自维基百科中文版的数据,经过处理和清洗,记录了维基百科中的大量中文文本内容。主要特征如下: 时间跨度:... -
社交媒体灾难信息分析推文数据集SocialMediaDisasterInformationAnalysisTweets-salmanshaikh23
社交媒体灾难信息分析推文数据集SocialMediaDisasterInformationAnalysisTweets-salmanshaikh23 数据来源:互联网公开数据 标签:社交媒体, 推文分析, 灾难信息, 文本分类, 信息提取, 自然语言处理, 机器学习, 灾害管理 数据概述:... -
文本摘要生成数据集TextSummarizationDataDataset-sriram1188
文本摘要生成数据集TextSummarizationDataDataset-sriram1188 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本生成,信息提取,深度学习,人工智能 数据概述: 该数据集包含来自互联网公开来源的文本摘要数据,记录了多种文本及其对应的摘要信息。主要特征如下:... -
学生咨询问答数据集StudentInquiryQ-ADataset-phyngyn
学生咨询问答数据集StudentInquiryQ-ADataset-phyngyn 数据来源:互联网公开数据 标签:问答系统, 学生服务, 自然语言处理, 文本分析, 教育, 知识检索, 信息提取, 情感分析 数据概述: 该数据集包含来自学生咨询服务平台上的问答记录,记录了学生提出的问题及其对应的解答。主要特征如下:... -
企业名称信息数据集CompanyNameInformationDataset-visheshsuryavanshi
企业名称信息数据集CompanyNameInformationDataset-visheshsuryavanshi 数据来源:互联网公开数据 标签:企业信息, 公司名称, 数据清洗, 文本分析, 商业数据, 实体识别, 机器学习, 信息提取 数据概述: 该数据集包含来自互联网的数据,记录了企业名称信息。主要特征如下:... -
隐私政策文本信息识别数据集PrivacyPolicyTextInformationIdentification-kumois
隐私政策文本信息识别数据集PrivacyPolicyTextInformationIdentification-kumois 数据来源:互联网公开数据 标签:隐私政策, 文本分类, 信息提取, 数据标注, 自然语言处理, 机器学习, 隐私保护, 文本挖掘 数据概述:... -
产品属性信息抽取数据集ProductAttributeInformationExtraction-shanukumawat7
产品属性信息抽取数据集ProductAttributeInformationExtraction-shanukumawat7 数据来源:互联网公开数据 标签:属性抽取, 信息提取, 商品信息, 文本分析, 图像识别, 实体识别, 数据标注, 机器学习 数据概述:... -
简历信息提取与解析数据集ResumeInformationExtractionandAnalysis-swsumo
简历信息提取与解析数据集ResumeInformationExtractionandAnalysis-swsumo 数据来源:互联网公开数据 标签:简历解析, 信息提取, 自然语言处理, 文本挖掘, 机器学习, 职业发展, 数据标注, 文本分类 数据概述:... -
日英字幕语料库数据集-2020年-onslaught
日英字幕语料库数据集-2020年-onslaught 数据来源:互联网公开数据 标签:日英翻译,字幕,机器翻译,语言处理,语料库,自然语言处理,信息提取 数据概述:...