-
俄罗斯高等经济学院新闻数据集HSENewsDataset-evavallistu
俄罗斯高等经济学院新闻数据集HSENewsDataset-evavallistu 数据来源:互联网公开数据 标签:新闻数据,数据集,媒体分析,文本挖掘,自然语言处理,信息提取,学术研究,新闻传播 数据概述:该数据集包含来自俄罗斯高等经济学院(HSE)的新闻数据,记录了该学院发布的各类新闻和公告。主要特征如下:... -
人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal
人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal 数据来源:互联网公开数据 标签:人工智能,文章抓取,数据清理,自然语言处理,机器学习,文本分析,信息提取,数据集 数据概述:... -
微软学习位置提及识别数据集MicrosoftLearnLocationMentionRecognitionDataset-hamdahmida
微软学习位置提及识别数据集MicrosoftLearnLocationMentionRecognitionDataset-hamdahmida 数据来源:互联网公开数据 标签:自然语言处理,文本分析,位置识别,数据集,机器学习,信息提取,地理信息,人工智能 数据概述:... -
金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021
金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021 数据来源:互联网公开数据 标签:金融,新闻,数据集,文本分析,自然语言处理,机器学习,市场研究,信息提取 数据概述: 该数据集包含来自互联网公开渠道的金融新闻数据,记录了金融领域的新闻报道和相关信息。主要特征如下:... -
命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29
命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,信息提取,语言技术,人工智能 数据概述: 该数据集包含用于命名实体识别任务的数据,记录了文本中的实体及其类别信息。主要特征如下:... -
官方标签数据集OfficialLabelDataset-nguyenvuthanhtung
官方标签数据集OfficialLabelDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:标签分类,数据集,数据标注,机器学习,自然语言处理,数据挖掘,人工智能,信息提取 数据概述: 该数据集包含来自官方渠道的标签数据,记录了各类数据项的官方标签信息。主要特征如下: 时间跨度:数据记录的时间范围从数据创建至今。... -
消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi
消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,信息提取,情感分析,语言模型,数据挖掘 数据概述: 该数据集包含来自互联网的各类消息文本数据,记录了不同类型消息的内容和分类标签。主要特征如下:... -
文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23
文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,信息提取,文本分析,隐私保护,合规性 数据概述:该数据集包含来自多个来源的文本数据,记录了文本中敏感信息的屏蔽和分类任务。主要特征如下:... -
微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves
微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,机器学习,自然语言处理,数据分析,信息提取,时间序列 数据概述: 该数据集包含来自微软公司官方新闻发布的数据,记录了微软公司自1999年至2023年间的新闻内容。主要特征如下:... -
数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino
数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino 数据来源:互联网公开数据 标签:数据分析,数据集,统计分析,机器学习,数据挖掘,信息提取,研究工具,数据科学 数据概述: 该数据集包含来自公开数据源的分析数据,记录了数据集中各变量的重要性和关联性分析结果。主要特征如下:... -
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:... -
乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz
乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz 数据来源:互联网公开数据 标签:新闻文本,文本分类,乌尔都语,数据集,自然语言处理,机器学习,语言技术,信息提取 数据概述:... -
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:... -
问答数据集涵盖广泛主题的高质量问答内容
标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据... -
新闻深度处理数据集NewsDeepProcessedDataset-mario123475
新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:... -
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa 数据来源:互联网公开数据 标签:图书评论,剧透检测,数据集,自然语言处理,文本分类,机器学习,情感分析,信息提取 数据概述: 该数据集包含来自亚马逊等平台的图书评论数据,记录了用户对图书的评论内容及其是否包含剧透的标注信息。主要特征如下:... -
网页内容与词法特征提取数据集2022年-vanshhagrawal
网页内容与词法特征提取数据集2022年-vanshhagrawal 数据来源:互联网公开数据 标签:网页内容,词法特征,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述: 该数据集包含了从互联网上提取的网页内容及其词法特征,适用于自然语言处理,文本分析和机器学习等领域的研究。主要特征如下: 时间跨度:... -
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto 数据来源:互联网公开数据 标签:文本标注,数据集,自然语言处理,机器学习,数据挖掘,语义分析,人工智能,信息提取 数据概述: 该数据集由图八公司(Figure-... -
AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii
AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii 数据来源:互联网公开数据 标签:新闻文章,数据集,科技新闻,AMD,自然语言处理,文本分析,机器学习,信息提取 数据概述: 该数据集包含来自互联网公开渠道的与AMD公司相关的新闻文章数据,记录了关于AMD公司的新闻报道和相关信息。主要特征如下:... -
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...