数据集 - 海数据

虚假新闻文本分析数据集FakeNewsTextAnalysisDataset-shwe1308

2025年5月28日

虚假新闻文本分析数据集FakeNewsTextAnalysisDataset-shwe1308 数据来源：互联网公开数据标签：虚假新闻, 文本分析, 新闻分类, 自然语言处理, 情感分析, 机器学习, 舆情分析, 数据清洗数据概述：...

ZIP

医学影像报告诊断数据集MIDRCRICORD-600-lunar123

2025年5月28日

医学影像报告诊断数据集MIDRCRICORD-600-lunar123 数据来源：互联网公开数据标签：医学影像，放射学，自然语言处理，数据集，文本分析，疾病诊断，临床研究，人工智能数据概述：该数据集来自医学影像数据资源中心（MIDRC），是RICORD-600项目的公开数据集，包含医学影像报告及其对应的诊断结果。主要特征如下：...

ZIP

新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg

2025年5月28日

新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源：互联网公开数据标签：新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注数据概述：...

ZIP

写作质量特征工程数据集-mcpenguin

2025年5月28日

写作质量特征工程数据集-mcpenguin 数据来源：互联网公开数据标签：写作质量，特征工程，自然语言处理，数据集，文本分析，机器学习，语言模型，内容评估数据概述：该数据集包含了经过特征工程处理的文本数据，旨在用于评估和预测文本的写作质量。主要特征如下：时间跨度：数据集未明确标注时间跨度，但数据来源于不同时间段的文本内容。地理范围：...

ZIP

加拿大联邦议员提案数据集CotaParlamentarFullDataset-mayconbatestin

2025年5月28日

加拿大联邦议员提案数据集CotaParlamentarFullDataset-mayconbatestin 数据来源：互联网公开数据标签：政治分析，立法提案，数据集，公共管理，文本分析，机器学习，加拿大政治，政府透明数据概述：该数据集包含来自加拿大联邦议会的议员提案数据，记录了议员提交的各类提案和议案的详细信息。主要特征如下：...

ZIP

NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview

2025年5月28日

NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源：互联网公开数据标签：自然语言处理，NLP，数据集，文本分析，机器翻译，情感分析，信息抽取，文本分类数据概述：该数据集由NIT项目提供，包含了多种自然语言处理任务的文本数据。主要特征如下：...

ZIP

印地语-英语平行语料库数据集-harshityadavjnu

2025年5月28日

印地语-英语平行语料库数据集-harshityadavjnu 数据来源：互联网公开数据标签：机器翻译，自然语言处理，印地语，英语，语料库，语言学，文本分析，跨语言数据概述：该数据集包含印地语和英语的平行文本数据，旨在用于机器翻译、跨语言信息检索等任务。主要特征如下：时间跨度：数据记录的时间跨度不明确，取决于语料库的收集时间。...

ZIP

大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202

2025年5月28日

大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，语言模型，数据拆分，文本分析，人工智能，模型训练数据概述：该数据集为大型语言模型版本三（LLM V3）的数据集，按照数据来源进行拆分，记录了不同来源的文本数据。主要特征如下：...

ZIP

灾害推文文本嵌入数据集DisasterTweetsTextEmbeddingsDataset-askaraitzhan

2025年5月28日

灾害推文文本嵌入数据集DisasterTweetsTextEmbeddingsDataset-askaraitzhan 数据来源：互联网公开数据标签：灾害管理，社交媒体，文本分析，自然语言处理，机器学习，情感分析，危机响应，社会研究数据概述：...

ZIP

学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal

2025年5月28日

学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal 数据来源：互联网公开数据标签：学术写作，数据集，自然语言处理，LLM，文本分析，教育，写作评估，机器学习数据概述：该数据集包含来自不同学生的学术写作样本，旨在用于评估和改进学生学术写作能力。主要特征如下：...

ZIP

英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon

2025年5月28日

英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon 数据来源：互联网公开数据标签：英语文档，数据集，语言学，自然语言处理，机器学习，文本分析，教育，学术研究数据概述：...

ZIP

DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99

2025年5月28日

DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源：互联网公开数据标签：文本摘要，数据集，自然语言处理，机器翻译，深度学习，文本分析，语言模型，信息检索数据概述：该数据集包含来自DRCAT（Dynamic Relation-based Content Adaptation...

ZIP

标题twitch平台玩口袋妖怪红聊天记录数据集TwitchPlayPokémonRedChatsDataset-kedarmore

2025年5月28日

标题twitch平台玩口袋妖怪红聊天记录数据集TwitchPlayPokémonRedChatsDataset-kedarmore 数据来源：互联网公开数据标签：游戏，社交媒体，数据集，聊天记录，玩家互动，机器学习，文本分析，行为研究数据概述：...

ZIP

新闻事件标题文本数据集NewsEventHeadlineTextData-keitazoumana

2025年5月28日

新闻事件标题文本数据集NewsEventHeadlineTextData-keitazoumana 数据来源：互联网公开数据标签：新闻文本, 文本分析, 自然语言处理, 事件检测, 情感分析, 标题生成, 数据挖掘, 机器学习数据概述：该数据集包含来自新闻媒体的标题文本数据，记录了新闻报道的标题信息。主要特征如下：...

ZIP

阿拉伯诗人诗歌作品数据集-adhamdiaa

2025年5月28日

阿拉伯诗人诗歌作品数据集-adhamdiaa 数据来源：互联网公开数据标签：诗歌，阿拉伯文化，文学，数据集，自然语言处理，文本分析，情感分析，文化研究数据概述：该数据集包含了来自多个阿拉伯诗人的诗歌作品，旨在为研究阿拉伯文学和文化提供数据支持。主要特征如下：时间跨度：数据涵盖了从古典时期到现代的阿拉伯诗歌。地理范围：...

ZIP

社交网络节点嵌入测试数据集SocialNetworkNodeEmbeddingTestData-yangz0ey

2025年5月28日

社交网络节点嵌入测试数据集SocialNetworkNodeEmbeddingTestData-yangz0ey 数据来源：互联网公开数据标签：社交网络, 节点嵌入, 图神经网络, 机器学习, 文本分析, 数据挖掘, 相似度计算, 社区发现数据概述：该数据集包含来自社交网络的数据，记录了用于测试节点嵌入算法的结构化数据。主要特征如下：...

ZIP

生活技巧指导文本数据分析数据集LifeSkillGuidanceTextDataAnalysis-harshaduddu

2025年5月28日

生活技巧指导文本数据分析数据集LifeSkillGuidanceTextDataAnalysis-harshaduddu 数据来源：互联网公开数据标签：生活技巧, 指导文本, 文本分析, 自然语言处理, 标题生成, 文本摘要, 内容生成, 数据挖掘数据概述：...

ZIP

写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92

2025年5月28日

写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92 数据来源：互联网公开数据标签：文本生成, 写作评估, 自然语言处理, 机器学习, 文本分析, 创作质量, 论文写作, 语料库数据概述：...

ZIP

人工智能生成文本对比人类文本清洗数据集-dillonwongso

2025年5月28日

人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源：互联网公开数据标签：人工智能，文本生成，文本清洗，数据集，自然语言处理，机器学习，文本分析，对比研究数据概述：该数据集包含来自不同来源的人工智能生成文本和人类编写的文本，并经过清洗处理，旨在用于比较分析。主要特征如下：...