找到4个数据集

标签: 新闻相似度

过滤结果
  • SemEval_2022多语言新闻文章相似度数据集

    2025年12月20日 30 128 73

    数据集概述 该数据集包含2020年上半年的多语言新闻文章对,标注了地理焦点、命名实体、时间、叙事框架、整体内容、写作风格及语气共七个维度的相似度,为新闻文本相似度研究提供标注数据支持。 文件详解 数据文件(CSV格式): final_eval_data.csv:评估数据集,包含文章对语言、URL、互联网档案馆链接及GEO、ENT等七个相似度标注字段...
    packageimg
  • 多语言新闻文章相似度数据集

    2025年12月9日 30 25 5

    数据集概述 该数据集是作者早期工作的扩展版本,包含2020年上半年的新闻文章对及其相似度标注。标注涵盖地理焦点、命名实体、时间相关性、叙事模式、整体内容、写作风格、语气及框架观点共八个维度,为多语言新闻文本的相似度分析提供结构化标注数据。 文件详解 文档文件: Codebook for text similarity annotations -...
    packageimg
  • 新闻文本主题相似度判断数据集NewsTextTopicSimilarityJudgement-hoorayyliu

    2025年5月30日 30 61 40

    新闻文本主题相似度判断数据集NewsTextTopicSimilarityJudgement-hoorayyliu 数据来源:互联网公开数据 标签:文本匹配, 新闻摘要, 相似度分析, 自然语言处理, 文本分类, 对比分析, 机器学习, 数据标注 数据概述:...
    packageimg
  • 新闻文章内容相似度分析矩阵数据集-manishkumar866115

    2025年4月25日 30 46 3

    新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。...
    packageimg