-
多语言新闻文章相似度数据集
2025年12月9日 30 12 6
数据集概述 该数据集是作者早期工作的扩展版本,包含2020年上半年的新闻文章对及其相似度标注。标注涵盖地理焦点、命名实体、时间相关性、叙事模式、整体内容、写作风格、语气及框架观点共八个维度,为多语言新闻文本的相似度分析提供结构化标注数据。 文件详解 文档文件: Codebook for text similarity annotations -...
-
新闻文本主题相似度判断数据集NewsTextTopicSimilarityJudgement-hoorayyliu
2025年5月30日 30 55 4
新闻文本主题相似度判断数据集NewsTextTopicSimilarityJudgement-hoorayyliu 数据来源:互联网公开数据 标签:文本匹配, 新闻摘要, 相似度分析, 自然语言处理, 文本分类, 对比分析, 机器学习, 数据标注 数据概述:...
-
新闻文章内容相似度分析矩阵数据集-manishkumar866115
2025年4月25日 30 163 147
新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。...



