-
加泰罗尼亚语语义文本相似度基准数据集1_0_2
2025年12月9日 30 45 4
数据集概述 该数据集是用于评估加泰罗尼亚语语义文本相似度(STS)的基准语料库,包含三千余对人工标注的句子对,标注遵循SemEval挑战指南,基于0到5分的相似度评分标准,为语义相似度模型的构建与评估提供支持。 文件详解 文件名称:STS-ca_v.1.0.2.zip 文件格式:ZIP压缩包...
-
Webis标题党破解语料库2022
2025年12月9日 30 21 9
数据集概述 该数据集包含从Facebook、Reddit和Twitter爬取的五千条标题党帖子及其对应的破解内容,按训练、验证、测试集划分。破解内容分为短语型、段落型和非连续多文本型三类,曾用于SemEval-2023标题党破解任务。 文件详解 文件名称: webis-clickbait-22.zip 文件格式: ZIP压缩包 内部文件(按预设划分):...
-
社交媒体文本情感分析数据集SocialMediaTextSentimentAnalysisDatasets-azzouza2018
2025年4月29日 30 111 31
社交媒体文本情感分析数据集SocialMediaTextSentimentAnalysisDatasets-azzouza2018 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 自然语言处理, 情感标注, 语义分析, 机器学习, 文本挖掘 数据概述:...
-
情感分析英语文本数据集SentimentAnalysisEnglishTextDataset-fwgalde
2025年4月29日 30 113 74
情感分析英语文本数据集SentimentAnalysisEnglishTextDataset-fwgalde 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 英语, 自然语言处理, 多标签分类, 情感标注, SemEval 数据概述: 该数据集包含来自SemEval 2024 Task...
-
社交媒体情绪分析英语推文数据集-SemEval2018
2025年4月15日 30 189 12
社交媒体情绪分析英语推文数据集-SemEval2018 数据来源:互联网公开数据 标签:推文,情感分析,情绪识别,自然语言处理,文本挖掘,社交媒体,英语,SemEval,NLP 数据概述: 本数据集源自SemEval-2018 Task...



