SportsOpi_争议性体育赛事YouTube评论公众立场数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

SportsOpi_争议性体育赛事YouTube评论公众立场数据集

数据集概述

该数据集为手工整理的YouTube评论集合（约4.3万条），聚焦6起著名争议性体育事件（如腋下击球事件、曼卡德事件等），覆盖约40年历史。通过LLM模型（Llama、Deepseek）进行立场标注（支持、反对、中立），并经微调提升精度，用于公众立场检测研究。

文件详解

标签文件:
Frank Lampard Ghost Goal Labels.xlsx: Excel格式，包含兰帕德幽灵进球事件评论的立场标签数据
Ashwin Mankading Labels.csv: CSV格式，包含阿什温曼卡德事件评论的立场标签数据
The Underarm Incident Labels.xlsx: Excel格式，包含腋下击球事件评论的立场标签数据
Luis Suarez Handball Labels.xlsx: Excel格式，包含苏亚雷斯手球事件评论的立场标签数据
Maradon Hand of God Labels.xlsx: Excel格式，包含马拉多纳上帝之手事件评论的立场标签数据
Johhny Bairstow Ashes Runout Labels.csv: CSV格式，包含贝尔斯托出局事件评论的立场标签数据
代码文件:
frank-lampard-reasoning-unslo.ipynb: Jupyter Notebook文件，兰帕德事件推理分析代码
luis-saraez-fine-tune-unsloth.ipynb: Jupyter Notebook文件，苏亚雷斯事件模型微调代码
Fine Tuning using Unlsoth script.ipynb: Jupyter Notebook文件，模型微调脚本
generate_model_answers.py: Python脚本，用于生成模型回答
文档文件:
README.md: Markdown格式，项目概述文档
Events Details.pdf: PDF格式，争议事件详情说明
Annotation Pipeline and Fine Tuning Details.pdf: PDF格式，标注流程与模型微调详情
Tables.pdf: PDF格式，研究相关表格数据
其他文件:
prompts.json: JSON格式，模型提示词文件
praise_and_criticism.jpg: JPG格式，赞扬与批评相关图片

适用场景

体育舆情研究: 分析公众对争议性体育事件的立场倾向与情感表达
自然语言处理: 用于立场检测模型训练与性能评估
体育社会学: 探究体育争议事件引发的公众参与及社会讨论特征
社交媒体分析: 研究YouTube平台上体育相关内容的用户互动模式
大语言模型应用: 验证LLM在体育领域文本标注任务中的效果与优化路径

数据与资源

15685411.zipZIP
5.30 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	5.3 MiB
最后更新	2025年12月14日
创建于	2025年12月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？