纽约时报文章标题与摘要数据集2010-2021-tmishinev

纽约时报文章标题与摘要数据集2010-2021-tmishinev 数据来源:互联网公开数据 标签:纽约时报,NLP,情感分析,新闻标题,摘要,文本数据,时间序列,新闻媒体 数据概述: 本数据集包含了2010年至2021年期间《纽约时报》发布的文章标题和摘要信息。数据来源于纽约时报API,提供了丰富的文本内容,是自然语言处理(NLP)和情感分析研究的理想资源。数据集主要字段包括:发布日期(pub_date,日期时间格式)、文章摘要(abstract,字符串)、文章标题(headline,字符串)、文章导语(lead_paragraph,字符串)、新闻编辑部(news_desk,字符串)、文章所属版块(section_name,字符串)、文章字数统计(word_count,整数)。

数据用途概述: 该数据集可用于多种研究和应用场景,包括但不限于:新闻标题分析、情感分析、文本摘要、主题建模、趋势分析、事件检测、新闻推荐系统等。研究人员可以利用此数据研究新闻标题的语言风格、情感倾向随时间的变化规律;开发基于新闻标题的文本分类模型;构建新闻推荐系统;分析新闻事件与社会舆论之间的关系。此外,该数据集也适用于教育和学术研究,为学习者提供真实的新闻文本数据,帮助他们理解新闻传播和文本分析的相关知识。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 112.14 MiB
最后更新 2025年5月10日
创建于 2025年5月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。