找到374个数据集

标签: 新闻

过滤结果
  • Vox今日解读播客节目文本数据集

    2025年4月14日   

    Vox今日解读播客节目文本数据集 数据来源:互联网公开数据 标签:播客,文本,新闻,时事,舆情分析,对话,VOX,Today Explained,转录 数据概述: 本数据集包含了Vox公司旗下播客节目“Today...
    packageimg
  • 纳斯达克新闻情感分析数据集

    2025年4月14日   

    纳斯达克新闻情感分析数据集 数据来源:互联网公开数据 标签:纳斯达克,新闻,情感分析,金融,市场趋势,投资决策,自然语言处理 数据概述: 本数据集来源于雅虎财经和商业内幕网(市场内幕网),收录了纳斯达克市场上热门股票的新闻报道,并通过Hugging Face的FinBERT...
    packageimg
  • 新闻分享量预测数据集-Mashable新闻文章特征-2年

    2025年4月14日   

    新闻分享量预测数据集-Mashable新闻文章特征-2年 数据来源:互联网公开数据 标签:新闻,社交媒体,机器学习,文本分析,分享量预测,Mashable,特征工程 数据概述: 本数据集包含Mashable新闻网站上发布的文章的相关特征,旨在用于预测新闻文章在社交媒体上的分享量。数据来源于Machine...
    packageimg
  • 比特币新闻情感分析数据集2021-2023

    2025年4月14日   

    比特币新闻情感分析数据集2021-2023 数据来源:互联网公开数据 标签:比特币,新闻,情感分析,价格波动,市场趋势,投资决策,金融分析 数据概述:...
    packageimg
  • 撒哈拉犯罪报告尼日利亚新闻数据集

    2025年4月14日   

    撒哈拉犯罪报告尼日利亚新闻数据集 数据来源:互联网公开数据 标签:犯罪报告,尼日利亚,新闻,强奸,纵火,枪击,贿赂,谋杀,盗窃 数据概述:...
    packageimg
  • Meneame新闻文章用户互动与流行度分析数据集-2021年4月

    2025年4月14日   

    Meneame新闻文章用户互动与流行度分析数据集-2021年4月 数据来源:互联网公开数据 标签:Meneame,新闻,社交媒体,用户行为,文章流行度,点击量,评论,投票,数据分析 数据概述: 本数据集收录了2021年4月期间西班牙社交新闻网站Meneame上新闻文章的用户互动数据,旨在研究文章特征与用户反馈对文章流行度的影响。...
    packageimg
  • 僧伽罗语新闻文章数据集

    2025年4月14日   

    僧伽罗语新闻文章数据集 数据来源:互联网公开数据 标签:僧伽罗语,新闻,多分类,文本数据,机器学习,自然语言处理,斯里兰卡新闻,开源数据集 数据概述: 本数据集基于斯里兰卡知名新闻网站Hiru...
    packageimg
  • 马来西亚新闻推特账户数据集

    2025年4月14日   

    马来西亚新闻推特账户数据集 数据来源:互联网公开数据 标签:马来西亚,新闻,推特,社交媒体分析,文本分析,时间序列,新闻媒体 数据概述: 本数据集包含2021年7月22日至2021年8月12日期间马来西亚4个主要新闻推特账户的推文信息,包括推文内容、推文来源、地理位置以及每个账户的粉丝数量。这四个账户分别是Berita Harian、Harian...
    packageimg
  • 俄罗斯矿业行业文本数据集2009-2023

    2025年4月14日   

    俄罗斯矿业行业文本数据集2009-2023 数据来源:互联网公开数据 标签:矿业,俄罗斯,新闻,行业报告,文本分析,自然语言处理,数据挖掘 数据概述: 本数据集收录了2009年至2023年间约9万条新闻文章、新闻稿和矿业公司公共报告的俄语文本数据。数据通过自动抓取网站内容生成,经过句法切分处理,每行包含一个句子,适用于矿业行业文本分析。 数据用途概述:...
    packageimg
  • QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题

    2025年4月14日   

    QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题 数据来源:互联网公开数据 标签:阅读理解,多选题,自然语言处理,机器学习,文本理解,问题解答,新闻,用户故事,小说,博客 数据概述:...
    packageimg
  • 孟加拉每日英语新闻文章数据集

    2025年4月14日   

    孟加拉每日英语新闻文章数据集 数据来源:互联网公开数据 标签:孟加拉,新闻,自然语言处理,文本分析,时间序列,媒体研究,信息提取 数据概述: 本数据集收录了孟加拉每日英语新闻文章,数据来源包括五个主要的孟加拉英语新闻门户:The Daily Star、The Financial Express、New Age bd、Dhaka Tribune 和...
    packageimg
  • 用于 NLP 任务的高质量金融新闻数据集

    2025年2月13日   

    此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
    packageimg
  • 主题标签新闻数据集

    2024年12月15日   

    数据名称:主题标签新闻数据集 数据说明:108774 篇新闻文章,标有 8 个主题(平衡) 数据时间:更新于 2020年 数据来源:互联网数据
    packageimg
  • NLP-THUCNews新闻文本分类数据集

    2024年11月10日   

    本数据集包含体育, 财经, 房产, 家居, 教育, 科技, 时尚, 时政, 游戏, 娱乐,每个分类6500条,总共65000条新闻数据。
    packageimg