找到41个数据集

标签: 文章

过滤结果
  • 纽约时报文章内容分析精简版数据集-2007-2017

    2025年6月1日 30 128 97

    纽约时报文章内容分析精简版数据集-2007-2017 数据来源:互联网公开数据 标签:纽约时报,文章,新闻,文本分析,聚类,主题建模,情感分析 数据概述:...
    packageimg
  • 越南劳动报新闻文章数据集-2022年5月19日

    2025年5月31日 30 6 0

    越南劳动报新闻文章数据集-2022年5月19日 数据来源:互联网公开数据 标签:新闻,越南,劳动报,NLP,文本分析,文章,爬取数据,自然语言处理 数据概述: 本数据集抓取自越南劳动报2022年5月19日的新闻文章,未经任何数据处理。数据集包含文章的多种属性,旨在为自然语言处理(NLP)任务提供数据支持。 数据包含以下字段: URL:文章链接。...
    packageimg
  • 孟加拉语博客文章内容与互动数据集-2014年-muakherul

    2025年5月31日 30 175 39

    孟加拉语博客文章内容与互动数据集-2014年-muakherul 数据来源:互联网公开数据 标签:博客,孟加拉语,文章,社交互动,浏览量,评论,点赞,时间序列,内容分析 数据概述:...
    packageimg
  • 金融文章处理数据集FinancialArticlesProcessedDataset-danielstegeman

    2025年5月30日 30 128 100

    金融文章处理数据集FinancialArticlesProcessedDataset-danielstegeman 数据来源:互联网公开数据 标签:金融,文章,数据处理,自然语言处理,数据集,文本分析,机器学习,信息提取 数据概述: 该数据集包含经过处理的金融文章数据,记录了金融领域的相关文章信息。主要特征如下:...
    packageimg
  • 越南新闻文章数据集VNExpressArticlesDataset-trnnhtminh

    2025年5月28日 30 38 37

    越南新闻文章数据集VNExpressArticlesDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻,文章,数据集,自然语言处理,文本分析,机器学习,媒体研究,越南语 数据概述: 该数据集包含来自越南最大新闻网站之一——越南新闻(VNExpress)的文章数据,记录了该网站发布的新闻文章的详细信息。主要特征如下:...
    packageimg
  • 纽约时报文章数据集2010-2021-ghostdragons

    2025年5月19日 30 115 47

    纽约时报文章数据集2010-2021-ghostdragons 数据来源:互联网公开数据 标签:新闻,文章,文本分析,自然语言处理,数据集,舆情分析,内容挖掘,文本挖掘 数据概述:该数据集包含来自《纽约时报》(The New York Times,简称NYT)的文章数据,记录了2010年至2021年期间发布的新闻文章的详细信息。主要特征如下:...
    packageimg
  • 俄罗斯Fontanka-Ru新闻网站新闻文章数据集2021-2023-marialevchenko

    2025年5月10日 30 116 32

    俄罗斯Fontanka-Ru新闻网站新闻文章数据集2021-2023-marialevchenko 数据来源:互联网公开数据 标签:新闻,文章,俄罗斯,Fontanka.Ru,新闻网站,文本数据,舆情分析,时事,2021,2022,2023 数据概述:...
    packageimg
  • Medium平台文章数据集-用于LLM微调-2024

    2025年5月7日 30 112 106

    Medium平台文章数据集-用于LLM微调-2024 数据来源:互联网公开数据 标签:Medium,文章,文本数据,LLM,微调,自然语言处理,文本生成,摘要,问答 数据概述:...
    packageimg
  • 维基百科文章主题标签数据集

    2025年4月26日 30 93 48

    维基百科文章主题标签数据集 数据来源:互联网公开数据 标签:维基百科,文章,主题标签,自然语言处理,文本分类,信息检索 数据概述:...
    packageimg
  • Medium平台文章互动与内容分析数据集

    2025年4月25日 30 159 16

    Medium平台文章互动与内容分析数据集 数据来源:互联网公开数据 标签:Medium,文章,社交媒体,内容分析,点击量,互动,写作,作者,标签,阅读时间 数据概述:...
    packageimg
  • H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej

    2025年4月24日 30 4 0

    H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej 数据来源:互联网公开数据 标签:时尚,零售,产品,文章,数据集,文本分析,自然语言处理,推荐系统 数据概述: 该数据集包含 H&M 集团的产品文章数据,记录了 H&M 集团发布的关于服装和其他产品的文章信息。主要特征如下:...
    packageimg
  • 阿拉伯语文章数据集ArabicArticleDataset-surayhan

    2025年4月24日 30 90 17

    阿拉伯语文章数据集ArabicArticleDataset-surayhan 数据来源:互联网公开数据 标签:阿拉伯语,文章,数据集,自然语言处理,文本分析,机器学习,语言研究,数据挖掘 数据概述: 该数据集包含来自互联网的阿拉伯语文本,记录了各类阿拉伯语文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 阅读量统计数据集ReadsCountDataset-sumbalwahid

    2025年4月23日 30 198 104

    阅读量统计数据集ReadsCountDataset-sumbalwahid 数据来源:互联网公开数据 标签:阅读量,统计,数据集,新闻,文章,用户行为,数据分析,自然语言处理 数据概述:该数据集包含来自新闻网站的文章阅读量统计数据,记录了文章的阅读次数,用户行为等信息。主要特征如下:...
    packageimg
  • KDnuggets网站文章分享互动统计数据集-2013-2020年4月-tungmphung

    2025年4月23日 30 196 35

    KDnuggets网站文章分享互动统计数据集-2013-2020年4月-tungmphung 数据来源:互联网公开数据 标签:数据科学,机器学习,人工智能,大数据,数据挖掘,文章,分享,互动,统计,KDnuggets 数据概述:...
    packageimg
  • 数据2020年知名媒体平台文章数据集-kaustubh18282

    2025年4月23日 30 174 141

    2020年知名媒体平台文章数据集-kaustubh18282 数据来源:互联网公开数据 标签:Medium,文章,数据分析,新闻,科技,教育,创业,博客,阅读时间,互动量 数据概述: 本数据集包含了2020年1月至8月期间在知名Medium平台上的文章详情。数据来源包括以下知名出版物:The Startup、Mission.org、Personal...
    packageimg
  • 机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup

    2025年4月23日 30 143 11

    机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup 数据来源:互联网公开数据 标签:机器学习,数据科学,文章,博客,Medium,Analytics Vidhya,Towards Data Science,自然语言处理,深度学习,人工智能,数据挖掘,文本分析...
    packageimg
  • 印度谷歌热搜词条与文章互动数据集-时间跨度未知-kishan305

    2025年4月23日 30 133 49

    印度谷歌热搜词条与文章互动数据集-时间跨度未知-kishan305 数据来源:互联网公开数据 标签:谷歌,热搜,趋势,印度,搜索,文章,互动,关键词,数据分析,数字媒体 数据概述:...
    packageimg
  • WikiHow平台精选文章内容分析数据集-elfarouketawil

    2025年4月22日 30 149 37

    WikiHow平台精选文章内容分析数据集-elfarouketawil 数据来源:互联网公开数据 标签:WikiHow,教程,文章,内容分析,文本挖掘,自然语言处理,协作,用户行为,数据科学 数据概述: 本数据集收录了WikiHow平台上997篇精选文章,涵盖了广泛的“如何操作”主题。每篇文章在数据集中对应一条记录,包含以下六个字段:...
    packageimg
  • 社交媒体文章内容与情感分析数据集-全球热门文章-时间跨度未知-socialanimal

    2025年4月22日 30 98 21

    社交媒体文章内容与情感分析数据集-全球热门文章-时间跨度未知-socialanimal 数据来源:互联网公开数据 标签:文章,新闻,博客,社交媒体,文本分析,自然语言处理,情感分析,内容,分享,关键词,实体,全球,趋势 数据概述: 本数据集包含10,000篇来自全球热门新闻网站和博客的文章,并附带详细的元数据和自然语言处理(NLP)分析结果。...
    packageimg
  • 极客网文章详情数据集-2023-ashishjangra27

    2025年4月22日 30 96 71

    极客网文章详情数据集-2023-ashishjangra27 数据来源:互联网公开数据 标签:极客网,文章,文本清洗,推荐系统,标签分析,技术文章,编程,数据科学 数据概述: 本数据集包含从GeeksForGeeks(极客网)官方网站抓取的约50,000篇文章的详细信息。每篇文章包括以下三个关键字段: 文章名称(Article Name):文章的标题。...
    packageimg