找到2,680个数据集

标签: 文本挖掘

过滤结果
  • LinkedIn职位招聘信息数据集-2024年

    2025年4月15日   

    LinkedIn职位招聘信息数据集-2024年 数据来源:互联网公开数据 标签:LinkedIn,招聘,职位,就业,数据分析,自然语言处理,文本挖掘,职位描述 数据概述: 本数据集来源于LinkedIn网站的职位招聘信息抓取结果,包含了多个关键字段,用于深入分析职位招聘趋势和就业市场动态。数据主要包含以下字段:...
    packageimg
  • 权力的游戏电视剧角色关系与剧情发展数据集

    2025年4月15日   

    权力的游戏电视剧角色关系与剧情发展数据集 数据来源:互联网公开数据 标签:权力的游戏,GOT,电视剧,角色关系,剧情分析,社会网络,文本挖掘,文化研究 数据概述: 本数据集包含了HBO电视剧《权力的游戏》(Game of...
    packageimg
  • 巴西新闻集团新闻文章数据集-2014-2020

    2025年4月15日   

    巴西新闻集团新闻文章数据集-2014-2020 数据来源:互联网公开数据 标签:新闻,巴西,文章,新闻集团,内容分析,文本挖掘,时事,政治,经济,体育,娱乐 数据概述: 本数据集收录了2014年至2020年期间,从巴西新闻集团(Grupo Globo)旗下网站抓取的新闻文章。 数据集包含超过1万篇文章,涵盖了不同主题和领域的新闻报道。...
    packageimg
  • 英国广播公司BBC新闻文章文本数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本数据集 数据来源:互联网公开数据 标签:新闻文章,文本数据,BBC,媒体,内容分析,自然语言处理,文本挖掘,英国 数据概述: 本数据集包含英国广播公司(BBC)发布的新闻文章文本内容。数据以CSV格式存储,原始数据为TXT格式。数据集涵盖了BBC新闻文章的标题、正文以及可能包含的发布日期、所属类别等元数据。 数据用途概述:...
    packageimg
  • 土耳其语文本分类预处理数据集

    2025年4月15日   

    土耳其语文本分类预处理数据集 数据来源:互联网公开数据 标签:文本分类,土耳其语,预处理,机器学习,自然语言处理,文本挖掘 数据概述:...
    packageimg
  • 印尼形容词情感数据集

    2025年4月15日   

    印尼形容词情感数据集 数据来源:互联网公开数据 标签:印尼语,形容词,情感分析,自然语言处理,文本挖掘,词典数据 数据概述: 本数据集包含从《大印尼语词典》(KBBI)中提取的形容词及其情感标签。数据集分为两个文件:indonesian-adjective-sentiment-raw.csv 和 indonesian-adjective-...
    packageimg
  • 进击的巨人IMDb用户评论情感分析数据集

    2025年4月15日   

    进击的巨人IMDb用户评论情感分析数据集 数据来源:互联网公开数据 标签:进击的巨人,IMDb,动漫,用户评论,情感分析,自然语言处理,文本挖掘,评论数据 数据概述: 本数据集包含2098条关于动漫《进击的巨人》(Shingeki no...
    packageimg
  • TikTok应用用户评论情感分析数据集-GooglePlayStore2024

    2025年4月15日   

    TikTok应用用户评论情感分析数据集-GooglePlayStore2024 数据来源:互联网公开数据 标签:TikTok, 用户评论, 情感分析, Google Play Store, 应用评价, 用户体验, 社交媒体, 文本挖掘, 数据分析 数据概述: 本数据集包含从 Google Play Store 收集的 100,000 条 TikTok...
    packageimg
  • Reddit搞笑版块用户互动行为分析数据集

    2025年4月15日   

    Reddit搞笑版块用户互动行为分析数据集 数据来源:互联网公开数据 标签:Reddit,社交媒体,用户行为,社区互动,搞笑,帖子分析,情感分析,文本挖掘 数据概述:...
    packageimg
  • 文学作品数字化研究书籍数据集

    2025年4月15日   

    文学作品数字化研究书籍数据集 数据来源:互联网公开数据 标签:数字图书馆,文学作品,文本分析,版权开放,文化研究,文本挖掘,语言学研究,文学史,经典文献,公共领域 数据概述: 本数据集收录了Project...
    packageimg
  • 巴西圣保罗市Foursquare用户评价情感分析数据集-2016

    2025年4月15日   

    巴西圣保罗市Foursquare用户评价情感分析数据集-2016 数据来源:互联网公开数据 标签:Foursquare, 社交媒体, 情感分析, 用户评价, 巴西, 圣保罗, 地理位置, 文本挖掘 数据概述: 本数据集包含来自Foursquare平台的巴西圣保罗市用户评价(tips)数据,用于情感分析研究。 数据集由Thais G....
    packageimg
  • 谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类

    2025年4月15日   

    谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,评论数据,谷歌应用商店,二分类,多分类 数据概述: 本数据集包含两个文件:gpreviews_2.csv 和...
    packageimg
  • TripAdvisor酒店评论情感分析数据集-穆索里山城酒店评论-时间不限

    2025年4月15日   

    TripAdvisor酒店评论情感分析数据集-穆索里山城酒店评论-时间不限 数据来源:互联网公开数据 标签:酒店评论, TripAdvisor, 情感分析, 穆索里, 旅游, 客户反馈, 文本挖掘, 评分, 住宿体验, 印度 数据概述:...
    packageimg
  • 火影忍者最后之气对话与字幕数据集

    2025年4月15日   

    火影忍者最后之气对话与字幕数据集 数据来源:互联网公开数据 标签:火影忍者,对话分析,字幕,文本挖掘,情节研究,角色分析 数据概述: 本数据集收录了《火影忍者最后之气》(又称《火影忍者:最后的气》)电视剧的所有对话文本,涵盖每一集。原始对话文本来源于Fandom Transcripts...
    packageimg
  • 推特用户情感分析数据集-社交媒体互动与情感洞察-2023年

    2025年4月15日   

    推特用户情感分析数据集-社交媒体互动与情感洞察-2023年 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,文本挖掘,自然语言处理,用户行为,情感倾向,舆情分析 数据概述:...
    packageimg
  • 多语言大型语言模型生成文本数据集1963-2021

    2025年4月15日   

    多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:...
    packageimg
  • 巴西新冠疫情推特情感分析数据集-2020

    2025年4月15日   

    巴西新冠疫情推特情感分析数据集-2020 数据来源:互联网公开数据 标签:新冠疫情,推特,情感分析,巴西,葡萄牙语,文本挖掘,舆情分析,社交媒体 数据概述: 本数据集“OPCovid-BR”包含了关于新冠疫情的推特数据,用于基于方面的巴西葡萄牙语情感分析。该数据集由600条推文组成,这些推文经过人工标注,标注了情感方面和二元极性(积极或消极)。...
    packageimg
  • 权力的游戏电视剧对话数据集

    2025年4月15日   

    权力的游戏电视剧对话数据集 数据来源:互联网公开数据 标签:权力的游戏,电视剧,对话记录,角色分析,情节发展,文本挖掘,文化研究 数据概述: 本数据集收录了《权力的游戏》电视剧的完整剧本,包含每一集的对话内容及其对应的说话者信息,以及对话所在的集数和季数。该数据集为研究《权力的游戏》的剧情发展、角色互动提供了丰富的文本资料。 数据用途概述:...
    packageimg
  • 新冠论文引用网络与PageRank评分数据集

    2025年4月15日   

    新冠论文引用网络与PageRank评分数据集 数据来源:互联网公开数据 标签:新冠,论文,引用网络,PageRank,学术研究,数据分析,图数据,科研,文本挖掘 数据概述:...
    packageimg
  • Chrome应用商店用户评价负面情感倾向分析数据集

    2025年4月15日   

    Chrome应用商店用户评价负面情感倾向分析数据集 数据来源:互联网公开数据 标签:Chrome,应用商店,用户评价,情感分析,负面情感,文本挖掘,评级不符,用户体验 数据概述: 本数据集包含了从Chrome应用商店抓取的应用用户评价数据。...
    packageimg