找到934个数据集

标签: 文本数据

过滤结果
  • 股票推特StockTwits用户情绪分析数据集-2020-2022

    2025年6月4日 30 82 75

    股票推特StockTwits用户情绪分析数据集-2020-2022 数据来源:互联网公开数据 标签:股票推特,情绪分析,社交媒体,股票市场,文本数据,情感分类,APPL,AMZN,FB,NVDA,TSLA 数据概述:...
    packageimg
  • Spotify歌曲歌词及其时间戳数据集-96万首

    2025年6月4日 30 7 2

    Spotify歌曲歌词及其时间戳数据集-96万首 数据来源:互联网公开数据 标签:Spotify,歌词,时间戳,音乐,歌曲分析,文本数据,歌词研究,音乐文本 数据概述:...
    packageimg
  • 马来语大规模文本数据集

    2025年6月1日 30 5 1

    马来语大规模文本数据集 数据来源:互联网公开数据 标签:马来语,自然语言处理,语言模型训练,文本数据,机器学习,深度学习,文本清洗 数据概述: 本数据集包含超过600万行独特的马来语文本,数据来源于多个公开数据集并经过清洗处理,确保数据的高质量和可用性。该数据集为研究人员和开发者提供了一个丰富且多样化的文本资源,适用于多种自然语言处理任务。...
    packageimg
  • 文本情感分析训练与测试数据集

    2025年6月1日 30 136 114

    文本情感分析训练与测试数据集 数据来源:互联网公开数据 标签:情感分析,文本数据,机器学习,自然语言处理,情感分类,训练集,测试集 数据概述: 本数据集包含了经过清洗和预处理的文本数据,用于构建情感分析模型。数据集被划分为训练集和测试集,分别包含特征和标签。用户可以直接使用这些数据进行情感分析模型的训练和评估,无需进行额外的数据清洗和预处理工作。...
    packageimg
  • 美联储公开市场委员会FOMC文本数据集

    2025年6月1日 30 18 14

    美联储公开市场委员会FOMC文本数据集 数据来源:互联网公开数据 标签:FOMC,美联储,货币政策,会议记录,经济分析,文本数据,经济研究,决策制定,经济预测 数据概述:...
    packageimg
  • 西班牙语文学作品数据集

    2025年6月1日 30 14 10

    西班牙语文学作品数据集 数据来源:互联网公开数据 标签:西班牙语文学,文本数据,书籍,短篇故事,语料库,语言学习,文学分析 数据概述: 本数据集包含9000多本西班牙语的书籍、短篇故事和文本,涵盖了丰富多样的文学作品。数据集旨在为西班牙语学习者、研究者和开发者提供一个高质量的文本资源,支持语言学习、文学研究和自然语言处理任务。 数据用途概述:...
    packageimg
  • 垃圾邮件识别分类训练数据集-2023-xiaoyuwan

    2025年6月1日 30 92 58

    垃圾邮件识别分类训练数据集-2023-xiaoyuwan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本数据,机器学习,训练数据,数据科学 数据概述:...
    packageimg
  • 亚马逊商品评论情感分析数据集-商品评论-用户反馈-时间未指定

    2025年6月1日 30 121 86

    亚马逊商品评论情感分析数据集-商品评论-用户反馈-时间未指定 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,用户反馈,文本数据,自然语言处理,机器学习,电商 数据概述:...
    packageimg
  • Reddit社区百万笑话文本数据集-thedevastator

    2025年6月1日 30 143 17

    Reddit社区百万笑话文本数据集-thedevastator 数据来源:互联网公开数据 标签:笑话,幽默,Reddit,文本数据,自然语言处理,机器学习,情感分析,内容生成,笑话生成,文本分类 数据概述:...
    packageimg
  • 德国新闻文章内容分类数据集-dirkbahle

    2025年6月1日 30 28 24

    德国新闻文章内容分类数据集-dirkbahle 数据来源:互联网公开数据 标签:德国新闻,新闻文章,文本分析,自然语言处理,内容分类,新闻爬取,文本数据,时事新闻 数据概述:...
    packageimg
  • 通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator

    2025年6月1日 30 7 1

    通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator 数据来源:互联网公开数据 标签:文本数据,元数据,自然语言处理,预训练,机器学习,情感分析,文本摘要,数据集,NLP 数据概述: 本数据集“The Pile...
    packageimg
  • VK社交网络社区小组墙帖和评论数据集

    2025年6月1日 30 183 89

    VK社交网络社区小组墙帖和评论数据集 数据来源:互联网公开数据 标签:VK社交网络,社区小组,墙帖,评论,文本数据,社交媒体分析,用户行为研究,情感分析 数据概述: 本数据集来源于俄罗斯社交网络VKontakte上的多个社区小组,包含墙帖及其公开评论的文本内容。数据结构清晰,每个文件名以群组标识符开头,并以文本类型结尾,例如: -...
    packageimg
  • WhatsApp应用用户在GooglePlay商店评论数据集-2015-2023

    2025年6月1日 30 42 1

    WhatsApp应用用户在GooglePlay商店评论数据集-2015-2023 数据来源:互联网公开数据 标签:WhatsApp,社交,移动应用,评论,用户反馈,情感分析,应用市场,Google Play,文本数据 数据概述: 本数据集收录了2015年至2023年期间,WhatsApp应用在Google...
    packageimg
  • Reddit足球论坛帖子与评论数据-r-Soccer-时间不限-curiel

    2025年6月1日 30 97 10

    Reddit足球论坛帖子与评论数据-r-Soccer-时间不限-curiel 数据来源:互联网公开数据 标签:足球,Reddit,社交媒体,帖子,评论,文本数据,体育,舆情分析,社区互动 数据概述:...
    packageimg
  • 俄乌战争社交媒体推文数据集65天-2022年1月1日至2022年3月6日

    2025年6月1日 30 200 137

    俄乌战争社交媒体推文数据集65天-2022年1月1日至2022年3月6日 数据来源:互联网公开数据 标签:俄乌战争,乌克兰,俄罗斯,推特,社交媒体,战争,舆情分析,时事热点,文本数据 数据概述:...
    packageimg
  • 新冠疫情全球推特讨论数据集-2020

    2025年6月1日 30 92 60

    新冠疫情全球推特讨论数据集-2020 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,舆情分析,文本数据,疫情传播,情感分析,公共卫生,国际合作 数据概述:...
    packageimg
  • 电影剧情数据集-10万部以上电影-sidhantyadav

    2025年6月1日 30 19 4

    电影剧情数据集-10万部以上电影-sidhantyadav 数据来源:互联网公开数据 标签:电影,剧情,电影分析,文本数据,文化研究,娱乐 数据概述: 本数据集包含超过10万部电影的剧情描述,存储在CSV文件中。数据集涵盖了多种类型的电影,每个记录包括电影的标题、年份和剧情描述等关键信息,为电影研究和分析提供了丰富的内容基础。 数据用途概述:...
    packageimg
  • AOSSIE有毒上下文点击诱饵分类模型训练数据集-ad6398

    2025年5月31日 30 100 48

    AOSSIE有毒上下文点击诱饵分类模型训练数据集-ad6398 数据来源:互联网公开数据 标签:AOSSIE,点击诱饵,分类模型,训练数据,文本数据,新闻网站,数据集 数据概述: 本数据集用于AOSSIE组织在GSoC'19期间训练点击诱饵分类模型。数据集包含来自多个来源的原始数据,包括Click...
    packageimg
  • Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki

    2025年5月31日 30 139 22

    Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki 数据来源:互联网公开数据 标签:Yelp,评价,情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性 数据概述:...
    packageimg
  • 网络评论中仇恨言论检测数据集-2023年-cabmarcos

    2025年5月31日 30 76 14

    网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:...
    packageimg