找到933个数据集

标签: 文本数据

过滤结果
  • 自然语言处理新闻真伪识别数据集

    2025年4月18日   

    自然语言处理新闻真伪识别数据集 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 虚假新闻, 真实新闻, 新闻分析, 机器学习, 文本数据 数据概述: 本数据集包含用于新闻真伪识别的文本数据,主要用于自然语言处理(NLP)相关研究。...
    packageimg
  • 印尼恐怖主义推文数据集

    2025年4月18日   

    印尼恐怖主义推文数据集 数据来源:互联网公开数据 标签:恐怖主义,印尼,社交媒体分析,文本数据,社会安全,网络舆情,事件分析 数据概述: 本数据集收录了 Twitter 平台上与恐怖主义相关的印尼语推文数据。数据通过 Twitter API v2...
    packageimg
  • IMDB电影评论数据集1963-2021

    2025年4月17日   

    IMDB电影评论数据集1963-2021 数据来源:互联网公开数据 标签:IMDB,电影评论,自然语言处理,情感分析,文本数据 数据概述:...
    packageimg
  • 孟加拉语维基百科数据集

    2025年4月17日   

    孟加拉语维基百科数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,文本挖掘,机器学习,语料库 数据概述:...
    packageimg
  • 全球知名品牌推特客户服务互动数据集

    2025年4月17日   

    全球知名品牌推特客户服务互动数据集 数据来源:互联网公开数据 标签:推特,社交媒体,客户服务,品牌,文本数据,情感分析,聊天机器人,用户互动 数据概述: 本数据集包含了从多个知名品牌官方推特账号收集的客户服务对话记录。数据集涵盖了客户的提问和品牌方客服的回复,为研究客户服务、训练人工智能聊天机器人及开发情感分析模型提供了丰富的数据基础。 数据字段包括:...
    packageimg
  • 泰卢固语新闻文本数据集-语言模型训练-合并数据集

    2025年4月17日   

    泰卢固语新闻文本数据集-语言模型训练-合并数据集 数据来源:互联网公开数据 标签:泰卢固语,新闻,文本,语言模型,自然语言处理,NLP,机器学习,语料库,文本数据 数据概述: 本数据集由原始泰卢固语新闻数据合并的训练集和测试集构成,整合了来自不同来源的泰卢固语新闻文章。数据集包含丰富的新闻文本内容,涵盖了各种主题和风格。 数据用途概述:...
    packageimg
  • 印度总理莫迪演讲数据集

    2025年4月17日   

    印度总理莫迪演讲数据集 数据来源:互联网公开数据 标签:政治演讲,印度,莫迪,政策分析,文本数据,政府发言,数据分析 数据概述: 本数据集包含了印度总理纳伦德拉·莫迪(Narendra Damodardas...
    packageimg
  • 电影评论情感分析数据集-IMDB电影评论-文本数据

    2025年4月17日   

    电影评论情感分析数据集-IMDB电影评论-文本数据 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本数据,机器学习,情感分类,IMDB,电影,评论 数据概述:...
    packageimg
  • 土耳其新闻70000数据集

    2025年4月16日   

    土耳其新闻70000数据集 数据来源:互联网公开数据 标签:土耳其新闻,新闻分类,文本数据,机器学习,自然语言处理,媒体分析,信息抽取 数据概述:...
    packageimg
  • 阿拉伯语哮喘情感分析数据集

    2025年4月16日   

    阿拉伯语哮喘情感分析数据集 数据来源:互联网公开数据 标签:哮喘,情感分析,阿拉伯语,社交媒体,健康话题,文本数据,自然语言处理 数据概述:...
    packageimg
  • 音乐作品歌词数据集-歌曲及歌词信息-55K-首歌曲

    2025年4月16日   

    音乐作品歌词数据集-歌曲及歌词信息-55K-首歌曲 数据来源:互联网公开数据 标签:歌词,歌曲,音乐,艺术家,文本数据,音乐分析,文本挖掘 数据概述:...
    packageimg
  • Twitter社交媒体情感分析数据集

    2025年4月16日   

    Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:...
    packageimg
  • Reddit百万笑话语料库数据集-2020年4月1日前

    2025年4月16日   

    Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:...
    packageimg
  • 汉字与汉语拼音转换训练数据集

    2025年4月15日   

    汉字与汉语拼音转换训练数据集 数据来源:互联网公开数据 标签:汉字,汉语拼音,文本数据,语言处理,机器学习,自然语言处理,数据转换 数据概述: 本数据集包含了多领域文本数据,包括汉字语句序列及其对应的汉语拼音序列。这些数据适用于训练汉字与汉语拼音之间的互转模型,支持多种自然语言处理任务。 数据用途概述: 该数据集适用于汉字-...
    packageimg
  • Reddit社区情感分析-帖子情感倾向数据集-2024

    2025年4月15日   

    Reddit社区情感分析-帖子情感倾向数据集-2024 数据来源:互联网公开数据 标签:情感分析, Reddit, 文本数据, 社交媒体, 自然语言处理, 情感分类, 机器学习, 文本情感, 帖子, 2024 数据概述:...
    packageimg
  • 波兰图书评论数据集

    2025年4月15日   

    波兰图书评论数据集 数据来源:互联网公开数据 标签:图书评论,波兰,用户反馈,情感分析,文本数据,自然语言处理 数据概述: 本数据集来源于波兰最大的在线图书论坛...
    packageimg
  • YouTube热门视频高赞评论数据集

    2025年4月15日   

    YouTube热门视频高赞评论数据集 数据来源:互联网公开数据 标签:YouTube,评论,高赞,社交媒体,文本数据,自然语言处理,情感分析,视频,观看量,用户互动 数据概述: 本数据集包含YouTube上观看量超过10亿次的视频的精选高赞评论。数据基于YouTube...
    packageimg
  • 艾哈迈德故事集-杰玛2-2B数据集

    2025年4月15日   

    艾哈迈德故事集-杰玛2-2B数据集 数据来源:互联网公开数据 标签:古典阿拉伯故事,指令响应格式,故事集,阿拉伯文化,文本数据,语言学习,文化研究 数据概述: 本数据集收录了以指令/响应格式呈现的古典阿拉伯故事,涵盖了从网络多个来源收集和生成的故事内容。数据集为研究阿拉伯古典文学、语言学习以及文化传承提供了宝贵资源。 数据用途概述:...
    packageimg
  • eBay商品评论情感分析数据集

    2025年4月15日   

    eBay商品评论情感分析数据集 数据来源:互联网公开数据 标签:eBay,商品评论,情感分析,文本数据,评分,机器学习,自然语言处理 数据概述: 本数据集由作者通过Python网络爬虫脚本从eBay网站抓取,旨在用于情感分析模型的构建。数据集包含两个文件:...
    packageimg
  • Reddit关系建议社区用户互动与关系动态数据集

    2025年4月15日   

    Reddit关系建议社区用户互动与关系动态数据集 数据来源:互联网公开数据 标签:Reddit,关系建议,社交媒体,用户行为,情感分析,人际关系,社区,文本数据 数据概述:...
    packageimg