找到933个数据集

标签: 文本数据

过滤结果
  • 僧伽罗语新闻文章数据集

    2025年4月14日   

    僧伽罗语新闻文章数据集 数据来源:互联网公开数据 标签:僧伽罗语,新闻,多分类,文本数据,机器学习,自然语言处理,斯里兰卡新闻,开源数据集 数据概述: 本数据集基于斯里兰卡知名新闻网站Hiru...
    packageimg
  • 图鲁语YouTube视频评论情感分析数据集

    2025年4月14日   

    图鲁语YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:图鲁语,YouTube,评论,情感分析,自然语言处理,文本数据,情感分类 数据概述:...
    packageimg
  • 新生命版圣经西班牙语数据集

    2025年4月14日   

    新生命版圣经西班牙语数据集 数据来源:互联网公开数据 标签:圣经,新生命版,西班牙语,宗教,基督教,文本数据,圣经研究 数据概述: 本数据集包含从https://www.bibliavida.com/ntv/抓取的新生命版圣经(西班牙语)的完整文本。数据以CSV文件格式呈现,包括书名、章节数、节编号以及相应节的文本内容,适用于宗教研究、圣经分析等场景。...
    packageimg
  • 社交媒体金融话题讨论热度分析数据集-2020年10月11日至2020年11月11日

    2025年4月14日   

    社交媒体金融话题讨论热度分析数据集-2020年10月11日至2020年11月11日 数据来源:互联网公开数据 标签:社交媒体,金融,Facebook,舆情分析,文本数据,时间序列,财经,市场情绪 数据概述:...
    packageimg
  • ChatGPT移动端应用用户评论情感分析数据集-iOS平台-2023年7月

    2025年4月14日   

    ChatGPT移动端应用用户评论情感分析数据集-iOS平台-2023年7月 数据来源:互联网公开数据 标签:ChatGPT, 移动应用, 用户评论, 情感分析, iOS, 应用评估, 用户体验, 文本数据 数据概述:...
    packageimg
  • 推特情感分析STS-Gold数据集

    2025年4月14日   

    推特情感分析STS-Gold数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,社交媒体,情感极性,机器学习,自然语言处理 数据概述: 本数据集由Saif等人(2013)创建,包含2026条推文及其对应的ID和情感极性标签。这些推文用于训练情感分析模型。若使用本数据集,请引用原论文。 原论文引用:Saif, H., Fernandez,...
    packageimg
  • Reddit问答社区AskReddit帖子及评论数据集

    2025年4月14日   

    Reddit问答社区AskReddit帖子及评论数据集 数据来源:互联网公开数据 标签:Reddit, AskReddit, 问答, 社区, 帖子, 评论, 文本数据, 情感分析, 话题分析 数据概述:...
    packageimg
  • 碧昂歌词数据集

    2025年4月14日   

    碧昂歌词数据集 数据来源:互联网公开数据 标签:碧昂,歌词,音乐分析,专辑,歌曲,文本数据,音乐研究 数据概述: 本数据集包含了碧昂从2003年至2022年发行的多张专辑的歌词记录,具体包括《Dangerously In Love》、《B'Day》、《I Am…Sasha...
    packageimg
  • WebMD健康问答平台问题与解答数据集

    2025年4月14日   

    WebMD健康问答平台问题与解答数据集 数据来源:互联网公开数据 标签:健康,医疗,问答,WebMD,医学,文本数据,自然语言处理,信息检索 数据概述:...
    packageimg
  • 欧洲杯赛事社交媒体讨论内容情感分析数据集-2020年Reddit平台

    2025年4月14日   

    欧洲杯赛事社交媒体讨论内容情感分析数据集-2020年Reddit平台 数据来源:互联网公开数据 标签:欧洲杯,足球,社交媒体,Reddit,情感分析,赛事讨论,文本数据,体育,舆情分析 数据概述: 本数据集收录了2020年欧洲杯期间Reddit平台r/Euro2020子版块内的帖子和评论数据。数据来源于Reddit官方API,使用Python...
    packageimg
  • 烹饪平台用户评论与互动信息食谱评论与评分反馈数据集

    2025年4月13日   

    数据来源 互联网公开数据 数据字段 Recipe_Name(食谱名称):用户评价所对应的食谱标题。 Recipe_Rank(食谱排名):食谱在平台前100名榜单中的排名情况。 Recipe_ID(食谱代码):每个食谱的唯一标识符。 User_ID(用户ID):用户的唯一身份标识。 User_Name(用户名):注册用户的显示名称。...
    packageimg
  • 互联网公开数据集多源文本标注数据集

    2025年4月8日   

    标题:互联网公开数据集多源文本标注数据集 数据内容:该数据集包含了来自多个来源的文本数据,每个文本都经过标注处理,具有明确的分类标签。数据集中包含文本内容、标签以及数据来源三个主要字段。具体字段统计信息如下: text: 290,390 种不同文本内容 label: 3 种不同的分类标签 src: 11 种不同的数据来源 数据来源:互联网公开数据...
    packageimg
  • 丰富多样的文本数据集

    2025年4月7日   

    标题:丰富多样的文本数据集...
    packageimg