找到28个数据集

格式: CSV 标签: 自然语言处理

过滤结果
  • 互联网公开新闻数据集

    2025年4月8日 123 62 44

    标题:互联网公开新闻数据集 数据内容: 该数据集包含从互联网公开数据中收集的新闻文章信息。具体包含以下数据元素: - id:唯一标识符,共有13368种不同的值 - article:完整的新闻文章文本 - highlights:文章的摘要或重点内容,共有13300种不同的值 数据来源: 互联网公开数据 数据用途: 该数据集可以用于多个行业的多种问题:...
    packageimg
  • 食品与健康数据分析集

    2025年4月25日 31 123 2

    标题:食品与健康数据分析集 数据来源:互联网公开数据 数据内容: 本数据集包含以下数据元素: 1. 食品名称(Title):记录了不同食品的名称。 2. 食材(Ingredients):列出了制作每道食品所需的食材。 3. 制作步骤(Instructions):详细描述了每道食品的制作过程。 4....
    packageimg
  • 问答数据集涵盖广泛主题的高质量问答内容

    2025年4月25日 31 140 32

    标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据...
    packageimg
  • 词汇与人类特征分析数据集

    2025年4月23日 31 148 127

    标题:词汇与人类特征分析数据集 数据内容: 本数据集包含三个主要字段: 1. Word 1:包含206种不同的词汇值,代表一组特定的词语或短语。 2. Word 2:包含295种不同的词汇值,代表另一组特定的词语或短语。 3. Human (Mean):包含146种不同的值,代表与人类相关的某种特征或指标,可能是某种测量或分类结果。 数据来源:...
    packageimg
  • 航空情感分析数据集社交媒体情感分析的黄金标准

    2025年4月23日 31 101 93

    标题:航空情感分析数据集社交媒体情感分析的黄金标准 数据内容: 该数据集包含来自社交媒体平台的航空相关推文数据,涉及航空公司、情感分析、地理位置、时间戳等多个维度。具体字段包括: - tweet_id:推文的唯一标识符 - airline_sentiment:推文对航空公司的整体情感倾向(正面、负面、中性) -...
    packageimg
  • 社交媒体评论数据集分析报告

    2025年4月23日 31 112 61

    标题:社交媒体评论数据集分析报告 数据内容: 该数据集包含社交媒体平台上用户的评论数据,具体包括以下字段: 1. 评论文本(comment):用户发表的原始评论内容。 2. 评论标签(label):对评论进行分类的标签,具有2种不同的值,可能是正面或负面情感标签。 3....
    packageimg
  • 社交媒体内容分类数据集

    2025年4月23日 31 113 87

    标题:社交媒体内容分类数据集 数据内容:本数据集包含24783条不同的社交媒体推文及其相关分类信息。数据字段包括:推文内容、仇恨言论分类、攻击性语言分类、非仇恨非攻击性分类、总分类标签以及计数信息。 数据来源:互联网公开数据...
    packageimg
  • 深入洞察ChatGPT用户评论数据集助力提升AI交互体验

    2025年4月23日 31 87 37

    标题:深入洞察ChatGPT用户评论数据集助力提升AI交互体验 数据内容: 该数据集包含了ChatGPT用户的评论信息,具体数据元素包括: 1. Review Id:评论的唯一标识符,共有193,154个不同的值,表明数据集覆盖了大量独立评论。 2. Review:用户的评论内容,共有125,492个不同的值,反映了用户对ChatGPT的多样化反馈。...
    packageimg
  • 数据30种阿拉伯字母分类数据集详解

    2025年4月23日 31 2 1

    标题:30种阿拉伯字母分类数据集详解 数据内容: 该数据集包含了30种不同的阿拉伯字母及其对应的分类标识。数据集主要包括以下两个字段: 1. Class_ID:表示每个阿拉伯字母对应的分类标识。 2. Arabic_Letter:表示具体的阿拉伯字母。 数据来源: 互联网公开数据 数据用途: 该数据集可以用于多个行业的研究与应用: 1....
    packageimg
  • 情绪分类与情感分析数据集

    2025年4月23日 434 48 44

    标题:情绪分类与情感分析数据集 数据内容: 该数据集包含14种情绪类别及其对应的不同值数量,具体包括: - 愤怒(Anger):85种不同值 - 无聊(Boredom):72种不同值 - 平静(Calm):111种不同值 - 轻蔑(Contempt):95种不同值 - 厌恶(Disgust):80种不同值 - 兴奋(Excitement):96种不同值...
    packageimg
  • 情感分析数据集基于互联网公开数据的24000条评论分析

    2025年4月23日 62 114 107

    标题:情感分析数据集基于互联网公开数据的24000条评论分析 数据内容: 本数据集包含24000条从互联网公开数据中收集的评论数据,每条评论都经过情感分析处理。数据集包含以下字段: 1. index(索引):唯一标识每条评论的整数 2. review(评论内容):具体的评论文本 3. sentiment(情感标签):表示评论的情感倾向,分为3种类型...
    packageimg
  • 情感分析与评论数据集

    2025年4月23日 31 189 164

    标题:情感分析与评论数据集 数据内容:该数据集包含两个主要字段,分别是“评论”和“情感”。其中,“评论”字段包含17,872种不同的值,代表了不同的用户评论内容;“情感”字段包含3种不同的值,表示评论的情感倾向(如正面、负面和中性)。 数据来源:互联网公开数据 数据用途: 1. 电子商务:可用于分析用户对产品或服务的评价,帮助企业优化产品和服务。 2....
    packageimg
  • 情感分析与情绪分类数据集

    2025年4月23日 62 118 14

    标题:情感分析与情绪分类数据集 数据内容:本数据集包含了3289个不同的句子,每个句子都标注了相应的情绪和情感。情绪字段有6种不同的值,情感字段有2种不同的值。 数据来源:互联网公开数据...
    packageimg
  • 情感与文本数据集

    2025年4月23日 155 33 18

    标题:情感与文本数据集 数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id)...
    packageimg
  • 大规模文本数据集分析报告

    2025年4月22日 31 129 21

    标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1....
    packageimg
  • 大规模问答数据集助力智能问答系统开发

    2025年4月22日 31 112 72

    标题:大规模问答数据集助力智能问答系统开发 数据内容:本数据集包含丰富的问答数据,其中“problem”字段记录了1648种不同的问题,覆盖了广泛的知识领域;“answer”字段则提供了526种不同的答案,为每个问题提供了详细的解答。数据内容涵盖多个领域,可以用于训练和优化智能问答系统。 数据来源:互联网公开数据...
    packageimg
  • 大规模文本分类数据集详述

    2025年4月22日 62 158 129

    标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。...
    packageimg
  • 大规模文本分类数据集

    2025年4月22日 31 32 25

    标题:大规模文本分类数据集 数据内容: 本数据集包含232074条独特的文本数据,每条文本都有对应的分类标签。数据集包含以下字段: - text:文本内容 - class:文本类别(2种不同值) 数据来源: 互联网公开数据 数据用途: 该数据集适用于多个行业的文本分类任务: - 人工智能行业:训练文本分类模型 - 大数据行业:进行文本挖掘和自然语言处理...
    packageimg
  • 多样化文本数据集丰富的内容资源

    2025年4月22日 31 60 29

    标题:多样化文本数据集丰富的内容资源 数据内容: 该数据集包含多样化的文本信息,具体字段包括: 1. FileName:表示文件的名称,包含20000种不同的文件名,展示了数据集的广泛覆盖范围。 2. Font:表示文本使用的字体类型,共有20种不同的字体,反映了不同字体的使用情况。 3....
    packageimg
  • 多样化信息分类数据集

    2025年4月22日 31 198 37

    标题:多样化信息分类数据集 数据内容:该数据集包含两个主要字段:Category和Message。Category字段有3种不同的值,表示不同的类别;Message字段有5158种不同的值,表示具体的信息内容。数据集中的信息涵盖了多种类型和主题,能够为多种分析和研究提供支持。 数据来源:互联网公开数据...
    packageimg