找到5,737个数据集

标签: 文本分析 None: 数据

过滤结果
  • 阅读理解竞赛数据集

    2025年4月27日 30 154 148

    阅读理解竞赛数据集 数据来源:互联网公开数据 标签:阅读理解,竞赛,教育,自然语言处理,文本分析,机器学习,英语学习 数据概述:...
    packageimg
  • 过滤推文数据集

    2025年4月26日 30 161 132

    过滤推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,文本分析,自然语言处理,情绪分析,用户行为,MBTI人格类型,文本分类 数据概述:...
    packageimg
  • 新闻标题数据集

    2025年4月23日 30 53 1

    新闻标题数据集 数据来源:互联网公开数据 标签:新闻,媒体,时间序列,新闻分析,行业趋势,数据挖掘,文本分析 数据概述: 本数据集包含了约140万条新闻标题,数据来源为《华尔街日报》和《华盛顿邮报》,时间范围覆盖2011年至2022年。数据集中的每条记录包含新闻标题、相关标签、发布时间和新闻链接,为研究新闻内容及其传播趋势提供了丰富的基础数据支持。...
    packageimg
  • 新闻文章摘要数据集

    2025年4月15日 30 186 129

    新闻文章摘要数据集 数据来源:互联网公开数据 标签:新闻,文章,摘要,标题,超链接,内容,文本分析,自然语言处理 数据概述: 本数据集包含了新闻文章的标题、超链接和正文内容。数据集覆盖了广泛的新闻来源,提供了丰富的文本信息,适用于新闻分析、文本摘要生成和自然语言处理等多种应用场景。 数据用途概述:...
    packageimg
  • 随机日期数据集

    2025年4月14日 30 140 47

    随机日期数据集 数据来源:互联网公开数据 标签:日期识别,机器学习,自然语言处理,数据标注,文本分析,日期标注,日期提取 数据概述: 本数据集包含由Python脚本生成的随机日期数据,旨在用于机器学习模型训练,以识别文档中的日期。数据集标注了每个词或词组是否为日期,为日期标注任务提供了基础。 数据用途概述:...
    packageimg
  • 洛杉矶推特新闻数据集

    2025年4月14日 30 166 13

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • 自杀笔记数据集

    2025年4月14日 30 190 188

    自杀笔记数据集 数据来源:互联网公开数据 标签:自杀,心理健康,社会问题,情感分析,文本分析,公众健康,干预措施 数据概述: 本数据集包含用户在网上发布的带有自杀念头的文本信息,涵盖了不同背景下个体的内心独白和情感表达。数据集旨在为心理健康研究、社会问题分析和公众健康干预提供文本资料。 数据用途概述:...
    packageimg
  • 调整文本数据集

    2025年4月14日 30 99 94

    调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:...
    packageimg
  • 自杀数据清理版数据集

    2025年4月16日 30 90 47

    自杀数据清理版数据集 数据来源:互联网公开数据 标签:自杀,心理健康,文本分析,情感分析,数据清理,TF-IDF,机器学习 数据概述: 本数据集基于“suicide-watch”数据集进行清理和预处理,旨在提供更高质量的数据用于进一步分析和建模。清理过程包括去除表情符号、停止词,并采用TF-...
    packageimg
  • 抑郁症检测数据集

    2025年4月14日 30 206 7

    抑郁症检测数据集 数据来源:互联网公开数据 标签:抑郁症,社交媒体,情感分析,心理健康,文本分析 数据概述: 本数据集包含两个字段:推文文本和标签。推文文本字段记录了用户的社交媒体内容,标签字段则标注了该推文是否涉及抑郁症。数据集提供了广泛的社会媒体文本数据,为抑郁症检测模型的开发与训练提供了必要的基础。 数据用途概述:...
    packageimg
  • 新闻文本摘要生成训练数据集

    2025年7月28日 30 104 1

    新闻文本摘要生成训练数据集_News_Text_Summarization_Training_Data 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器学习, 新闻语料, 文本生成, 深度学习, 数据集, 文本分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了用于训练文本摘要模型的原始新闻文章。主要特征如下:...
    packageimg
  • 智慧推文数据集

    2025年4月14日 30 209 108

    智慧推文数据集 数据来源:互联网公开数据 标签:社交媒体,自我提升,文本分析,情感分析,内容传播,用户行为,自然语言处理 数据概述: 本数据集收录了40个 Twitter...
    packageimg
  • 莫迪总理推文数据集

    2025年4月15日 30 39 36

    莫迪总理推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,莫迪,文本分析,情感分析,影响力评估,时间序列,公众人物 数据概述:...
    packageimg
  • 推特话题汇总数据集

    2025年4月14日 30 92 45

    推特话题汇总数据集 数据来源:互联网公开数据 标签:推特,话题汇总,自然语言处理,文本分析,社会媒体,教育,研究,自动化摘要 数据概述: 本数据集包含了来自不同话题标签的推文摘要,总计1950条记录。这些推文摘要通过先进的自然语言处理模型ChatGPT系统生成,为教育和研究提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • 毒性数据集

    2025年4月15日 30 28 9

    毒性数据集 数据来源:互联网公开数据 标签:毒性,文本分析,自然语言处理,机器学习,内容审核,社交媒体,网络言论 数据概述: 本数据集收录了多种来源的文本数据,涵盖社交媒体评论、论坛帖子、新闻评论等,主要用于识别和分析其中的毒性内容。数据集标注了不同类型的毒性评论,如侮辱、威胁、歧视等,为研究文本中的不良内容提供了丰富的样本。 数据用途概述:...
    packageimg
  • 铁血远征数据集

    2025年4月19日 30 9 8

    铁血远征数据集 数据来源:互联网公开数据 标签:社区讨论,论坛数据,文本分析,社交媒体,用户行为,话题分类,信息抽取 数据概述: 本数据集是Iron...
    packageimg
  • 引言数据集

    2025年4月15日 30 36 19

    引言数据集 数据来源:互联网公开数据 标签:引言,文本分析,内容推荐系统,自然语言处理,用户偏好,数据分析 数据概述: 本数据集收录了大量引言文本,旨在用于构建基于内容的推荐系统。数据集包括不同来源的引言,涵盖广泛的主题和风格,为文本数据的分析和处理提供了丰富的材料。 数据用途概述:...
    packageimg
  • 深度文章数据集

    2025年4月17日 30 51 26

    深度文章数据集 数据来源:互联网公开数据 标签:长篇文章,人文科学,跨学科研究,文本分析,自然语言处理,主题建模,情感分析,摘要生成 数据概述:...
    packageimg
  • 法律文本知识库数据集

    2025年6月1日 30 48 14

    法律文本知识库数据集 数据来源:互联网公开数据 标签:法律文本,知识库,自然语言处理,文本挖掘,法律信息,文本分析 数据概述:...
    packageimg
  • 泰语语料库数据集

    2025年4月27日 30 152 2

    泰语语料库数据集 数据来源:互联网公开数据 标签:泰语,语料库,自然语言处理,机器学习,文本分析,泰文字体,分词算法 数据概述:...
    packageimg