找到5,684个数据集

标签: 文本分析

过滤结果
  • 印度垃圾短信分类数据集

    2025年4月15日   

    印度垃圾短信分类数据集 数据来源:互联网公开数据 标签:垃圾短信,印度,短信分类,文本分析,机器学习,数据贡献,通讯模式 数据概述:...
    packageimg
  • WinoBias性别偏见解决Winograd模式数据集

    2025年4月15日   

    WinoBias性别偏见解决Winograd模式数据集 数据来源:互联网公开数据 标签:性别偏见,共指解析,Winograd模式,自然语言处理,计算语言学,文本分析 数据概述:...
    packageimg
  • 印度尼日利亚英文短信垃圾信息数据集

    2025年4月15日   

    印度尼日利亚英文短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信数据,垃圾信息识别,文本分析,自然语言处理,用户行为,数据隐私 数据概述:...
    packageimg
  • 虚假新闻分类数据集2016-2019

    2025年4月15日   

    虚假新闻分类数据集2016-2019 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,新闻来源,文本分析,机器学习,数据标注 数据概述:...
    packageimg
  • 福尔摩斯的矛盾增强数据集1963-2021

    2025年4月15日   

    福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:...
    packageimg
  • 英语语法错误纠正常用数据集

    2025年4月15日   

    英语语法错误纠正常用数据集 数据来源:互联网公开数据 标签:语法错误,英语学习,自然语言处理,语法纠正,机器学习,文本分析 数据概述: 本数据集是JFLEG(JHU FLuency-Extended...
    packageimg
  • 印尼圣经文本数据集

    2025年4月15日   

    印尼圣经文本数据集 数据来源:互联网公开数据 标签:印尼,圣经,宗教文本,文本分析,语言文化,宗教研究 数据概述: 本数据集包含从互联网公开资源爬取的印尼语圣经文本,内容涵盖圣经的多卷书,包括旧约和新约。数据集以文本形式呈现,适合用于宗教文本研究、语言分析、文化解读等多种场景。 数据用途概述:...
    packageimg
  • 最后生还者社交媒体推文数据集最近

    2025年4月15日   

    最后生还者社交媒体推文数据集最近 数据来源:互联网公开数据 标签:最后生还者,社交媒体,推文,文本分析,互动数据,语言多样性,HBO 数据概述: 本数据集收录了近期与《最后生还者》相关的推文数据,主要围绕TheLastOfUs 和 TheLastOfUsHBO...
    packageimg
  • 印度尼西亚新闻门户网站头条数据集

    2025年4月15日   

    印度尼西亚新闻门户网站头条数据集 数据来源:互联网公开数据 标签:印度尼西亚,新闻头条,新闻门户,文本分析,情感分析,NLP,媒体监测,时间序列分析 数据概述:...
    packageimg
  • KDnuggets数据科学博客文章标题与主题数据集-2014-2022

    2025年4月15日   

    KDnuggets数据科学博客文章标题与主题数据集-2014-2022 数据来源:互联网公开数据 标签:数据科学,博客,文章标题,主题,KDnuggets,时间序列,文本分析,内容分析 数据概述:...
    packageimg
  • 巴西中学生葡萄牙语叙事作文自动评分数据集1963-2021

    2025年4月15日   

    巴西中学生葡萄牙语叙事作文自动评分数据集1963-2021 数据来源:互联网公开数据 标签:葡萄牙语,叙事作文,自动评分,教育评估,文本分析,中学生作文,巴西基础教育 数据概述:...
    packageimg
  • 亚马逊电子产品用户评价数据集-电子产品-用户评价-时间跨度未知

    2025年4月15日   

    亚马逊电子产品用户评价数据集-电子产品-用户评价-时间跨度未知 数据来源:互联网公开数据 标签:亚马逊,电子产品,用户评价,评论,评级,消费者行为,文本分析,情感分析 数据概述: 本数据集包含来自亚马逊平台的电子产品用户评价数据,重点关注电子产品类别中评价数量最多的产品。 数据集包含了丰富的元数据,以及用户对产品的评分和评价内容。...
    packageimg
  • 菲律宾新闻头条数据集

    2025年4月15日   

    菲律宾新闻头条数据集 数据来源:互联网公开数据 标签:菲律宾新闻,商业,金融,经济,文本分析,情感分析,股票价格相关性 数据概述: 本数据集收录了菲律宾《马尼拉时报》网站发布的商业、金融和经济类别的新闻头条,涵盖多个年份的数据。新闻头条的内容涵盖了广泛的商业和经济话题,为文本分析、情感分析及与股票价格的相关性研究提供了丰富的素材。 数据用途概述:...
    packageimg
  • 北马里亚纳情绪数据集

    2025年4月15日   

    北马里亚纳情绪数据集 数据来源:互联网公开数据 标签:情绪分析,北马里亚纳,社交媒体,情感分类,文本分析,自然语言处理 数据概述:...
    packageimg
  • Goodreads热门书籍描述与标签数据集

    2025年4月15日   

    Goodreads热门书籍描述与标签数据集 数据来源:互联网公开数据 标签:书籍推荐,图书,描述,标签,Goodreads,阅读,文本分析,热门书籍 数据概述: 本数据集整合了Goodreads平台排名前2000位的书籍信息,包括书籍描述和标签。数据集基于goodbooks-10k数据集,通过Goodreads...
    packageimg
  • Indiegogo众筹平台项目表现数据集-2011-2020

    2025年4月15日   

    Indiegogo众筹平台项目表现数据集-2011-2020 数据来源:互联网公开数据 标签:众筹,Indiegogo,项目,融资,创业,成功率,地理位置,时间序列,项目分类,文本分析 数据概述:...
    packageimg
  • YALICKJ维基百科带上下文数据集

    2025年4月15日   

    YALICKJ维基百科带上下文数据集 数据来源:互联网公开数据 标签:维基百科,上下文,数据集,自然语言处理,机器学习,文本分析 数据概述: 本数据集基于YALICKJ在Kaggle上提供的维基百科数据集,并增加了由Chris Notebook生成的上下文列。数据集包含了维基百科页面的文本内容及其对应的上下文信息,适用于自然语言处理和机器学习任务。...
    packageimg
  • Reddit科技与科学领域缩略词数据集

    2025年4月15日   

    Reddit科技与科学领域缩略词数据集 数据来源:互联网公开数据 标签:缩略词,科技,科学,Reddit,社交媒体,文本分析,数据挖掘,自然语言处理 数据概述:...
    packageimg
  • DCS世界战役产品数据集

    2025年4月15日   

    DCS世界战役产品数据集 数据来源:互联网公开数据 标签:DCS世界,战役产品,文本分析,NLP,游戏数据,产品信息 数据概述: 本数据集包含DCS世界战役产品的原始文本数据,涵盖除价格外的所有公开信息,这些信息客户可以在DCS-...
    packageimg
  • Etsy电商平台商品评价星级数据集

    2025年4月15日   

    Etsy电商平台商品评价星级数据集 数据来源:互联网公开数据 标签:电商,评价,星级,用户反馈,文本分析,情感分析,Etsy,商品,评论 数据概述: 本数据集包含了Etsy电商平台上的1000条商品评论数据。每条数据包含两个字段:一是买家对商品的评价文本,二是买家给出的星级评分(1-5星)。数据来源于Etsy网站,涵盖了不同商品的评价内容和买家满意度。...
    packageimg