找到11,708个数据集

标签: 自然语言处理

过滤结果
  • 文本特征提取数据集1963-2021

    2025年4月19日   

    文本特征提取数据集1963-2021 数据来源:互联网公开数据 标签:文本特征,自然语言处理,情感分析,可读性分析,语法结构,词性标注,命名实体识别 数据概述:...
    packageimg
  • Basalam产品实体分类数据集

    2025年4月19日   

    Basalam产品实体分类数据集 数据来源:互联网公开数据 标签:实体分类,产品分类,波斯语文本,电子商务,多语言数据,市场分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 巴西ATribuna报纸新闻文本分类数据集

    2025年4月19日   

    巴西ATribuna报纸新闻文本分类数据集 数据来源:互联网公开数据 标签:新闻文本,分类,巴西,报纸,文本挖掘,机器学习,自然语言处理 数据概述: 本数据集源自巴西报纸“A...
    packageimg
  • COVID-19研究论文数据集

    2025年4月19日   

    COVID-19研究论文数据集 数据来源:互联网公开数据 标签:COVID-19,研究论文,PubMed,DOI,医学研究,机器学习,自然语言处理,数据挖掘,疫情分析 数据概述: 本数据集收录了超过15万篇关于COVID-19的研究论文,每篇论文包含PubMed...
    packageimg
  • 财经情感分析数据集

    2025年4月19日   

    财经情感分析数据集 数据来源:互联网公开数据 标签:财经新闻,情感分析,股票影响,自然语言处理,金融建模,市场预测,投资决策 数据概述:...
    packageimg
  • 印度新冠疫情推文数据集

    2025年4月19日   

    印度新冠疫情推文数据集 数据来源:互联网公开数据 标签:推文数据,新冠疫情,印度,社交媒体分析,文本挖掘,自然语言处理,情感分析 数据概述: 本数据集包含2021年1月至3月期间从Twitter抓取的与“COVID...
    packageimg
  • 古兰经与塔夫西尔数据集

    2025年4月19日   

    古兰经与塔夫西尔数据集 数据来源:互联网公开数据 标签:古兰经,塔夫西尔,宗教文本,阿拉伯语,自然语言处理,文本分析,机器学习 数据概述:...
    packageimg
  • 泰国美容产品评论数据集

    2025年4月19日   

    泰国美容产品评论数据集 数据来源:互联网公开数据 标签:泰国美容产品评论,情感分析,自然语言处理,消费者评价,星评体系,文本分析 数据概述: 本数据集来自泰国最大的美容产品评论网站,旨在为情感分析项目提供数据支持。数据集包含用户对美容产品的评分及评论,其中评分采用5星制,评论内容为用户对产品的多样化评价。 数据用途概述:...
    packageimg
  • 微博失业话题讨论数据集

    2025年4月19日   

    微博失业话题讨论数据集 数据来源:互联网公开数据 标签:失业,社交媒体,文本分析,社会热点,舆论趋势,自然语言处理,就业市场 数据概述:...
    packageimg
  • 加密货币社交媒体讨论数据分析集2022-2023

    2025年4月19日   

    加密货币社交媒体讨论数据分析集2022-2023 数据来源:互联网公开数据 标签:加密货币,社交媒体,公众意见,市场趋势,自然语言处理,情感分析 数据概述:...
    packageimg
  • 多语言情感分析数据集

    2025年4月19日   

    多语言情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,多语言模型,文本分类,LLM生成,数据清洗 数据概述:...
    packageimg
  • Twitter情感数据集

    2025年4月19日   

    Twitter情感数据集 数据来源:互联网公开数据 标签:社交媒体,情感分析,情绪分类,文本数据,自然语言处理,情感识别,机器学习 数据概述:...
    packageimg
  • 推特社交媒体海量推文情感分析数据集-两年期

    2025年4月19日   

    推特社交媒体海量推文情感分析数据集-两年期 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,文本分析,用户生成内容,机器学习,文本分类,时间序列分析,用户行为 数据概述:...
    packageimg
  • 印尼新闻标题数据集

    2025年4月19日   

    印尼新闻标题数据集 数据来源:互联网公开数据 标签:印尼,新闻标题,clickbait,自然语言处理,文本分类,新闻媒体,数据标注 数据概述: 本数据集由 CLICK-ID 数据集组成,主要包含来自 12 家印尼本地新闻网站(如 detikNews、Fimela、Kapanlagi 等)的新闻标题数据。数据集分为两部分:(1) 46,119...
    packageimg
  • AES2024辅助数据集

    2025年4月19日   

    AES2024辅助数据集 数据来源:互联网公开数据 标签:自然语言处理,机器学习,自动评分,写作评估,特征重要性,模型对象,向量化器 数据概述: 本数据集是为“Learning Agency Lab - Automated Essay Scoring...
    packageimg
  • 来自可兰经的阿拉伯语手写数据集AHDQ

    2025年4月19日   

    来自可兰经的阿拉伯语手写数据集AHDQ 数据来源:互联网公开数据 标签:阿拉伯语手写,可兰经,OCR,文化传承,机器学习,计算机视觉,自然语言处理 数据概述:...
    packageimg
  • 阿尔及利亚网阿拉伯语新闻文章数据集1963-2021

    2025年4月19日   

    阿尔及利亚网阿拉伯语新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯语新闻,自然语言处理,机器学习,语料库,情感分析,主题分类,命名实体识别 数据概述:...
    packageimg
  • 新闻真伪鉴别-印度新闻文章数据集2023-2024

    2025年4月19日   

    新闻真伪鉴别-印度新闻文章数据集2023-2024 数据来源:互联网公开数据 标签:假新闻,真新闻,新闻分析,文本分类,自然语言处理,印度,新闻报道,数据挖掘,信息可靠性 数据概述: 本数据集旨在用于新闻真伪鉴别研究,收录了来自印度不同新闻来源的文章。 数据集包含两类文章:一类来自如《印度时报》(Times of...
    packageimg
  • 北欧语言识别数据集

    2025年4月19日   

    北欧语言识别数据集 数据来源:互联网公开数据 标签:语言识别,北欧语言,自然语言处理,机器学习,数据分类,丹麦语,瑞典语,挪威语,法罗语,冰岛语 数据概述:...
    packageimg
  • Quora问答平台问题重复识别数据集

    2025年4月19日   

    Quora问答平台问题重复识别数据集 数据来源:互联网公开数据 标签:问答平台,自然语言处理,机器学习,文本相似度,重复问题,Quora,语义分析 数据概述:...
    packageimg