找到11,708个数据集

标签: 自然语言处理

过滤结果
  • 序列分类数据集

    2025年4月20日   

    序列分类数据集 数据来源:互联网公开数据 标签:序列分类,多分类任务,文本分类,自然语言处理,机器学习,小语言模型,数据标注,分类模型,分类任务 数据概述:...
    packageimg
  • Yelp酒店评论分类数据集

    2025年4月20日   

    Yelp酒店评论分类数据集 数据来源:互联网公开数据 标签:酒店,评论,分类,Yelp,文本分析,垃圾评论识别,自然语言处理 数据概述:...
    packageimg
  • 登山项目路线与论坛数据集

    2025年4月20日   

    登山项目路线与论坛数据集 数据来源:互联网公开数据 标签:登山项目,爬山路线,论坛讨论,品牌评价,情感分析,自然语言处理,数据爬取 数据概述: 本数据集来源于对MountainProject.com和Trailspace.com网站的公开数据爬取,包含以下五个部分:...
    packageimg
  • 印度新闻摘要清理数据集1963-2021

    2025年4月20日   

    印度新闻摘要清理数据集1963-2021 数据来源:互联网公开数据 标签:新闻摘要,印度,数据清理,文本处理,自然语言处理,机器学习 数据概述: 本数据集是Kondalarao...
    packageimg
  • 海量网页文本内容采集数据集-CommonCrawl样本数据

    2025年4月20日   

    海量网页文本内容采集数据集-CommonCrawl样本数据 数据来源:互联网公开数据 标签:网页文本,互联网,爬虫,数据挖掘,自然语言处理,文本分析,网页内容,Common Crawl 数据概述: 本数据集是Common Crawl数据集的一个样本,包含来自互联网的网页文本内容。Common...
    packageimg
  • Jigsaw评论社区毒性评级数据集

    2025年4月20日   

    Jigsaw评论社区毒性评级数据集 数据来源:互联网公开数据 标签:评论,毒性,NLP,文本分析,自然语言处理,情感分析,社交媒体,评论内容,Jigsaw,Kaggle 数据概述: 本数据集包含用于Jigsaw 毒性评论评级比赛(2021)的定制数据。数据集来源于Jigsaw...
    packageimg
  • 患者医生问答TR321179数据集

    2025年4月20日   

    患者医生问答TR321179数据集 数据来源:互联网公开数据 标签:患者医生问答,土耳其语,医疗沟通,自然语言处理,医疗研究,教育培训 数据概述: 本数据集是通过合并并重新整理 Patient Doctor Q&A TR 19583、Patient Doctor Q&A TR 167732、Patient Doctor Q&A...
    packageimg
  • 新闻真伪识别数据集-文本内容与标签-训练与测试集

    2025年4月20日   

    新闻真伪识别数据集-文本内容与标签-训练与测试集 数据来源:互联网公开数据 标签:假新闻检测,文本分类,自然语言处理,机器学习,新闻,真伪,文本分析 数据概述: 本数据集旨在支持假新闻检测的研究与开发,包含用于训练、测试模型的数据。数据集由三个CSV文件构成: 1....
    packageimg
  • 问题回答问答数据集

    2025年4月20日   

    问题回答问答数据集 数据来源:互联网公开数据 标签:问题回答,自然语言处理,问答系统,文本理解,信息抽取,文本定位,模型训练 数据概述: 本数据集包含多个问题回答任务相关的文本数据,旨在为自然语言处理和问答系统的研究提供支持。数据集中的每条记录包括以下字段: - Story:一段完整的文本内容,通常为叙述性或说明性段落。 -...
    packageimg
  • Jigsaw毒性评论多语言分类数据集

    2025年4月20日   

    Jigsaw毒性评论多语言分类数据集 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 自然语言处理, 多语言, 评论, 社交媒体, 文本分析, 机器学习 数据概述: 本数据集由Pavel Ostyakov创建,旨在支持多语言环境下的毒性评论分类任务。 数据集包含了多种语言的文本评论,并标注了毒性标签。...
    packageimg
  • IEEEXplore机器学习论文关键词数据集

    2025年4月20日   

    IEEEXplore机器学习论文关键词数据集 数据来源:互联网公开数据 标签:机器学习,论文,关键词,IEEE Xplore,自然语言处理,学术研究,数据挖掘,文本分析 数据概述: 本数据集包含了从IEEE...
    packageimg
  • YouTube视频评论情感分析数据集百万级标注评论

    2025年4月20日   

    YouTube视频评论情感分析数据集百万级标注评论 数据来源:互联网公开数据 标签:YouTube,评论,情感分析,自然语言处理,NLP,情感分类,文本数据,机器学习,深度学习 数据概述:...
    packageimg
  • 股票市场推文情感数据集

    2025年4月20日   

    股票市场推文情感数据集 数据来源:互联网公开数据 标签:股票市场,情感分析,自然语言处理,推文数据,投资决策,金融分析,文本分类 数据概述:...
    packageimg
  • 五十位维多利亚时代小说家的作者归属数据集

    2025年4月20日   

    五十位维多利亚时代小说家的作者归属数据集 数据来源:互联网公开数据 标签:小说,文学分析,作者归属,文本挖掘,维多利亚时代,自然语言处理,文学研究,文本分类 数据概述:...
    packageimg
  • 法律文档检索数据集

    2025年4月20日   

    法律文档检索数据集 数据来源:互联网公开数据 标签:法律文档,文本检索,问答系统,自然语言处理,信息抽取,司法应用,机器学习 数据概述: 本数据集旨在支持法律文档检索和问答系统的开发,包含三个主要文件:corpus.csv、train.csv 和 public_test.csv。 1. corpus.csv:存储法律文本及其唯一标识符,字段包括: -...
    packageimg
  • 新冠疫情社交媒体信息传播分析推特数据集-2020年3-4月

    2025年4月20日   

    新冠疫情社交媒体信息传播分析推特数据集-2020年3-4月 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,文本分析,自然语言处理,疫情传播,舆情分析,时间序列 数据概述:...
    packageimg
  • 推特情绪分析数据集-用户推文情感分类数据集-2009

    2025年4月20日   

    推特情绪分析数据集-用户推文情感分类数据集-2009 数据来源:互联网公开数据 标签:推特,情绪分析,情感分类,社交媒体,文本数据,自然语言处理,机器学习,情感,用户行为 数据概述: 本数据集包含推特(Twitter)用户发布的推文数据,并附带了相应的情感标签。数据集主要关注推文的情感倾向,为情感分析研究提供了基础。 数据集中的每条记录都包含以下字段:...
    packageimg
  • 电影字幕多语言平行数据集

    2025年4月20日   

    电影字幕多语言平行数据集 数据来源:互联网公开数据 标签:电影字幕,多语言平行数据,英语到阿拉伯语,英语到法语,英语到印度尼西亚语,英语到泰语,时间对齐,机器翻译,自然语言处理 数据概述:...
    packageimg
  • 酒店评论情感分析数据集

    2025年4月20日   

    酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,文本分类,机器学习,自然语言处理,情感极性,TF-IDF,词向量,深度学习 数据概述:...
    packageimg
  • 自然语言处理情感分析数据集

    2025年4月20日   

    自然语言处理情感分析数据集 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本挖掘,机器学习,数据标注,社交媒体分析 数据概述: 本数据集包含来自社交媒体平台的大量文本数据,每条记录均标注了对应的情感类别,如正面、负面和中性等。数据集涵盖了不同领域的话题,为自然语言处理和情感分析的研究提供了丰富的资源。 数据用途概述:...
    packageimg