找到5,734个数据集

标签: 文本分析

过滤结果
  • Skytrax航空评论数据集SkytraxReviewsDataset-austinpeck

    2025年4月23日   

    Skytrax航空评论数据集SkytraxReviewsDataset-austinpeck 数据来源:互联网公开数据 标签:航空,旅客评论,数据集,情感分析,服务质量,数据挖掘,客户体验,文本分析 数据概述: 该数据集包含来自 Skytrax 网站的航空旅客评论数据,记录了乘客对不同航空公司的服务体验。主要特征如下:...
    packageimg
  • 韩国自然语言推理数据集1963-2021-thedevastator

    2025年4月23日   

    韩国自然语言推理数据集1963-2021-thedevastator 数据来源:互联网公开数据 标签:KOR_NLI,自然语言推理,韩语,文本分析,机器学习,自然语言处理,推理模型 数据概述:...
    packageimg
  • 电影剧情概述与类型关联分析数据集-hetpatel01

    2025年4月23日   

    电影剧情概述与类型关联分析数据集-hetpatel01 数据来源:互联网公开数据 标签:电影,类型,剧情,文本分析,自然语言处理,NLP,文本分类,推荐系统,多标签分类 数据概述:...
    packageimg
  • 抑郁症识别与心理健康分析数据集DepressionDetectionfromRedditDataset-deapdaru

    2025年4月23日   

    抑郁症识别与心理健康分析数据集DepressionDetectionfromRedditDataset-deapdaru 数据来源:互联网公开数据 标签:心理健康,抑郁症,数据集,社交网络,文本分析,机器学习,情感识别,自然语言处理 数据概述:...
    packageimg
  • 多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9

    2025年4月23日   

    多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9 数据来源:互联网公开数据 标签:自然语言处理,多语言,推理,数据集,机器学习,深度学习,人工智能,文本分析 数据概述: 该数据集包含来自多个来源的多语言文本数据,专门用于自然语言推理任务。主要特征如下: 时间跨度:...
    packageimg
  • 孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir

    2025年4月23日   

    孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir 数据来源:互联网公开数据 标签:语言学,词汇,数据集,文本分析,自然语言处理,语言研究,机器学习,教育 数据概述: 该数据集包含来自孟加拉语词汇库的数据,记录了孟加拉语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit

    2025年4月23日   

    卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,卡纳达语,数据集,文本分析,机器学习,自然语言处理,多语言处理,信息检索 数据概述: 该数据集记录了卡纳达语新闻文章的分类信息,适用于新闻分类,文本分析和机器学习任务。主要特征如下:...
    packageimg
  • 辩论场景句子数据集DebateSentencesDataset-vdudani

    2025年4月23日   

    辩论场景句子数据集DebateSentencesDataset-vdudani 数据来源:互联网公开数据 标签:辩论,句子,文本分析,自然语言处理,数据集,情感分析,语言学,机器学习 数据概述: 该数据集包含了从公开辩论场景中提取的句子,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的辩论场景。...
    packageimg
  • 柯南侦探对话数据集DetectiveConanConversationDataset-jiarandiiana

    2025年4月23日   

    柯南侦探对话数据集DetectiveConanConversationDataset-jiarandiiana 数据来源:互联网公开数据 标签:侦探小说,对话数据,数据集,自然语言处理,机器学习,文本分析,文化研究,推理小说 数据概述: 该数据集包含来自柯南(Detective...
    packageimg
  • 新闻组文档数据集分析报告

    2025年4月23日   

    标题:新闻组文档数据集分析报告 数据内容:本数据集包含来自互联网公开数据的新闻组文档信息,其中包括新闻组名称和文档标识符两个数据元素。具体而言,数据集中的每个记录都包含“newsgroup”(新闻组名称)和“document_id”(文档标识符)两个字段,分别用于标识文档所属的新闻组和文档的唯一标识。 数据来源:互联网公开数据...
    packageimg
  • BBC新闻内容数据集BBCNewsContentDataset-malwyshihab

    2025年4月23日   

    BBC新闻内容数据集BBCNewsContentDataset-malwyshihab 数据来源:互联网公开数据 标签:新闻,媒体内容,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息挖掘 数据概述: 该数据集包含来自BBC新闻网站的文章数据,记录了BBC发布的各类新闻文章的文本内容和相关信息。主要特征如下:...
    packageimg
  • 矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir

    2025年4月23日   

    矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir 数据来源:互联网公开数据 标签:自然语言处理,矛盾检测,数据集,人工智能,机器学习,文本分析,情感分析,多语言支持 数据概述: 该数据集为Contradictory My Dear...
    packageimg
  • 词典数据集LexiconDataDataset-cakrulgaming

    2025年4月23日   

    词典数据集LexiconDataDataset-cakrulgaming 数据来源:互联网公开数据 标签:词典,数据集,自然语言处理,语言学,词汇研究,文本分析,教育,机器学习 数据概述: 该数据集包含来自多个来源的词典数据,记录了大量词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 新闻标题数据集

    2025年4月23日   

    新闻标题数据集 数据来源:互联网公开数据 标签:新闻,媒体,时间序列,新闻分析,行业趋势,数据挖掘,文本分析 数据概述: 本数据集包含了约140万条新闻标题,数据来源为《华尔街日报》和《华盛顿邮报》,时间范围覆盖2011年至2022年。数据集中的每条记录包含新闻标题、相关标签、发布时间和新闻链接,为研究新闻内容及其传播趋势提供了丰富的基础数据支持。...
    packageimg
  • Reddit帖子互动预测评论数据集-2005至2019年-kashyapgohil

    2025年4月23日   

    Reddit帖子互动预测评论数据集-2005至2019年-kashyapgohil 数据来源:互联网公开数据 标签:Reddit,社交媒体,帖子,评论,互动,预测,文本分析,时间序列,机器学习 数据概述: 本数据集包含来自Reddit平台的帖子评论数据,用于预测帖子受欢迎程度。...
    packageimg
  • 英文标点符号识别与光学字符识别数据集Punctuation-EN-OCRDataset-thnhhunhtn

    2025年4月23日   

    英文标点符号识别与光学字符识别数据集Punctuation-EN-OCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:自然语言处理,光学字符识别,数据集,文本分析,机器学习,计算机视觉,语言技术,符号识别 数据概述:...
    packageimg
  • 智能问答聊天机器人训练与评估数据集QAChatbotDataset-arhamyousufzai

    2025年4月23日   

    智能问答聊天机器人训练与评估数据集QAChatbotDataset-arhamyousufzai 数据来源:互联网公开数据 标签:自然语言处理,智能客服,数据集,机器学习,对话系统,文本分析,人工智能,对话训练 数据概述: 该数据集包含用于训练和评估智能问答聊天机器人的对话数据,记录了用户与机器人之间的问答交互内容。主要特征如下:...
    packageimg
  • 开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya

    2025年4月23日   

    开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya 数据来源:互联网公开数据 标签:开放域问答,数据集,三语翻译,自然语言处理,机器学习,信息检索,多语言处理,文本分析...
    packageimg
  • 消费者评论数据集CustomersReviewsDataset-akritiipaudel

    2025年4月23日   

    消费者评论数据集CustomersReviewsDataset-akritiipaudel 数据来源:互联网公开数据 标签:消费者评论,数据集,文本分析,情感分析,机器学习,自然语言处理,市场研究,用户体验 数据概述: 该数据集包含来自电商平台,社交媒体等渠道的消费者评论数据,记录了用户对产品或服务的评价。主要特征如下:...
    packageimg
  • 阿拉伯语假新闻与真新闻文章数据集-shyakanobledavid

    2025年4月23日   

    阿拉伯语假新闻与真新闻文章数据集-shyakanobledavid 数据来源:互联网公开数据 标签:阿拉伯语,假新闻,真新闻,新闻,文本分析,机器学习,数据预处理 数据概述: 本数据集由多个流行的阿拉伯语新闻网站抓取,包括Misbar(https://misbar.com/)、No...
    packageimg