找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 聊天机器人症状描述数据集ChatbotSymptomDescriptionDataset-rohitadnaik

    2025年4月24日   

    聊天机器人症状描述数据集ChatbotSymptomDescriptionDataset-rohitadnaik 数据来源:互联网公开数据 标签:人工智能,症状描述,数据集,自然语言处理,机器学习,医疗辅助,聊天机器人,健康咨询 数据概述:该数据集包含来自聊天机器人的症状描述数据,记录了用户输入的症状描述信息。主要特征如下:...
    packageimg
  • 社交媒体用户情感分析数据集GeneratedDataSample1-SocialMediaUserSentimentAnalysisDataset-akshat1221

    2025年4月24日   

    社交媒体用户情感分析数据集GeneratedDataSample1-SocialMediaUserSentimentAnalysisDataset-akshat1221 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本挖掘,自然语言处理,机器学习,用户行为,情感分类,数据分析 数据概述:...
    packageimg
  • 食品评论情感分析数据集-cngkhutnguyn

    2025年4月24日   

    食品评论情感分析数据集-cngkhutnguyn 数据来源:互联网公开数据 标签:情感分析,食品评论,自然语言处理,文本挖掘,机器学习,评论数据,中文,消费者行为 数据概述: 该数据集包含来自各种来源的食品评论数据,主要记录了用户对不同食品的评价和情感倾向。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于数据来源,涵盖了不同时间段的食品评论。...
    packageimg
  • 垃圾邮件与正常邮件分类数据集-邮件内容与标签-israkhasanjone

    2025年4月24日   

    垃圾邮件与正常邮件分类数据集-邮件内容与标签-israkhasanjone 数据来源:互联网公开数据 标签:邮件,垃圾邮件,正常邮件,文本分类,自然语言处理,机器学习,文本数据 数据概述:...
    packageimg
  • 大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad

    2025年4月24日   

    大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:...
    packageimg
  • 动物评论情感分析数据集-victoromole

    2025年4月24日   

    动物评论情感分析数据集-victoromole 数据来源:互联网公开数据 标签:动物,评论,情感分析,自然语言处理,文本挖掘,数据集,机器学习,舆情分析 数据概述: 该数据集包含了关于动物的评论数据,旨在用于情感分析研究。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但包含了大量最新的评论数据。 地理范围:...
    packageimg
  • 案例分析文本数据集AnliDataset-lkyande

    2025年4月24日   

    案例分析文本数据集AnliDataset-lkyande 数据来源:互联网公开数据 标签:案例分析,文本数据,自然语言处理,法律文本,数据分析,机器学习,法律研究,文本挖掘 数据概述:该数据集包含来自多个法律案例的文本数据,记录了详细的案例信息,适用于案例分析,文本挖掘和自然语言处理等任务。主要特征如下:...
    packageimg
  • 专利摘要数据集PatentAbstractsDataset-somnath796

    2025年4月24日   

    专利摘要数据集PatentAbstractsDataset-somnath796 数据来源:互联网公开数据 标签:专利,摘要,数据集,知识产权,技术分析,机器学习,自然语言处理,科学研究 数据概述:该数据集包含来自专利机构的专利摘要数据,记录了全球各地专利申请的详细摘要信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 推特过滤数据集TwitterFilteredDataset-kaggledatasettbd

    2025年4月24日   

    推特过滤数据集TwitterFilteredDataset-kaggledatasettbd 数据来源:互联网公开数据 标签:社交媒体,推特,数据集,文本分析,自然语言处理,情感分析,机器学习,舆情分析 数据概述: 该数据集包含经过过滤的推特(Twitter)数据,旨在为文本分析和自然语言处理任务提供支持。主要特征如下:...
    packageimg
  • 维基百科表格问答数据集-thedevastator

    2025年4月24日   

    维基百科表格问答数据集-thedevastator 数据来源:互联网公开数据 标签:表格问答,自然语言处理,人工智能,数据科学,复杂问题,维基百科,半结构化数据 数据概述:...
    packageimg
  • 多选题数据集-肖恩MCQ-Shaun-shaunshibu

    2025年4月24日   

    多选题数据集-肖恩MCQ-Shaun-shaunshibu 数据来源:互联网公开数据 标签:多选题,数据集,教育,考试,机器学习,自然语言处理,文本分析,认知科学 数据概述: 该数据集包含来自肖恩(Shaun)的多选题数据,主要用于评估和分析多选题的生成,解答和评估过程。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于原始数据的收集时间。...
    packageimg
  • 推特机器人检测数据集TwitterBotsDetectionDataset-alyalsayed

    2025年4月24日   

    推特机器人检测数据集TwitterBotsDetectionDataset-alyalsayed 数据来源:互联网公开数据 标签:社交媒体,机器人检测,数据集,自然语言处理,机器学习,文本分析,人工智能,舆情分析 数据概述: 该数据集包含了来自推特平台的用户数据,旨在用于推特机器人(Twitter Bots)的检测与分析。主要特征如下:...
    packageimg
  • 机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh

    2025年4月24日   

    机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh 数据来源:互联网公开数据 标签:机器学习,问答系统,印地语,数据集,自然语言处理,文本预处理,多语言处理,语言模型 数据概述: 该数据集包含来自机器学习与问答系统(MLQA)项目的印地语数据,记录了经过预处理的印地语文本内容。主要特征如下:...
    packageimg
  • AlpacaGPT-4指令跟随推理数据集-2023-thedevastator

    2025年4月24日   

    AlpacaGPT-4指令跟随推理数据集-2023-thedevastator 数据来源:互联网公开数据 标签:NLP,指令跟随,自然语言处理,机器学习,研究,教育,人工智能,科学,推理 数据概述:...
    packageimg
  • 中国互联网新闻文本情感分析数据集-2019年-asd336655

    2025年4月24日   

    中国互联网新闻文本情感分析数据集-2019年-asd336655 数据来源:互联网公开数据 标签:新闻,情感分析,文本挖掘,自然语言处理,舆情分析,中文,社会,媒体 数据概述:...
    packageimg
  • 数据2020天池NLP中文文本分类竞赛数据集-jt120lz

    2025年4月24日   

    2020天池NLP中文文本分类竞赛数据集-jt120lz 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,中文,NLP竞赛,情感分析,语义理解 数据概述: 该数据集来自2020年天池平台举办的NLP(自然语言处理)中文文本分类竞赛,记录了中文文本数据及其对应的类别标签。主要特征如下:...
    packageimg
  • 美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit

    2025年4月24日   

    美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit 数据来源:互联网公开数据 标签:新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻学,媒体研究,社会研究 数据概述:该数据集包含来自美国国家公共电台(NPR)的新闻数据,记录了NPR发布的新闻文章和广播节目的详细信息。主要特征如下:...
    packageimg
  • Goodreads书籍信息数据集-ashishjangra27

    2025年4月24日   

    Goodreads书籍信息数据集-ashishjangra27 数据来源:互联网公开数据 标签:书籍,阅读,数据集,文学,评论,评分,推荐系统,自然语言处理 数据概述: 该数据集包含来自Goodreads网站的书籍信息,记录了书籍的详细描述,用户评论,评分等数据。主要特征如下:...
    packageimg
  • 西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd

    2025年4月24日   

    西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd 数据来源:互联网公开数据 标签:音乐,歌词,数据集,语言分析,自然语言处理,文化研究,机器学习,多语言 数据概述: 该数据集包含来自互联网公开渠道的西班牙语歌曲歌词数据,记录了多种西班牙语歌曲的歌词文本。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集-英语电影评论-32万条-多维度标注

    2025年4月24日   

    电影评论情感分析数据集-英语电影评论-32万条-多维度标注 数据来源:互联网公开数据 标签:电影评论,情感分析,文本数据,电影,评论,情感,自然语言处理,机器学习,英语,电影数据 数据概述:...
    packageimg