找到11,747个数据集

标签: 自然语言处理

过滤结果
  • Twitter情感分析AniesMuhaimin2024数据集TwitterSentimentAnalysiswithAniesMuhaimin2024D...

    2025年4月24日   

    Twitter情感分析AniesMuhaimin2024数据集TwitterSentimentAnalysiswithAniesMuhaimin2024Dataset-waodeasriyani 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,机器学习,自然语言处理,政治研究,舆论分析 数据概述:...
    packageimg
  • 替换逗号数据集ReplacingCommaDataset-rojaramani

    2025年4月24日   

    替换逗号数据集ReplacingCommaDataset-rojaramani 数据来源:互联网公开数据 标签:数据清理,文本处理,数据集,自然语言处理,数据预处理,文本分析,数据科学,编程 数据概述:该数据集包含来自互联网公开的数据,记录了需要进行逗号替换的文本片段。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。...
    packageimg
  • 阿帕卡清洗数据集Bhojpuri语音数据-satyamtiwarii

    2025年4月24日   

    阿帕卡清洗数据集Bhojpuri语音数据-satyamtiwarii 数据来源:互联网公开数据 标签:语音数据,自然语言处理,机器学习,数据集,语言模型,语音识别,人工智能,语言技术 数据概述: 该数据集包含来自阿帕卡(Alpaca)项目清洗后的语音数据,记录了比哈尔普尔语(Bhojpuri)的语音样本和对应的文本内容。主要特征如下:...
    packageimg
  • 文本情感分析数据集CleanedSentimentTextDataset-vincemarcs

    2025年4月24日   

    文本情感分析数据集CleanedSentimentTextDataset-vincemarcs 数据来源:互联网公开数据 标签:情感分析,数据集,文本挖掘,自然语言处理,机器学习,数据清洗,文本分类,商业智能 数据概述: 该数据集包含经过清洗和标注的文本数据,记录了不同来源的文本内容的情感倾向。主要特征如下:...
    packageimg
  • 医疗问答数据集MedQuadQ-and-AData-sanikamal

    2025年4月24日   

    医疗问答数据集MedQuadQ-and-AData-sanikamal 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,健康咨询,机器学习,智能客服,临床辅助,医学信息 数据概述: 该数据集包含来自医疗问答平台的问答数据,记录了用户与医疗专业人士之间的互动内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 循环神经网络自然语言处理数据集RecurrentNeuralNetworkNLPDataset-jazidesigns

    2025年4月24日   

    循环神经网络自然语言处理数据集RecurrentNeuralNetworkNLPDataset-jazidesigns 数据来源:互联网公开数据 标签:自然语言处理,循环神经网络,数据集,机器学习,文本分析,深度学习,语言模型,序列建模 数据概述:...
    packageimg
  • 越南语聊天机器人数据集VietnameseChatbotDataset-huhuyngun

    2025年4月24日   

    越南语聊天机器人数据集VietnameseChatbotDataset-huhuyngun 数据来源:互联网公开数据 标签:人工智能,自然语言处理,聊天机器人,越南语,数据集,机器学习,文本分析,对话系统 数据概述: 该数据集包含来自越南语聊天机器人项目的对话数据,记录了用户与机器人之间的互动内容。主要特征如下:...
    packageimg
  • 葡萄牙旅游景点评论数据集PortuReviewsDataset-csomorbalazs

    2025年4月24日   

    葡萄牙旅游景点评论数据集PortuReviewsDataset-csomorbalazs 数据来源:互联网公开数据 标签:旅游,评论,情感分析,葡萄牙,数据集,自然语言处理,文本挖掘,用户体验 数据概述: 该数据集包含来自葡萄牙旅游景点的用户评论数据,记录了游客对不同景点的评价和体验。主要特征如下:...
    packageimg
  • 亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21

    2025年4月24日   

    亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源:互联网公开数据 标签:情感分析,罗马乌尔都语,数据集,自然语言处理,机器学习,文本分析,亚马逊评论,语言学 数据概述: 该数据集包含了来自亚马逊的罗马乌尔都语评论数据,用于情感分析任务。主要特征如下: 时间跨度: 数据记录时间跨度未知,但包含了亚马逊用户在一定时期内发表的评论。...
    packageimg
  • 可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit

    2025年4月24日   

    可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源:互联网公开数据 标签:文本分析,可读性评估,数据集,自然语言处理,教育研究,机器学习,语料库,语言技术 数据概述: 该数据集包含用于可读性评估的文本数据,记录了多种不同难度级别的文本样本。主要特征如下: 时间跨度:...
    packageimg
  • 电影相似度搜索数据集PopularMoviesSimilaritySearchDataset-omgits0mar

    2025年4月24日   

    电影相似度搜索数据集PopularMoviesSimilaritySearchDataset-omgits0mar 数据来源:互联网公开数据 标签:电影,数据集,推荐系统,相似度分析,自然语言处理,机器学习,娱乐分析,影视产业 数据概述: 该数据集包含来自互联网的电影数据,记录了多部受欢迎电影的详细信息及其相似度评分。主要特征如下:...
    packageimg
  • Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang

    2025年4月24日   

    Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang 数据来源:互联网公开数据 标签:问答配对,数据集,自然语言处理,文本相似度,机器学习,数据挖掘,信息检索,知识图谱 数据概述: 该数据集包含来自Quora问答平台的配对问题数据,记录了成对的问题及其相似性标签。主要特征如下:...
    packageimg
  • 垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs

    2025年4月24日   

    垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs 数据来源:互联网公开数据 标签:垃圾邮件,邮件过滤,数据集,自然语言处理,文本分类,机器学习,信息检索,垃圾邮件检测 数据概述: 该数据集包含了大量标记为垃圾邮件(spam)和正常邮件(ham)的邮件数据,主要用于垃圾邮件过滤模型的训练和评估。主要特征如下:...
    packageimg
  • 电影用户评论数据集16部电影烂番茄评论数据集-jonsteve

    2025年4月24日   

    电影用户评论数据集16部电影烂番茄评论数据集-jonsteve 数据来源:互联网公开数据 标签:电影评论,数据集,电影分析,自然语言处理,情感分析,用户反馈,电影推荐,娱乐研究 数据概述:该数据集包含来自烂番茄网站的16部电影的用户评论数据,记录了用户对这些电影的具体评价和评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil

    2025年4月24日   

    医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil 数据来源:互联网公开数据 标签:医疗对话,自然语言处理,数据集,医疗AI,临床分析,机器学习,健康咨询,对话系统 数据概述: 该数据集包含来自医疗场景的医生与患者对话记录,记录了医生与患者之间的交流内容。主要特征如下:...
    packageimg
  • 自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk

    2025年4月24日   

    自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,文本分析,机器学习,人工智能,语言模型,对比研究 数据概述:...
    packageimg
  • YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty

    2025年4月24日   

    YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty 数据来源:互联网公开数据 标签:视频字幕,数据集,自然语言处理,文本分析,机器学习,数据挖掘,多媒体,人工智能 数据概述: 该数据集包含来自YouTube平台的视频字幕数据,记录了视频内容的文字转录信息。主要特征如下:...
    packageimg
  • 法律领域分类数据集LegalAreasClassificationDataset-mohit3430

    2025年4月24日   

    法律领域分类数据集LegalAreasClassificationDataset-mohit3430 数据来源:互联网公开数据 标签:法律,数据集,分类,机器学习,自然语言处理,文本分析,人工智能,法律研究 数据概述: 该数据集包含来自法律领域的文本数据,记录了不同法律领域的案例,法规和判决等信息。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra

    2025年4月24日   

    电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据集,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自 UCI 机器学习数据库的电子邮件数据,用于垃圾邮件过滤研究。主要特征如下: 时间跨度:数据记录时间不明确,但可推断为收集于互联网早期。...
    packageimg
  • 深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh

    2025年4月24日   

    深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh 数据来源:互联网公开数据 标签:自然语言处理,深度学习,数据集,文本分析,机器学习,语言模型,文本分类,情感分析 数据概述:该数据集包含用于自然语言处理的深度学习模型训练和评估的数据,记录了多种文本类型和任务的数据。主要特征如下:...
    packageimg