找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy

    2025年4月24日   

    合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:...
    packageimg
  • 数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

    2025年4月24日   

    2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07

    2025年4月24日   

    改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:...
    packageimg
  • 数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag

    2025年4月24日   

    数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag 数据来源:互联网公开数据 标签:数学竞赛,解题,API,数据集,人工智能,自然语言处理,数学建模,编程 数据概述: 该数据集包含通过API解决数学竞赛问题的相关数据,记录了使用API解答数学竞赛试题的过程和结果。主要特征如下:...
    packageimg
  • LLM文本检测数据集-wcylxh

    2025年4月24日   

    LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 飞机航班评价与情感分析数据集AirplaneTweetsDataset-abdelrahmangamil

    2025年4月24日   

    飞机航班评价与情感分析数据集AirplaneTweetsDataset-abdelrahmangamil 数据来源:互联网公开数据 标签:航空业,社交媒体,数据集,情感分析,文本挖掘,机器学习,客户服务,自然语言处理 数据概述: 该数据集包含来自Twitter平台关于飞机航班的用户评价和反馈数据,记录了乘客对航班服务的情感态度和具体评价。主要特征如下:...
    packageimg
  • 疾病诊断信息数据集DiagnosisMessageDataset-zenbot99

    2025年4月24日   

    疾病诊断信息数据集DiagnosisMessageDataset-zenbot99 数据来源:互联网公开数据 标签:医疗健康,诊断信息,数据集,临床研究,机器学习,自然语言处理,医学文本,数据分析 数据概述: 该数据集包含来自医疗诊断场景的信息数据,记录了疾病诊断相关的文本或结构化信息。主要特征如下:...
    packageimg
  • 预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...

    2025年4月24日   

    预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:...
    packageimg
  • 德国2021年患者对医生评论与评分数据集

    2025年4月24日   

    德国2021年患者对医生评论与评分数据集 数据来源:互联网公开数据 标签:患者评论,医生评分,文本分类,自然语言处理,德国医疗,情感分析,机器学习,数据科学 数据概述:...
    packageimg
  • 基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14

    2025年4月24日   

    基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本生成,机器学习,数据挖掘,OpenAI,数据分析 数据概述: 该数据集包含由OpenAI模型生成的各种文本数据,涵盖了广泛的主题和应用场景。主要特征如下:...
    packageimg
  • 诗歌分类数据集PoemsCategorizationDatasets-harunshimanto

    2025年4月24日   

    诗歌分类数据集PoemsCategorizationDatasets-harunshimanto 数据来源:互联网公开数据 标签:诗歌,文本分类,自然语言处理,数据集,情感分析,文学研究,机器学习,创作风格 数据概述: 该数据集包含了各类诗歌作品,旨在用于诗歌的自动分类和分析。主要特征如下: 时间跨度:数据涵盖了不同历史时期和流派的诗歌作品。...
    packageimg
  • IMDb电影评论数据集IMDbDatasetof50kMovieReviews-sebastiancarvalho

    2025年4月24日   

    IMDb电影评论数据集IMDbDatasetof50kMovieReviews-sebastiancarvalho 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本分析,数据科学,电影研究 数据概述:该数据集包含来自IMDb的50,000条电影评论数据,记录了用户对电影的评论内容及其对应的评分。主要特征如下:...
    packageimg
  • 女性服装电商平台评价数据集WomensClothingE-commerceReviewsDataset-sreenathkk

    2025年4月24日   

    女性服装电商平台评价数据集WomensClothingE-commerceReviewsDataset-sreenathkk 数据来源:互联网公开数据 标签:电商平台,服装,消费者评价,数据集,文本分析,自然语言处理,电子商务,市场研究 数据概述: 该数据集包含来自女性服装电商平台的消费者评价数据,记录了用户对服装商品的评价信息。主要特征如下:...
    packageimg
  • 跨站脚本攻击XSS漏洞检测数据集-sergiomahia

    2025年4月24日   

    跨站脚本攻击XSS漏洞检测数据集-sergiomahia 数据来源:互联网公开数据 标签:网络安全,XSS,漏洞检测,机器学习,自然语言处理,文本分析,安全研究,威胁情报 数据概述: 该数据集包含用于检测跨站脚本攻击(XSS)漏洞的文本数据,记录了各种恶意注入的HTML/JavaScript代码片段,以及对应的标签信息。主要特征如下:...
    packageimg
  • 互联网电影评论数据集InternetMovieReviewDataset-farman029

    2025年4月24日   

    互联网电影评论数据集InternetMovieReviewDataset-farman029 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,观众反馈 数据概述: 该数据集包含来自互联网电影数据库 (IMDB) 的电影评论数据,记录了观众对电影的评价和情感倾向。主要特征如下:...
    packageimg
  • 心理治疗师问答数据集Therapist-QADataset-arnmaud

    2025年4月24日   

    心理治疗师问答数据集Therapist-QADataset-arnmaud 数据来源:互联网公开数据 标签:心理健康,问答数据,数据集,自然语言处理,临床心理学,对话系统,情感分析,人工智能 数据概述: 该数据集包含来自心理治疗师与患者之间的问答对话数据,记录了治疗过程中的关键问题和回答。主要特征如下:...
    packageimg
  • 挑战赛训练数据数据集-ali11737

    2025年4月24日   

    挑战赛训练数据数据集-ali11737 数据来源:互联网公开数据 标签:机器学习,NLP,文本分类,数据集,情感分析,自然语言处理,训练数据,竞赛 数据概述: 该数据集包含用于机器学习挑战赛的训练数据,记录了各种文本数据及其对应的标签。主要特征如下: 时间跨度:数据没有明确的时间范围,取决于挑战赛的设置。...
    packageimg
  • 印地语到印地语-英迪亚语翻译数据集HinditoHinglishTranslationDataset-parthplc

    2025年4月24日   

    印地语到印地语-英迪亚语翻译数据集HinditoHinglishTranslationDataset-parthplc 数据来源:互联网公开数据 标签:印地语,印地语-英迪亚语,数据集,自然语言处理,机器翻译,文本分析,语言学,人工智能 数据概述:该数据集包含来自多个来源的印地语到印地语-...
    packageimg
  • 汽车评论数据集Pakwheels汽车评论数据集-yourboyfaisal

    2025年4月24日   

    汽车评论数据集Pakwheels汽车评论数据集-yourboyfaisal 数据来源:互联网公开数据 标签:汽车评论,数据集,消费者反馈,汽车评测,市场分析,机器学习,自然语言处理,电子商务 数据概述: 该数据集包含来自Pakwheels网站的汽车评论数据,记录了用户对各种车型的评论和评价。主要特征如下:...
    packageimg