找到11,747个数据集

标签: 自然语言处理

过滤结果
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan

    2025年4月24日   

    乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan 数据来源:互联网公开数据 标签:诗歌,乌尔都语,罗马体,文本分析,自然语言处理,语言学,数据集,文化研究 数据概述: 该数据集包含了用罗马字母转写的乌尔都语诗歌,旨在促进乌尔都语诗歌的文本分析和研究。主要特征如下: 时间跨度:...
    packageimg
  • 数据科学问答LLM微调数据集DataScienceQ-ALLMFine-TuningDataset-divyangmandal

    2025年4月24日   

    数据科学问答LLM微调数据集DataScienceQ-ALLMFine-TuningDataset-divyangmandal 数据来源:互联网公开数据 标签:数据科学,问答系统,微调,机器学习,自然语言处理,数据集,人工智能,语言模型...
    packageimg
  • 手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth

    2025年4月24日   

    手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth 数据来源:互联网公开数据 标签:电子产品,手机,数据集,文本分析,自然语言处理,产品描述,市场研究,信息提取 数据概述: 该数据集包含来自多个电商平台和手机品牌官方网站的手机产品描述数据,记录了各类手机产品的详细信息。主要特征如下:...
    packageimg
  • 医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav

    2025年4月24日   

    医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav 数据来源:互联网公开数据 标签:医疗,转录,临床,文本分析,自然语言处理,数据集,健康,医学 数据概述: 该数据集包含来自MT Samples的临床转录数据,记录了医疗领域的各种临床报告和病历。主要特征如下:...
    packageimg
  • 邮件分类数据集EmailCategoriesDataset-tobniislam

    2025年4月24日   

    邮件分类数据集EmailCategoriesDataset-tobniislam 数据来源:互联网公开数据 标签:邮件分类,文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自不同来源的电子邮件数据,旨在用于邮件分类和文本分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,取决于具体来源。...
    packageimg
  • 句子嵌入表示数据集SentenceEmbeddingDataset-dm4006

    2025年4月24日   

    句子嵌入表示数据集SentenceEmbeddingDataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,深度学习,语义检索,信息提取,人工智能 数据概述: 该数据集包含大量的句子及其对应的嵌入向量表示,记录了文本数据通过特定算法生成的向量特征。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran 数据来源:互联网公开数据 标签:新闻,虚假信息,自然语言处理,文本分类,机器学习,情感分析,社交媒体,信息安全 数据概述: 该数据集包含经过预处理并使用GloVe词嵌入的虚假新闻检测数据,记录了新闻文章的文本内容及其真实性标签。主要特征如下:...
    packageimg
  • 沐浴露与香皂产品评论数据集-aritropaul

    2025年4月24日   

    沐浴露与香皂产品评论数据集-aritropaul 数据来源:互联网公开数据 标签:产品评论,沐浴露,香皂,情感分析,自然语言处理,消费者行为,市场调研,文本挖掘 数据概述: 该数据集包含来自电商平台和社交媒体的沐浴露和香皂产品评论数据,记录了用户对产品的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围不确定,取决于数据来源,可能涵盖数年。...
    packageimg
  • 歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa

    2025年4月24日   

    歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa 数据来源:互联网公开数据 标签:歌词,翻译,数据集,音乐,自然语言处理,文本分析,多语言,机器翻译 数据概述: 该数据集包含了大量歌曲的歌词及其对应的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的歌曲。...
    packageimg
  • Alpaca新闻文章数据集2018-2023-prabhuanem

    2025年4月24日   

    Alpaca新闻文章数据集2018-2023-prabhuanem 数据来源:互联网公开数据 标签:新闻文章,数据集,自然语言处理,文本分析,时间序列,机器学习,新闻媒体,金融 数据概述:该数据集包含来自 Alpaca 平台的新闻文章数据,记录了自2018年至2023年期间发布的新闻文章。主要特征如下:...
    packageimg
  • 超市管理自然语言到SQL转换数据集NaturalLanguagetoSQLforGroceryManagementDataset-soumyasavarn

    2025年4月24日   

    超市管理自然语言到SQL转换数据集NaturalLanguagetoSQLforGroceryManagementDataset-soumyasavarn 数据来源:互联网公开数据 标签:自然语言处理,SQL转换,数据集,超市管理,数据分析,机器学习,商业智能,零售业 数据概述:...
    packageimg
  • 古腾堡出版物订单数据集GutenbergPublicationsOrdersDataset-imumerfarooq

    2025年4月24日   

    古腾堡出版物订单数据集GutenbergPublicationsOrdersDataset-imumerfarooq 数据来源:互联网公开数据 标签:出版物,订单数据,古腾堡项目,文本分析,自然语言处理,数据集,电子书,销售分析 数据概述: 该数据集包含来自古腾堡项目(Project...
    packageimg
  • 优质评论数据集GoodStuffCommentsDataset-amazingbigtree

    2025年4月24日   

    优质评论数据集GoodStuffCommentsDataset-amazingbigtree 数据来源:互联网公开数据 标签:评论分析,社交媒体,数据集,文本挖掘,情感分析,自然语言处理,用户反馈,质量评估 数据概述:该数据集包含来自互联网公开平台的用户评论数据,记录了用户对不同产品或服务的评价和反馈。主要特征如下:...
    packageimg
  • arXiv论文分类数据集-ahmedcoolprojects

    2025年4月24日   

    arXiv论文分类数据集-ahmedcoolprojects 数据来源:互联网公开数据 标签:学术论文,arXiv,分类,自然语言处理,机器学习,文本挖掘,科研,数据集 数据概述: 该数据集包含了来自arXiv预印本服务器的学术论文数据,这些论文已按照不同的类别进行组织。主要特征如下:...
    packageimg
  • 新闻分类数据集AgNewsClassificationDataset-jatinsareen

    2025年4月24日   

    新闻分类数据集AgNewsClassificationDataset-jatinsareen 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,文本分析,机器学习,深度学习,文本挖掘,信息检索 数据概述:该数据集包含来自Ag News的数据,记录了各类新闻文章的标题和内容,适用于新闻分类和文本分析任务。主要特征如下:...
    packageimg
  • 职位描述数据分析数据集JobDescriptionsDataset-magantiit

    2025年4月24日   

    职位描述数据分析数据集JobDescriptionsDataset-magantiit 数据来源:互联网公开数据 标签:人力资源,数据集,职位分析,文本挖掘,机器学习,招聘管理,职业发展,自然语言处理 数据概述: 该数据集包含来自多个招聘平台和企业的职位描述数据,记录了不同行业和岗位的职位要求,职责描述,任职资格等信息。主要特征如下:...
    packageimg
  • 数据2023年医学多选题问答数据集Kalapa2023MedMCQADataset-thien1

    2025年4月24日   

    2023年医学多选题问答数据集Kalapa2023MedMCQADataset-thien1 数据来源:互联网公开数据 标签:医学,多选题,数据集,机器学习,自然语言处理,健康科学,教育,人工智能 数据概述:该数据集包含2023年采集的医学多选题问答数据,适用于医学教育,自然语言处理和机器学习等领域。主要特征如下:...
    packageimg
  • 课程评价数据集CourseReviewsDataset-brahimerkan

    2025年4月24日   

    课程评价数据集CourseReviewsDataset-brahimerkan 数据来源:互联网公开数据 标签:教育,数据分析,机器学习,用户反馈,课程评价,自然语言处理,教学质量,在线教育 数据概述:该数据集包含来自在线教育平台的课程评价数据,记录了用户对课程的评价内容,评分及相关信息。主要特征如下:...
    packageimg
  • 阿拉伯语情感分析数据集-ouaraskhelilrafik

    2025年4月24日   

    阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。...
    packageimg