找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 傲慢与偏见文本数据集PrideandPrejudiceCleanDataset-theeranartmeesathien

    2025年4月24日   

    傲慢与偏见文本数据集PrideandPrejudiceCleanDataset-theeranartmeesathien 数据来源:互联网公开数据 标签:文本分析,文学作品,数据集,自然语言处理,情感分析,机器学习,英语文学,机器学习 数据概述: 该数据集包含来自《傲慢与偏见》这本经典文学作品的文本数据,记录了小说的完整内容。主要特征如下:...
    packageimg
  • 泰国身份证号码识别数据集-pharisitalee

    2025年4月24日   

    泰国身份证号码识别数据集-pharisitalee 数据来源:互联网公开数据 标签:泰国,身份证号码,身份识别,数据集,自然语言处理,机器学习,文本分析,信息安全 数据概述: 该数据集包含泰国的身份证号码及其相关信息,用于身份识别和验证。主要特征如下: 时间跨度:数据记录的时间范围为不特定,主要为现有身份证信息。 地理范围:数据覆盖泰国全境。...
    packageimg
  • 欢乐朋友们对话数据集-jahysama

    2025年4月24日   

    欢乐朋友们对话数据集-jahysama 数据来源:互联网公开数据 标签:欢乐朋友们,对话,剧本,自然语言处理,NLP,电视剧,娱乐,文本数据 数据概述: 本数据集包含电视剧《欢乐朋友们》(Smiling...
    packageimg
  • 维基百科句子数据集WikiSentencesDataset-sgedela

    2025年4月24日   

    维基百科句子数据集WikiSentencesDataset-sgedela 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,句子,语言模型,文本分析,机器学习,语料库 数据概述:该数据集包含来自维基百科的句子数据,旨在为自然语言处理任务提供高质量的文本语料库。主要特征如下:...
    packageimg
  • 越南法律文本嵌入数据集VietnamLawTextEmbeddingDataset-trungmac

    2025年4月24日   

    越南法律文本嵌入数据集VietnamLawTextEmbeddingDataset-trungmac 数据来源:互联网公开数据 标签:法律文本,数据集,自然语言处理,文本嵌入,越南法律,机器学习,文本分析,人工智能 数据概述: 该数据集包含来自越南法律体系的文本数据,记录了越南相关法律法规的文本内容及其对应的嵌入向量。主要特征如下:...
    packageimg
  • 推特情感分析数据集TweetsFeelingsDataset-yinonhadad

    2025年4月24日   

    推特情感分析数据集TweetsFeelingsDataset-yinonhadad 数据来源:互联网公开数据 标签:推特,情感分析,数据集,自然语言处理,社交媒体,文本挖掘,机器学习,情感识别 数据概述:该数据集包含来自推特的用户评论数据,记录了用户对特定话题或事件的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。...
    packageimg
  • 美国航空公司推特数据集U-SAirlineTweetsDataset-sushilyeotiwad

    2025年4月24日   

    美国航空公司推特数据集U-SAirlineTweetsDataset-sushilyeotiwad 数据来源:互联网公开数据 标签:推特数据,社交媒体,航空公司,客户服务,用户体验,情感分析,自然语言处理,数据挖掘 数据概述: 该数据集包含来自美国各大航空公司的推特数据,记录了用户在推特平台上发表的与航空公司相关的评论和反馈。主要特征如下:...
    packageimg
  • 英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya

    2025年4月24日   

    英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya 数据来源:互联网公开数据 标签:英语翻译,约鲁巴语,数据集,自然语言处理,机器学习,语言学,人工智能,文本翻译 数据概述: 该数据集包含来自互联网的英语到约鲁巴语的翻译数据,记录了多种主题的英语文本及其对应的约鲁巴语翻译。主要特征如下:...
    packageimg
  • 字幕分析数据集SubtitleAnalysisDataset-bhagvendersingh

    2025年4月24日   

    字幕分析数据集SubtitleAnalysisDataset-bhagvendersingh 数据来源:互联网公开数据 标签:字幕,数据集,文本分析,自然语言处理,机器学习,视频内容分析,语言学,文本挖掘 数据概述:该数据集包含来自多个视频平台的字幕数据,记录了不同视频内容的字幕文本,适用于文本分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers

    2025年4月24日   

    中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,中文分词,数据集,文本分析,机器学习,语言处理,NLP,中文处理 数据概述: 该数据集包含中文文本的分词数据,记录了从01月01日到03月31日之间的中文文本的分词结果。主要特征如下:...
    packageimg
  • 社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel

    2025年4月24日   

    社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel 数据来源:互联网公开数据 标签:种族歧视,言论分析,自然语言处理,数据集,文本分类,情感分析,社交媒体,人工智能 数据概述: 该数据集包含来自社交媒体平台的种族歧视言论数据,旨在用于研究和分析种族歧视言论的识别与处理。主要特征如下:...
    packageimg
  • 药物评论情感分析数据集

    2025年4月24日   

    药物评论情感分析数据集 数据来源:互联网公开数据 标签:药物评论,情感分析,自然语言处理,机器学习,分类模型,文本分析,用户反馈 数据概述:...
    packageimg
  • 招聘信息文本分析数据集-harsh221upadhyay

    2025年4月24日   

    招聘信息文本分析数据集-harsh221upadhyay 数据来源:互联网公开数据 标签:招聘,职位描述,自然语言处理,文本分析,机器学习,行业分析,人才市场,数据挖掘 数据概述: 该数据集包含了来自互联网的招聘信息文本数据,主要记录了各类职位的详细描述。主要特征如下: 时间跨度: 数据记录的时间范围为近期,具体时间跨度取决于数据来源的更新频率。...
    packageimg
  • 斯坦福问答数据集SQuAD-donutkashvi

    2025年4月24日   

    斯坦福问答数据集SQuAD-donutkashvi 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器阅读理解,文本理解,深度学习,人工智能,NLP 数据概述: 该数据集包含了斯坦福大学开发的问答数据集,用于评估机器阅读理解能力。主要特征如下:...
    packageimg
  • 服装商店聊天机器人数据集-quangnguyen711

    2025年4月24日   

    服装商店聊天机器人数据集-quangnguyen711 数据来源:互联网公开数据 标签:聊天机器人,服装,数据集,自然语言处理,文本分析,客户服务,机器学习,对话系统 数据概述: 该数据集包含服装商店聊天机器人的对话记录,记录了用户与聊天机器人之间的互动,旨在用于训练和评估聊天机器人的性能。主要特征如下:...
    packageimg
  • 印地语音译数据集HindiTransliterationDataset-omkartupe

    2025年4月24日   

    印地语音译数据集HindiTransliterationDataset-omkartupe 数据来源:互联网公开数据 标签:印地语,音译,数据集,语言处理,机器学习,文本分析,自然语言处理,语音识别 数据概述: 该数据集包含印地语单词的音译数据,记录了印地语单词及其对应的罗马音译版本。主要特征如下:...
    packageimg
  • 自然语言处理作业三测试数据集-hangman1998

    2025年4月24日   

    自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。...
    packageimg
  • 医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34

    2025年4月24日   

    医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34 数据来源:互联网公开数据 标签:医疗,GPT,问答,数据集,自然语言处理,医学,知识图谱,文本生成 数据概述: 该数据集包含了从互联网上抓取的医疗相关问答数据,旨在用于训练和评估GPT模型在医疗领域的应用。主要特征如下:...
    packageimg
  • 推文情感分析数据集TweetSentimentAnalysisDataset-itoeiji

    2025年4月24日   

    推文情感分析数据集TweetSentimentAnalysisDataset-itoeiji 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,机器学习,自然语言处理,文本分类,数据挖掘,人工智能 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的内容及其情感倾向。主要特征如下:...
    packageimg
  • Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADatas...

    2025年4月24日   

    Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADataset-alvations 数据来源:互联网公开数据 标签:自然语言处理,同义改写,数据集,机器学习,语义分析,文本生成,问答系统,数据挖掘 数据概述:...
    packageimg