找到11,770个数据集

标签: 自然语言处理

过滤结果
  • Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544

    2025年4月25日   

    Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544 数据来源:互联网公开数据 标签:笑话,数据集,社交媒体,文本分析,自然语言处理,情感分析,娱乐内容,数据分析 数据概述: 该数据集包含来自Reddit平台的清洁笑话数据,记录了用户发布的无冒犯内容的笑话。主要特征如下:...
    packageimg
  • 医学评论文本情感分析数据集-deepalighodki

    2025年4月25日   

    医学评论文本情感分析数据集-deepalighodki 数据来源:互联网公开数据 标签:医学,评论,情感分析,文本挖掘,自然语言处理,医疗健康,机器学习,NLP 数据概述: 该数据集包含了来自互联网的医学评论文本数据,主要记录了患者对医疗服务,药物疗效,医生评价等方面的反馈。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于评论的发布时间。...
    packageimg
  • 城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema

    2025年4月25日   

    城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban...
    packageimg
  • 书籍推荐数据集BXBookDataset-alizaynoor

    2025年4月25日   

    书籍推荐数据集BXBookDataset-alizaynoor 数据来源:互联网公开数据 标签:书籍,图书,推荐系统,数据集,用户行为,文本分析,自然语言处理,机器学习 数据概述: 该数据集包含来自BX Book数据集的书籍和用户行为数据,记录了用户的书籍阅读和评分信息。主要特征如下: 时间跨度:数据记录的时间范围为2002年之前。...
    packageimg
  • 新闻标签生成与人工评估数据集NewsTagsGenerationandHumanEvaluationDataset-nonyakangwanteerawat

    2025年4月25日   

    新闻标签生成与人工评估数据集NewsTagsGenerationandHumanEvaluationDataset-nonyakangwanteerawat 数据来源:互联网公开数据 标签:新闻分析,标签生成,数据集,自然语言处理,文本挖掘,机器学习,新闻分类,人工智能 数据概述:...
    packageimg
  • 电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-chalikamihiran

    2025年4月25日   

    电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-chalikamihiran 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本挖掘,机器学习,数据科学,情感分类 数据概述:该数据集包含来自互联网的电影评论数据,记录了用户对电影的评价和情感倾向。主要特征如下:...
    packageimg
  • 伊朗波斯语文本数据集PersianDatasetIR-amirali10281

    2025年4月25日   

    伊朗波斯语文本数据集PersianDatasetIR-amirali10281 数据来源:互联网公开数据 标签:波斯语,文本分析,自然语言处理,数据集,信息检索,情感分析,语言模型,机器学习 数据概述: 该数据集包含来自伊朗的波斯语文本数据,涵盖了多种来源和主题。主要特征如下:...
    packageimg
  • COVID-19论文摘要标注数据集COVID-19AnnotatedAbstractsDataset-qingxiangyan

    2025年4月25日   

    COVID-19论文摘要标注数据集COVID-19AnnotatedAbstractsDataset-qingxiangyan 数据来源:互联网公开数据 标签:COVID-19,医学研究,论文摘要,数据集,文本标注,自然语言处理,机器学习,公共卫生 数据概述:...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewDataset-davidlow

    2025年4月25日   

    亚马逊商品评论数据集AmazonProductReviewDataset-davidlow 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,自然语言处理,情感分析,机器学习,消费者行为,数据挖掘 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对各种商品的评价信息。主要特征如下:...
    packageimg
  • 代码审查文件数据集OutputChecksFilesDataset-robinlord

    2025年4月25日   

    代码审查文件数据集OutputChecksFilesDataset-robinlord 数据来源:互联网公开数据 标签:代码审查,代码质量,数据集,软件工程,机器学习,自然语言处理,文本分析,代码分析 数据概述: 该数据集包含了代码审查过程中产生的各种输出文件,主要用于分析代码质量,发现潜在缺陷以及评估代码审查的效果。主要特征如下:...
    packageimg
  • Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa

    2025年4月25日   

    Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,评论,毒性检测,情感分析,机器学习,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,包含了来自不同在线平台的评论数据,旨在用于毒性检测和情感分析等自然语言处理任务。主要特征如下:...
    packageimg
  • 保罗-科埃略炼金术士小说文本数据集-stealthtechnologies

    2025年4月25日   

    保罗-科埃略炼金术士小说文本数据集-stealthtechnologies 数据来源:互联网公开数据 标签:小说,文学,文本分析,数据集,阅读理解,情感分析,自然语言处理,语料库 数据概述: 该数据集包含保罗·科埃略创作的小说《炼金术士》的文本数据,记录了小说的完整内容。主要特征如下: 时间跨度:数据记录的时间范围为小说创作出版至今。...
    packageimg
  • CCF金融文本情感分析数据集-danielfme

    2025年4月25日   

    CCF金融文本情感分析数据集-danielfme 数据来源:互联网公开数据 标签:金融,文本分析,情感分析,自然语言处理,机器学习,数据集,中文,金融科技 数据概述: 该数据集包含来自CCF(中国计算机学会)金融领域的文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但主要反映金融领域相关的文本信息。...
    packageimg
  • 波斯语虚假新冠新闻数据集PersianFakeCoronaNewsDataset-omidsakaki1370

    2025年4月25日   

    波斯语虚假新冠新闻数据集PersianFakeCoronaNewsDataset-omidsakaki1370 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,数据挖掘,机器学习,自然语言处理,健康传播,社会媒体 数据概述: 该数据集包含来自波斯语新闻平台的新冠相关虚假新闻数据,记录了波斯语环境中关于新冠疫情的失实报道和谣言。主要特征如下:...
    packageimg
  • GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23

    2025年4月25日   

    GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据隐私,GDPR,问答系统,自然语言处理,法律合规,数据保护,机器学习,文本分析 数据概述: 该数据集包含与欧盟通用数据保护条例(GDPR)相关的问答对,用于测试和评估问答系统在数据隐私领域的性能。主要特征如下:...
    packageimg
  • 推特美国航空公司情感分析数据集TwitterUSAirlineSentimentCleanedData-railoth

    2025年4月25日   

    推特美国航空公司情感分析数据集TwitterUSAirlineSentimentCleanedData-railoth 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,机器学习,自然语言处理,航空业,文本挖掘,客户服务 数据概述:...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日   

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • Wordle游戏数据集WordleGameDataset-senorisky

    2025年4月25日   

    Wordle游戏数据集WordleGameDataset-senorisky 数据来源:互联网公开数据 标签:游戏数据,数据分析,自然语言处理,词频统计,教育研究,人工智能,语言学习,数据挖掘 数据概述: 该数据集包含来自 Wordle 游戏的历史游戏数据,记录了玩家在 Wordle 游戏中的每日猜测和结果。主要特征如下:...
    packageimg
  • GPT生成文本数据集GPT-GeneratedTextDataset-manshanand

    2025年4月25日   

    GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:...
    packageimg
  • 股票市场新闻数据集-arthuruguendemendona

    2025年4月25日   

    股票市场新闻数据集-arthuruguendemendona 数据来源:互联网公开数据 标签:股票市场,新闻,情感分析,自然语言处理,金融科技,文本分析,市场预测,机器学习 数据概述: 该数据集包含来自各种新闻来源的股票市场相关新闻文章,记录了股票市场的新闻事件和市场情绪。主要特征如下: 时间跨度:数据记录的时间范围从[起始年份]到[结束年份]。...
    packageimg