找到11,983个数据集

标签: 自然语言处理

过滤结果
  • 电影评论情感分析数据集IMDb50kMovieReviewsDataset-muhammadakber

    2025年4月22日   

    电影评论情感分析数据集IMDb50kMovieReviewsDataset-muhammadakber 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,计算机科学,数据挖掘 数据概述:...
    packageimg
  • 猫途鹰酒店评论数据集TripAdvisorHotelReviewsDataset-rithikkotha

    2025年4月22日   

    猫途鹰酒店评论数据集TripAdvisorHotelReviewsDataset-rithikkotha 数据来源:互联网公开数据 标签:酒店评论,情感分析,文本挖掘,自然语言处理,数据集,旅游,客户体验,机器学习 数据概述: 该数据集包含来自猫途鹰(TripAdvisor)网站的酒店评论数据,记录了用户对酒店的评价信息。主要特征如下:...
    packageimg
  • 雅虎新闻分类数据集YahooNewsModifiedDataset-rupeshsahoo123

    2025年4月22日   

    雅虎新闻分类数据集YahooNewsModifiedDataset-rupeshsahoo123 数据来源:互联网公开数据 标签:新闻分类,文本分析,自然语言处理,机器学习,数据集,信息检索,文本挖掘,人工智能 数据概述: 该数据集包含来自雅虎新闻平台修改后的新闻文章数据,记录了新闻内容及其分类标签。主要特征如下:...
    packageimg
  • 大型语言模型偏见评估数据集-年龄歧视-外貌-职业-国籍与机构偏见-GenAssocBias-mozaman36

    2025年4月22日   

    大型语言模型偏见评估数据集-年龄歧视-外貌-职业-国籍与机构偏见-GenAssocBias-mozaman36 数据来源:互联网公开数据 标签:大型语言模型,偏见,刻板印象,年龄歧视,外貌,职业,国籍,机构偏见,多选题,自然语言处理,人工智能 数据概述:...
    packageimg
  • 亚马逊客户产品评价情感分类数据集-2021年-uday756

    2025年4月22日   

    亚马逊客户产品评价情感分类数据集-2021年-uday756 数据来源:互联网公开数据 标签:亚马逊,客户评价,情感分析,产品评价,自然语言处理,NLP,文本分类 数据概述:...
    packageimg
  • 泰米尔语情感分析数据集EmotionAnalysisinTamilDataset-pikachu2001

    2025年4月22日   

    泰米尔语情感分析数据集EmotionAnalysisinTamilDataset-pikachu2001 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,泰米尔语,文本分析,人工智能,语言学 数据概述:...
    packageimg
  • AI语言理解用户答题数据集-2023-nestormichaelctiglao

    2025年4月22日   

    AI语言理解用户答题数据集-2023-nestormichaelctiglao 数据来源:互联网公开数据 标签:AI理解,用户答题,文本理解,知识组件,教育数据,机器学习,自然语言处理,教育评估 数据概述:...
    packageimg
  • 代码混合数据集CodeMixData-shankhad

    2025年4月22日   

    代码混合数据集CodeMixData-shankhad 数据来源:互联网公开数据 标签:代码,编程,数据集,自然语言处理,机器学习,代码生成,多语言,软件工程 数据概述: 该数据集包含来自多种编程语言的代码片段和相关文本描述,旨在支持代码生成,代码理解和代码翻译等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要基于公开的代码库和文档。...
    packageimg
  • 癌症治疗文本数据集CancerTreatment1500TextsDataset-luchsmann

    2025年4月22日   

    癌症治疗文本数据集CancerTreatment1500TextsDataset-luchsmann 数据来源:互联网公开数据 标签:癌症治疗,医学文献,数据集,文本分析,自然语言处理,生物医学研究,临床数据,学术资源 数据概述:该数据集包含来自Pubmed的1500篇癌症治疗相关文献的文本数据,记录了各种癌症治疗的研究成果和临床应用。主要特征如下:...
    packageimg
  • 垃圾邮件过滤数据集SpamFilterDataset-jordanhillnmtafe

    2025年4月22日   

    垃圾邮件过滤数据集SpamFilterDataset-jordanhillnmtafe 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,机器学习,自然语言处理,邮件过滤,信息安全,朴素贝叶斯 数据概述: 该数据集包含大量的电子邮件数据,用于训练和测试垃圾邮件过滤模型。主要特征如下:...
    packageimg
  • 自然语言处理与安全对话系统实验室NLP-SDS-Lab-V数据集-vikash1a2b3c

    2025年4月22日   

    自然语言处理与安全对话系统实验室NLP-SDS-Lab-V数据集-vikash1a2b3c 数据来源:互联网公开数据 标签:自然语言处理,安全对话系统,数据集,人工智能,机器学习,文本分析,对话系统,语言技术 数据概述: 该数据集由NLP-SDS-Lab项目提供,记录了用于安全对话系统开发的自然语言处理数据。主要特征如下:...
    packageimg
  • 有毒评论检测数据集ToxicCommentDetectionDataset-maksiamiogan

    2025年4月22日   

    有毒评论检测数据集ToxicCommentDetectionDataset-maksiamiogan 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,数据集,机器学习,文本分类,社交媒体,文本分析,人工智能 数据概述:该数据集来自Kaggle社区,主要记录了社交媒体平台上的评论数据,适用于有毒评论检测,文本分类等任务。主要特征如下:...
    packageimg
  • 自然语言处理低序列数据清洗数据集NLPLowSequenceDataCleaningDataset-chadudupubharath

    2025年4月22日   

    自然语言处理低序列数据清洗数据集NLPLowSequenceDataCleaningDataset-chadudupubharath 数据来源:互联网公开数据 标签:自然语言处理,文本清洗,数据集,序列数据,机器学习,文本挖掘,数据预处理,低资源 数据概述:...
    packageimg
  • 隐私测试法律案例数据集-minhnguyendichnhat

    2025年4月22日   

    隐私测试法律案例数据集-minhnguyendichnhat 数据来源:互联网公开数据 标签:法律案例,隐私保护,数据集,法律研究,隐私法,机器学习,自然语言处理,文本分析 数据概述: 该数据集包含来自不同来源的法律案例,主要涉及隐私保护相关的法律问题。主要特征如下: 时间跨度: 数据记录的时间范围为近年来,涵盖了最新的法律案例。 地理范围:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechTrawlforTrollDataset-sanghviharshil

    2025年4月22日   

    社交媒体仇恨言论检测数据集HateSpeechTrawlforTrollDataset-sanghviharshil 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,数据集,自然语言处理,文本分析,机器学习,情感分析,舆情监测 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与分析。主要特征如下:...
    packageimg
  • Yektanet波斯语网页文本主题分类数据集

    2025年4月22日   

    Yektanet波斯语网页文本主题分类数据集 数据来源:互联网公开数据 标签:波斯语,NLP,文本分类,机器学习,网页数据,主题识别,自然语言处理 数据概述:...
    packageimg
  • 姓名发音性别预测数据集-amritvirsinghx

    2025年4月22日   

    姓名发音性别预测数据集-amritvirsinghx 数据来源:互联网公开数据 标签:姓名,发音,性别预测,自然语言处理,机器学习,语音识别,数据挖掘,语言学 数据概述: 本数据集包含超过1000个姓名及其对应的性别信息,旨在为基于发音的性别预测研究提供数据支持。数据内容涵盖了不同文化背景下的姓名,为模型训练提供了多样化的样本。 数据用途概述:...
    packageimg
  • 大型语言模型银行测试数据集LLMBanking77TestDataset-datasontran

    2025年4月22日   

    大型语言模型银行测试数据集LLMBanking77TestDataset-datasontran 数据来源:互联网公开数据 标签:大型语言模型,银行业务,数据集,自然语言处理,机器学习,测试数据,金融分析,人工智能 数据概述:该数据集包含来自多个银行机构的业务数据,主要用于大型语言模型在银行业务场景中的测试和评估。主要特征如下:...
    packageimg
  • IMDb电影评论情感分析数据集IMDbMovieSentimentsDataset-guraseessingh07

    2025年4月22日   

    IMDb电影评论情感分析数据集IMDbMovieSentimentsDataset-guraseessingh07 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述:...
    packageimg
  • Medium数据科学文章统计分析数据集-2020-2021-evgenyparenchenkov

    2025年4月22日   

    Medium数据科学文章统计分析数据集-2020-2021-evgenyparenchenkov 数据来源:互联网公开数据 标签:Medium,数据科学,文章分析,自然语言处理,文本挖掘,统计分析,时间序列,Kaggle 数据概述: 本数据集整合了2020年和2021年期间Medium平台上关于数据科学领域的文章数据。原始数据由Vinicius...
    packageimg