找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 样本索引数据集SampleIndexDataset-edmundng200

    2025年4月24日   

    样本索引数据集SampleIndexDataset-edmundng200 数据来源:互联网公开数据 标签:索引,数据集,文本分析,自然语言处理,信息检索,机器学习,数据挖掘,样本 数据概述: 该数据集包含样本索引数据,记录了文本样本与索引之间的对应关系。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于样本数据的更新频率。...
    packageimg
  • 阿拉伯语文章数据集ArabicArticleDataset-surayhan

    2025年4月24日   

    阿拉伯语文章数据集ArabicArticleDataset-surayhan 数据来源:互联网公开数据 标签:阿拉伯语,文章,数据集,自然语言处理,文本分析,机器学习,语言研究,数据挖掘 数据概述: 该数据集包含来自互联网的阿拉伯语文本,记录了各类阿拉伯语文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 美国专利商标局专利词汇数据集USPTOWordsDataset-durrivedfunktor

    2025年4月24日   

    美国专利商标局专利词汇数据集USPTOWordsDataset-durrivedfunktor 数据来源:互联网公开数据 标签:专利,词汇,数据集,文本分析,自然语言处理,知识产权,机器学习,信息检索 数据概述: 该数据集包含来自美国专利商标局(USPTO)的专利文本数据,记录了专利文件中的关键词汇和术语。主要特征如下:...
    packageimg
  • 情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98

    2025年4月24日   

    情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,情感分析,机器学习,自然语言处理,文本分类,情感不平衡,多类别分类 数据概述: 该数据集是用于情绪识别任务的文本数据集,重点关注情感类别的不平衡问题。主要特征如下: 时间跨度:...
    packageimg
  • 自然语言推理数据集MNLI数据集-nlgluong

    2025年4月24日   

    自然语言推理数据集MNLI数据集-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本分析,推理,语言模型,学术研究,深度学习 数据概述: 该数据集包含来自多领域来源的语料库,主要用于自然语言推理任务的研究。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2018年。...
    packageimg
  • 产品类型分类数据集-satishkumarmishra

    2025年4月24日   

    产品类型分类数据集-satishkumarmishra 数据来源:互联网公开数据 标签:产品分类,数据集,机器学习,文本分析,自然语言处理,电商,类别预测,数据挖掘 数据概述: 该数据集包含来自电商平台的产品信息,旨在用于产品类型的自动分类。主要特征如下: 时间跨度:数据记录的时间跨度不固定,取决于数据来源的更新频率。...
    packageimg
  • 电影评论更新数据集IMDB更新数据集-gauravpathak1789

    2025年4月24日   

    电影评论更新数据集IMDB更新数据集-gauravpathak1789 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,文本挖掘,电影分析,用户评价 数据概述:该数据集包含来自IMDB电影评论网站的更新数据,记录了用户对电影的评论及其对应的情感标签(正面或负面)。主要特征如下:...
    packageimg
  • Twitter情绪分析数据集TwitterSentimentAnalysisDataset-devalper

    2025年4月24日   

    Twitter情绪分析数据集TwitterSentimentAnalysisDataset-devalper 数据来源:互联网公开数据 标签:社交媒体,情绪分析,数据集,自然语言处理,机器学习,文本挖掘,情感计算,大数据 数据概述: 该数据集包含来自Twitter平台的数据,记录了用户发布的推文及其对应的情绪标签。主要特征如下:...
    packageimg
  • 在线性别歧视层次分类数据集HierarchicalClassificationofOnlineSexismDataset-bbiswabasuroy

    2025年4月24日   

    在线性别歧视层次分类数据集HierarchicalClassificationofOnlineSexismDataset-bbiswabasuroy 数据来源:互联网公开数据 标签:性别歧视,数据集,层次分类,社会研究,机器学习,文本分析,社会问题,自然语言处理 数据概述:...
    packageimg
  • 网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike

    2025年4月24日   

    网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike 数据来源:互联网公开数据 标签:网络欺凌,文本分析,自然语言处理,机器学习,情感分析,社交媒体,风险评估,数据挖掘 数据概述: 该数据集包含来自社交媒体平台的文本数据,旨在用于网络欺凌检测任务。主要特征如下: 时间跨度:...
    packageimg
  • 欧洲语言共同参考框架CEFR英语学习数据集-natsumii

    2025年4月24日   

    欧洲语言共同参考框架CEFR英语学习数据集-natsumii 数据来源:互联网公开数据 标签:英语学习,CEFR,数据集,语言评估,文本分析,自然语言处理,语言学习,英语 数据概述: 该数据集包含来自欧洲语言共同参考框架(CEFR)的英语学习数据,主要用于评估和分析英语学习者的语言水平。主要特征如下:...
    packageimg
  • 巴西联邦弗鲁米嫩塞大学UFF人工智能训练数据集-lauroliveira

    2025年4月24日   

    巴西联邦弗鲁米嫩塞大学UFF人工智能训练数据集-lauroliveira 数据来源:互联网公开数据 标签:人工智能,机器学习,图像识别,自然语言处理,数据集,计算机视觉,巴西,学术研究 数据概述: 该数据集由巴西联邦弗鲁米嫩塞大学(UFF)提供,旨在用于人工智能领域的训练和研究。主要特征如下: 时间跨度:...
    packageimg
  • 债券市场情绪与收益数据集BondMarketSentimentandReturnsDataset-nasratullahshafiq

    2025年4月24日   

    债券市场情绪与收益数据集BondMarketSentimentandReturnsDataset-nasratullahshafiq 数据来源:互联网公开数据 标签:债券市场,情绪分析,收益预测,金融数据,自然语言处理,机器学习,量化金融,投资策略 数据概述: 该数据集包含了债券市场的情绪数据和收益数据,旨在研究市场情绪对债券收益的影响。主要特征如下:...
    packageimg
  • 歧义数据分析数据集AmbiguousDataAnalysisDataset-aryatrivedi

    2025年4月24日   

    歧义数据分析数据集AmbiguousDataAnalysisDataset-aryatrivedi 数据来源:互联网公开数据 标签:数据分析,歧义数据,文本挖掘,自然语言处理,数据集,信息检索,机器学习,语义分析 数据概述: 该数据集包含用于研究和分析歧义数据的数据,旨在探索和处理文本数据中存在的歧义性。主要特征如下:...
    packageimg
  • 情感分析数据集SentimentDatasetwithDownsampling-kengofujii

    2025年4月24日   

    情感分析数据集SentimentDatasetwithDownsampling-kengofujii 数据来源:互联网公开数据 标签:情感分析,数据集,文本挖掘,自然语言处理,机器学习,数据降采样,数据平衡,情感分类 数据概述: 该数据集包含来自社交媒体,评论平台等渠道的用户评论和文本数据,记录了不同情感倾向的文本样本。主要特征如下:...
    packageimg
  • 医生手写体识别数据集DoctorHandwritingRetinaNetDataset-saidilmuna

    2025年4月24日   

    医生手写体识别数据集DoctorHandwritingRetinaNetDataset-saidilmuna 数据来源:互联网公开数据 标签:医疗记录,手写识别,数据集,计算机视觉,深度学习,医疗图像,自然语言处理,医学研究 数据概述: 该数据集包含来自医疗记录中的医生手写体数据,记录了医生在不同医疗场景下的手写笔记和处方信息。主要特征如下:...
    packageimg
  • 谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261

    2025年4月24日   

    谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD...
    packageimg
  • 垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven

    2025年4月24日   

    垃圾邮件分类数据集SpamEmailClassificationDataset-josiagiven 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,信息过滤,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和分类标签(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 国家别名对照数据集-andreneedsambulance

    2025年4月24日   

    国家别名对照数据集-andreneedsambulance 数据来源:互联网公开数据 标签:国家,别名,地理,数据,信息检索,自然语言处理,地图绘制,数据清洗 数据概述: 该数据集包含了国家及其常用别名的数据,旨在提供国家名称和常用替代称呼之间的映射关系。主要特征如下: 时间跨度:数据持续更新,涵盖了不同时期和语境下的国家别名。...
    packageimg
  • 印尼新冠疫情推特情绪分析数据集COVID-19TweetIndonesiaPositifdanNegatifDataset-yudhaislamisulistya

    2025年4月24日   

    印尼新冠疫情推特情绪分析数据集COVID-19TweetIndonesiaPositifdanNegatifDataset-yudhaislamisulistya 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,公共卫生,机器学习,自然语言处理,疫情监测,印尼研究 数据概述:...
    packageimg