找到11,786个数据集

标签: 自然语言处理

过滤结果
  • 亚马逊评论字幕数据集ARC-SubsDataset-philipkd

    2025年4月25日   

    亚马逊评论字幕数据集ARC-SubsDataset-philipkd 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,字幕,情感分析,机器翻译,评论,亚马逊 数据概述: 该数据集包含了来自亚马逊网站的商品评论以及对应的字幕数据,旨在为自然语言处理任务提供训练和评估资源。主要特征如下:...
    packageimg
  • 虚假新闻西班牙语数据集FalseNewsinSpanishDataset-arseniitretiakov

    2025年4月25日   

    虚假新闻西班牙语数据集FalseNewsinSpanishDataset-arseniitretiakov 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,数据集,自然语言处理,机器学习,文本分类,西班牙语,信息传播 数据概述: 该数据集包含来自西班牙语媒体的虚假新闻数据,记录了各类虚假新闻的文本内容和相关特征。主要特征如下:...
    packageimg
  • 英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang

    2025年4月25日   

    英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:...
    packageimg
  • 泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit

    2025年4月25日   

    泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:...
    packageimg
  • 突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel

    2025年4月25日   

    突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,突尼斯语,语言学,机器学习,人工智能,文本挖掘 数据概述:该数据集包含来自突尼斯的自然语言处理数据,记录了突尼斯语文本的多方面信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。...
    packageimg
  • 数据2015年爱数据科学挑战赛EDSA2015推特情感分类数据集EDSA2015TwitterSentimentClassificationDataset...

    2025年4月25日   

    2015年爱数据科学挑战赛EDSA2015推特情感分类数据集EDSA2015TwitterSentimentClassificationDataset-jeanswiegers 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本分类,机器学习,自然语言处理,情感识别,数据挖掘 数据概述: 该数据集源自2015年爱数据科学挑战赛(EDSA...
    packageimg
  • 路透社报道的德国DAX指数三年文章数据集-wissemch

    2025年4月25日   

    路透社报道的德国DAX指数三年文章数据集-wissemch 数据来源:互联网公开数据 标签:金融新闻,数据集,DAX指数,路透社,文本分析,自然语言处理,量化交易,经济分析 数据概述:该数据集包含来自路透社的关于德国DAX指数的新闻文章,记录了三年内关于DAX指数的报道内容。主要特征如下:...
    packageimg
  • 大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

    2025年4月25日   

    大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源:互联网公开数据 标签:语言模型,机器学习,自然语言处理,深度学习,人工智能,文本生成,文本分析,大数据 数据概述: 该数据集包含用于训练大型语言模型(LLM)的文本数据,特别适用于JAX框架下的LLaMA 13B模型。主要特征如下:...
    packageimg
  • 阿拉伯国家自杀事件数据集ArabicSuicideDataset-houlmixa

    2025年4月25日   

    阿拉伯国家自杀事件数据集ArabicSuicideDataset-houlmixa 数据来源:互联网公开数据 标签:自杀,阿拉伯国家,心理健康,数据集,文本分析,自然语言处理,情感分析,社会学 数据概述: 该数据集包含了来自阿拉伯国家关于自杀事件的数据,旨在为研究自杀行为,心理健康和社会问题提供数据支持。主要特征如下: 时间跨度:...
    packageimg
  • 网络热点事件监测数据集NetworkHeatDataset-antonigarciamolina

    2025年4月25日   

    网络热点事件监测数据集NetworkHeatDataset-antonigarciamolina 数据来源:互联网公开数据 标签:网络热点,事件监测,数据集,社交媒体,文本分析,自然语言处理,舆情分析,社会研究 数据概述:该数据集包含来自社交媒体平台的数据,记录了各类网络热点事件的详细信息。主要特征如下:...
    packageimg
  • 钓鱼邮件检测数据集-mohammadaoalhija

    2025年4月25日   

    钓鱼邮件检测数据集-mohammadaoalhija 数据来源:互联网公开数据 标签:钓鱼邮件,网络安全,数据集,文本分析,机器学习,恶意软件,自然语言处理,电子邮件 数据概述: 该数据集包含来自不同来源的钓鱼邮件和正常邮件样本,用于钓鱼邮件检测和分析。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同年份的钓鱼邮件样本。...
    packageimg
  • YouTube视频评论情感分析数据集YouTubeVideoCommentSentimentAnalysisDataset-vinhsokaggle

    2025年4月25日   

    YouTube视频评论情感分析数据集YouTubeVideoCommentSentimentAnalysisDataset-vinhsokaggle 数据来源:互联网公开数据 标签:YouTube,视频,评论,情感分析,自然语言处理,机器学习,文本分析,社交媒体 数据概述:...
    packageimg
  • 印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007

    2025年4月25日   

    印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007 数据来源:互联网公开数据 标签:情感分析,自然语言处理,印地语,数据集,文本分类,机器学习,语言技术,数据分析 数据概述:...
    packageimg
  • 情感分析预处理数据集GoEmotionsPreprocessedDataset-smritimadangarli

    2025年4月25日   

    情感分析预处理数据集GoEmotionsPreprocessedDataset-smritimadangarli 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本分类,机器学习,情感识别,深度学习,社交媒体 数据概述: 该数据集包含预处理后的GoEmotions数据集,用于情感分析任务。主要特征如下:...
    packageimg
  • 应用程序用户评论数据集apps-reviewsDataset-zenbot99

    2025年4月25日   

    应用程序用户评论数据集apps-reviewsDataset-zenbot99 数据来源:互联网公开数据 标签:应用程序,用户评论,数据集,情感分析,自然语言处理,机器学习,数据挖掘,用户体验 数据概述: 该数据集包含来自多个应用程序商店的用户评论数据,记录了用户对各种应用程序的评价和反馈。主要特征如下:...
    packageimg
  • 合法与钓鱼网站识别数据集LegitimateandPhishingWebsiteDataset-kunalraut21

    2025年4月25日   

    合法与钓鱼网站识别数据集LegitimateandPhishingWebsiteDataset-kunalraut21 数据来源:互联网公开数据 标签:网络安全,钓鱼网站,数据集,机器学习,URL分析,恶意软件,风险评估,自然语言处理 数据概述:...
    packageimg
  • 垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems

    2025年4月25日   

    垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems 数据来源:互联网公开数据 标签:垃圾邮件,数据集,机器学习,文本分类,自然语言处理,电子邮件,数据分析,信息安全 数据概述: 该数据集包含用于垃圾邮件检测的训练数据,记录了电子邮件的分类标签和内容信息。主要特征如下:...
    packageimg
  • 人工智能研究论文数据集AIStudy210416Dataset-kimck924

    2025年4月25日   

    人工智能研究论文数据集AIStudy210416Dataset-kimck924 数据来源:互联网公开数据 标签:人工智能,机器学习,数据集,论文分析,自然语言处理,学术研究,知识发现,文本挖掘 数据概述: 该数据集包含来自AIStudy平台的人工智能相关论文数据,主要记录了论文的详细信息,包括论文标题,摘要,关键词,作者,发表时间等。主要特征如下:...
    packageimg
  • 德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich

    2025年4月25日   

    德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich 数据来源:互联网公开数据 标签:电子邮件,数据集,XML格式,文本分析,邮件挖掘,自然语言处理,数据挖掘,信息检索 数据概述: 该数据集包含来自德国的电子邮件数据,记录了各类邮件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2010年。...
    packageimg
  • 印地语数据集HindiDataset-yash3056

    2025年4月25日   

    印地语数据集HindiDataset-yash3056 数据来源:互联网公开数据 标签:印地语,数据集,自然语言处理,文本分析,机器学习,语言学习,学术研究,文化研究 数据概述:该数据集包含来自互联网和学术来源的印地语文本数据,记录了各种主题的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg