找到5,740个数据集

标签: 文本分析

过滤结果
  • 网络语言脏话数据集SwearTotalData-parkgarden

    2025年4月25日   

    网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 情感分析社交媒体数据集SentimentOutData20220929-darioceni

    2025年4月25日   

    情感分析社交媒体数据集SentimentOutData20220929-darioceni 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本分析,自然语言处理,机器学习,社会研究,市场分析 数据概述:...
    packageimg
  • 俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina

    2025年4月25日   

    俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息检索,语言技术,俄语处理 数据概述:...
    packageimg
  • 仇恨言论训练数据集HateTrain1Dataset-miguelbanda

    2025年4月25日   

    仇恨言论训练数据集HateTrain1Dataset-miguelbanda 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,社会研究,伦理研究 数据概述:该数据集来自互联网公开的社交媒体平台,记录了用户的评论和帖子内容,主要用于识别和分析仇恨言论。主要特征如下:...
    packageimg
  • 推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000

    2025年4月25日   

    推特关键词提取数据集TweetRAKEKeywordExtractionDataset-akashsuper2000 数据来源:互联网公开数据 标签:文本分析,关键词提取,数据集,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自推特平台的文本数据,记录了推文内容的特征及其关键词提取结果。主要特征如下:...
    packageimg
  • 自然语言处理与机器学习工具包Transformers4-6-0数据集-khyeh0719

    2025年4月25日   

    自然语言处理与机器学习工具包Transformers4-6-0数据集-khyeh0719 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,深度学习,文本分析,算法工具,人工智能,计算机科学 数据概述: 该数据集包含来自Transformers 4.6.0版本的数据,记录了自然语言处理和机器学习领域的工具包及模型信息。主要特征如下:...
    packageimg
  • 英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk

    2025年4月25日   

    英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk 数据来源:互联网公开数据 标签:聊天机器人,对话数据,自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能 数据概述: 该数据集包含了英语聊天机器人生成的对话数据,记录了用户与聊天机器人之间的交互内容。主要特征如下:...
    packageimg
  • 自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss

    2025年4月25日   

    自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,BERT,数据集,多语言,文本分析,机器学习,深度学习 数据概述:该数据集包含来自多个语言来源的文本数据,适用于自然语言处理中的多分类任务。主要特征如下:...
    packageimg
  • 个人身份信息检测训练数据集PIIDetectionTrainDataset-kuohsintu

    2025年4月25日   

    个人身份信息检测训练数据集PIIDetectionTrainDataset-kuohsintu 数据来源:互联网公开数据 标签:个人身份信息,数据集,隐私保护,自然语言处理,文本分析,机器学习,信息安全,数据保护 数据概述:该数据集包含用于训练个人身份信息(PII)检测模型的数据,记录了多种类型的文本数据及其标注的个人身份信息。主要特征如下:...
    packageimg
  • 阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals

    2025年4月25日   

    阿拉伯语新闻数据集ArabicNewsDatasetfromSabqWebsite-abdulrahmanals 数据来源:互联网公开数据 标签:阿拉伯语,新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻分类,语言资源 数据概述: 该数据集包含来自沙特阿拉伯Sabq新闻网站的文章数据,记录了网站发布的阿拉伯语新闻报道。主要特征如下:...
    packageimg
  • Agoda酒店评论数据集-atulmittal199174

    2025年4月25日   

    Agoda酒店评论数据集-atulmittal199174 数据来源:互联网公开数据 标签:酒店,评论,数据集,文本分析,情感分析,旅游,自然语言处理,机器学习 数据概述: 该数据集包含来自Agoda网站的酒店评论数据,记录了用户对酒店的评价和相关信息。主要特征如下: 时间跨度:数据记录的时间范围未知,具体时间跨度依赖于原始数据。...
    packageimg
  • 阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune

    2025年4月25日   

    阿拉伯民间故事数据集RaidArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯文化,民间故事,文本分析,自然语言处理,情感分析,语言学,文化研究,叙事学 数据概述:该数据集包含来自Raid项目收集的阿拉伯民间故事,记录了阿拉伯地区的各种民间故事和传说。主要特征如下:...
    packageimg
  • IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl

    2025年4月25日   

    IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,辩论,数据集,文本分析,语义理解,证据检索,信息抽取,人工智能 数据概述: 该数据集由IBM Debater项目提供,包含从大规模文本语料库中提取的辩论相关的证据句子。主要特征如下:...
    packageimg
  • 印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002

    2025年4月25日   

    印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本分析,印度新闻,数据集,机器翻译,文本分类,信息检索 数据概述: 该数据集包含来自Inshorts平台的印度新闻摘要数据,用于文本摘要,自然语言处理等任务。主要特征如下:...
    packageimg
  • 性别歧视文本数据集SexismDataset-Text-thne1111

    2025年4月25日   

    性别歧视文本数据集SexismDataset-Text-thne1111 数据来源:互联网公开数据 标签:性别歧视,文本分析,数据集,自然语言处理,机器学习,社会研究,情感分析,文本分类 数据概述: 该数据集包含来自公开来源的文本数据,记录了涉及性别歧视的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确指定,涵盖不同时间段的内容。...
    packageimg
  • 英国广播公司BBC新冠疫情YouTube视频评论数据集-milanvarghese

    2025年4月25日   

    英国广播公司BBC新冠疫情YouTube视频评论数据集-milanvarghese 数据来源:互联网公开数据 标签:新冠疫情,YouTube评论,文本分析,情感分析,社交媒体,舆情分析,公共卫生,数据挖掘 数据概述:...
    packageimg
  • GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr

    2025年4月25日   

    GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,深度学习,文本分析 数据概述:该数据集包含了由GPT4再生成的语言模型数据,适用于自然语言处理,文本生成等任务。主要特征如下:...
    packageimg
  • 北方雄狮推文数据集NorthernlionTweetsDataset-luigi595

    2025年4月25日   

    北方雄狮推文数据集NorthernlionTweetsDataset-luigi595 数据来源:互联网公开数据 标签:推文,社交媒体,游戏,直播,数据集,文本分析,自然语言处理,社区研究 数据概述: 该数据集包含来自知名游戏主播北方雄狮(Northernlion)的推文数据,记录了其在Twitter上的公开推文内容。主要特征如下:...
    packageimg
  • 印度汽车公司推文数据集TweetsonIndianAutomobileCompaniesDataset-arushirawat

    2025年4月25日   

    印度汽车公司推文数据集TweetsonIndianAutomobileCompaniesDataset-arushirawat 数据来源:互联网公开数据 标签:推文,印度,汽车行业,社交媒体分析,市场研究,文本分析,品牌监测,消费者行为 数据概述: 该数据集包含来自印度知名汽车公司的推文数据,记录了各公司发布的推文内容及其相关特征。主要特征如下:...
    packageimg
  • 抑郁与自杀数据集DepressionandSuicideDataset-surendersinghdahiya

    2025年4月25日   

    抑郁与自杀数据集DepressionandSuicideDataset-surendersinghdahiya 数据来源:互联网公开数据 标签:抑郁症,自杀,心理健康,数据集,文本分析,机器学习,情感分析,社会学 数据概述: 该数据集包含了与抑郁症和自杀相关的文本数据,旨在为研究和分析提供支持。主要特征如下: 时间跨度:...
    packageimg