找到5,735个数据集

标签: 文本分析

过滤结果
  • EMNIST字母图像数据集EMNISTLettersDataset-mzaink14

    2025年4月24日   

    EMNIST字母图像数据集EMNISTLettersDataset-mzaink14 数据来源:互联网公开数据 标签:图像识别,字符识别,数据集,机器学习,深度学习,计算机视觉,文本分析,字母 数据概述: 该数据集包含来自EMNIST项目的字母图像数据,主要用于训练和评估字母识别模型。主要特征如下: 时间跨度:数据记录的时间范围为数据集创建时期。...
    packageimg
  • 口述历史访谈记录数据集LokisTranscriptDataset-anomic

    2025年4月24日   

    口述历史访谈记录数据集LokisTranscriptDataset-anomic 数据来源:互联网公开数据 标签:口述历史,访谈记录,数据集,历史研究,文本分析,社会研究,语言处理,人文科学 数据概述:该数据集包含来自口述历史项目的访谈记录,记录了个人口述历史访谈的完整文本内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 数据2024年数据科学学生锦标赛专利摘要分类数据集-lokeshsgupta

    2025年4月24日   

    2024年数据科学学生锦标赛专利摘要分类数据集-lokeshsgupta 数据来源:互联网公开数据 标签:专利,摘要,分类,EPO,欧洲专利局,机器学习,文本分析,数据科学,竞赛,标签 数据概述:...
    packageimg
  • 阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist

    2025年4月24日   

    阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,舆情监测,机器学习,自然语言处理,商业研究 数据概述: 该数据集包含来自社交媒体平台Twitter(推文)的公开数据,记录了与阿达尼集团(Adani...
    packageimg
  • 信息科学582挑战赛数据集-saranga7

    2025年4月24日   

    信息科学582挑战赛数据集-saranga7 数据来源:互联网公开数据 标签:机器学习,数据集,文本分析,自然语言处理,情感分析,社交媒体,竞赛,新闻 数据概述:该数据集包含来自信息科学582挑战赛的数据,主要记录了与新闻文章相关的文本数据。主要特征如下: 时间跨度:数据记录的时间范围,涵盖了挑战赛期间的新闻文章。...
    packageimg
  • 突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah

    2025年4月24日   

    突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah 数据来源:互联网公开数据 标签:短信,垃圾邮件,文本分类,自然语言处理,机器学习,阿拉伯语,数据集,文本分析 数据概述: 该数据集包含了来自突尼斯的短信数据,用于垃圾短信(Spam)和正常短信(Ham)的分类研究。主要特征如下:...
    packageimg
  • 猫途鹰TripAdvisor旅游景点评论数据集-barbarmohdfakhruddin

    2025年4月24日   

    猫途鹰TripAdvisor旅游景点评论数据集-barbarmohdfakhruddin 数据来源:互联网公开数据 标签:旅游,景点,评论,用户评价,文本分析,自然语言处理,情感分析,推荐系统 数据概述: 该数据集包含来自猫途鹰(TripAdvisor)网站的旅游景点评论数据,记录了用户对各个景点的评价和相关信息。主要特征如下:...
    packageimg
  • 关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710

    2025年4月24日   

    关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710 数据来源:互联网公开数据 标签:自然语言处理,文本分析,关键词提取,数据集,机器学习,文本摘要,信息检索,人工智能 数据概述: 该数据集专注于自然语言处理领域,主要记录了文本中的关键词提取和文本摘要任务所需的数据。主要特征如下:...
    packageimg
  • 谷歌问题回答挑战赛数据集GoogleQuestQ-AChallengeDataset-kashnitsky

    2025年4月24日   

    谷歌问题回答挑战赛数据集GoogleQuestQ-AChallengeDataset-kashnitsky 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,知识图谱,人工智能,语言模型 数据概述:...
    packageimg
  • 英语-沃森对话数据集English-WatsonDialogueDataset-yukikawawaki

    2025年4月24日   

    英语-沃森对话数据集English-WatsonDialogueDataset-yukikawawaki 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,文本分析,机器学习,情感分析,语言理解,问答系统 数据概述: 该数据集包含来自IBM沃森(Watson)的英语对话数据,记录了人与沃森对话系统的交互信息。主要特征如下:...
    packageimg
  • 特朗普与拜登总统辩论分析数据集-mitramir5

    2025年4月24日   

    特朗普与拜登总统辩论分析数据集-mitramir5 数据来源:互联网公开数据 标签:政治,辩论,数据集,文本分析,自然语言处理,情感分析,舆情分析,美国大选 数据概述: 该数据集包含了来自特朗普和拜登总统辩论的文本数据,旨在进行深入的语言和情感分析。主要特征如下:...
    packageimg
  • 写作质量预测与实际得分数据集-mcpenguin

    2025年4月24日   

    写作质量预测与实际得分数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,预测,评估,自然语言处理,机器学习,文本分析,教育,评分 数据概述: 该数据集包含了写作样本及其对应的预测质量评分和实际得分,旨在用于研究和开发写作质量评估模型。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个时间段的写作样本。...
    packageimg
  • 法律公开测试数据集PublicTestLegalDataset-minhnguyendichnhat

    2025年4月24日   

    法律公开测试数据集PublicTestLegalDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:法律,数据集,文本分析,自然语言处理,法律文本,机器学习,司法,文本分类 数据概述: 该数据集包含来自公开法律文本的数据,旨在用于法律领域的测试和评估。主要特征如下: 时间跨度:...
    packageimg
  • 新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据

    2025年4月24日   

    新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据 数据来源:互联网公开数据 标签:新闻,摘要,文本摘要,自然语言处理,机器学习,评估,文本分析,内容生成 数据概述:...
    packageimg
  • 恐怖电影数据集HorrorMoviesDataset-stevenhinojosa

    2025年4月24日   

    恐怖电影数据集HorrorMoviesDataset-stevenhinojosa 数据来源:互联网公开数据 标签:恐怖电影,数据集,电影分析,娱乐研究,文本分析,电影评论,观众偏好,电影推荐 数据概述: 该数据集包含来自互联网公开数据的恐怖电影相关信息,记录了各类恐怖电影的详细数据,适用于电影分析,观众偏好研究等任务。主要特征如下:...
    packageimg
  • 社交媒体推文主题建模数据集WSTopicModelingTweetsDataset-ahmedeep

    2025年4月24日   

    社交媒体推文主题建模数据集WSTopicModelingTweetsDataset-ahmedeep 数据来源:互联网公开数据 标签:社交媒体,推文,主题建模,文本分析,自然语言处理,数据挖掘,机器学习,舆情分析 数据概述: 该数据集包含来自社交媒体平台(如Twitter)的推文数据,主要用于主题建模和文本分析。主要特征如下:...
    packageimg
  • 印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21

    2025年4月24日   

    印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21 数据来源:互联网公开数据 标签:新冠疫情,印度,新闻数据,自然语言处理,文本分析,疫情分析,新闻媒体,公共卫生 数据概述: 该数据集包含来自印度新闻媒体关于新冠疫情的报道数据,记录了疫情期间的新闻文章内容。主要特征如下:...
    packageimg
  • Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi

    2025年4月24日   

    Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi 数据来源:互联网公开数据 标签:技能评估,数据集,自然语言处理,文本分析,机器学习,人才评估,职业发展,知识图谱...
    packageimg
  • 社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala

    2025年4月24日   

    社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala 数据来源:互联网公开数据 标签:社交媒体,领导推文,数据集,文本分析,自然语言处理,社会学研究,政治分析,公众意见 数据概述:该数据集包含来自不同社交媒体平台的领导推文,记录了全球各地领导人在社交媒体上的发言内容。主要特征如下:...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam

    2025年4月24日   

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分析,机器学习,乌尔都语,社交媒体,学术研究 数据概述:该数据集包含来自社交媒体平台的罗马乌尔都语文本数据,记录了用户的评论和意见,适用于情感分析任务。主要特征如下:...
    packageimg