找到5,749个数据集

标签: 文本分析

过滤结果
  • 猫途鹰TripAdvisor旅游景点评论数据集-barbarmohdfakhruddin

    2025年4月24日   

    猫途鹰TripAdvisor旅游景点评论数据集-barbarmohdfakhruddin 数据来源:互联网公开数据 标签:旅游,景点,评论,用户评价,文本分析,自然语言处理,情感分析,推荐系统 数据概述: 该数据集包含来自猫途鹰(TripAdvisor)网站的旅游景点评论数据,记录了用户对各个景点的评价和相关信息。主要特征如下:...
    packageimg
  • 关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710

    2025年4月24日   

    关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710 数据来源:互联网公开数据 标签:自然语言处理,文本分析,关键词提取,数据集,机器学习,文本摘要,信息检索,人工智能 数据概述: 该数据集专注于自然语言处理领域,主要记录了文本中的关键词提取和文本摘要任务所需的数据。主要特征如下:...
    packageimg
  • 谷歌问题回答挑战赛数据集GoogleQuestQ-AChallengeDataset-kashnitsky

    2025年4月24日   

    谷歌问题回答挑战赛数据集GoogleQuestQ-AChallengeDataset-kashnitsky 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,知识图谱,人工智能,语言模型 数据概述:...
    packageimg
  • 英语-沃森对话数据集English-WatsonDialogueDataset-yukikawawaki

    2025年4月24日   

    英语-沃森对话数据集English-WatsonDialogueDataset-yukikawawaki 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,文本分析,机器学习,情感分析,语言理解,问答系统 数据概述: 该数据集包含来自IBM沃森(Watson)的英语对话数据,记录了人与沃森对话系统的交互信息。主要特征如下:...
    packageimg
  • 特朗普与拜登总统辩论分析数据集-mitramir5

    2025年4月24日   

    特朗普与拜登总统辩论分析数据集-mitramir5 数据来源:互联网公开数据 标签:政治,辩论,数据集,文本分析,自然语言处理,情感分析,舆情分析,美国大选 数据概述: 该数据集包含了来自特朗普和拜登总统辩论的文本数据,旨在进行深入的语言和情感分析。主要特征如下:...
    packageimg
  • 写作质量预测与实际得分数据集-mcpenguin

    2025年4月24日   

    写作质量预测与实际得分数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,预测,评估,自然语言处理,机器学习,文本分析,教育,评分 数据概述: 该数据集包含了写作样本及其对应的预测质量评分和实际得分,旨在用于研究和开发写作质量评估模型。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个时间段的写作样本。...
    packageimg
  • 法律公开测试数据集PublicTestLegalDataset-minhnguyendichnhat

    2025年4月24日   

    法律公开测试数据集PublicTestLegalDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:法律,数据集,文本分析,自然语言处理,法律文本,机器学习,司法,文本分类 数据概述: 该数据集包含来自公开法律文本的数据,旨在用于法律领域的测试和评估。主要特征如下: 时间跨度:...
    packageimg
  • 新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据

    2025年4月24日   

    新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据 数据来源:互联网公开数据 标签:新闻,摘要,文本摘要,自然语言处理,机器学习,评估,文本分析,内容生成 数据概述:...
    packageimg
  • 恐怖电影数据集HorrorMoviesDataset-stevenhinojosa

    2025年4月24日   

    恐怖电影数据集HorrorMoviesDataset-stevenhinojosa 数据来源:互联网公开数据 标签:恐怖电影,数据集,电影分析,娱乐研究,文本分析,电影评论,观众偏好,电影推荐 数据概述: 该数据集包含来自互联网公开数据的恐怖电影相关信息,记录了各类恐怖电影的详细数据,适用于电影分析,观众偏好研究等任务。主要特征如下:...
    packageimg
  • 社交媒体推文主题建模数据集WSTopicModelingTweetsDataset-ahmedeep

    2025年4月24日   

    社交媒体推文主题建模数据集WSTopicModelingTweetsDataset-ahmedeep 数据来源:互联网公开数据 标签:社交媒体,推文,主题建模,文本分析,自然语言处理,数据挖掘,机器学习,舆情分析 数据概述: 该数据集包含来自社交媒体平台(如Twitter)的推文数据,主要用于主题建模和文本分析。主要特征如下:...
    packageimg
  • 印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21

    2025年4月24日   

    印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21 数据来源:互联网公开数据 标签:新冠疫情,印度,新闻数据,自然语言处理,文本分析,疫情分析,新闻媒体,公共卫生 数据概述: 该数据集包含来自印度新闻媒体关于新冠疫情的报道数据,记录了疫情期间的新闻文章内容。主要特征如下:...
    packageimg
  • Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi

    2025年4月24日   

    Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi 数据来源:互联网公开数据 标签:技能评估,数据集,自然语言处理,文本分析,机器学习,人才评估,职业发展,知识图谱...
    packageimg
  • 社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala

    2025年4月24日   

    社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala 数据来源:互联网公开数据 标签:社交媒体,领导推文,数据集,文本分析,自然语言处理,社会学研究,政治分析,公众意见 数据概述:该数据集包含来自不同社交媒体平台的领导推文,记录了全球各地领导人在社交媒体上的发言内容。主要特征如下:...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam

    2025年4月24日   

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分析,机器学习,乌尔都语,社交媒体,学术研究 数据概述:该数据集包含来自社交媒体平台的罗马乌尔都语文本数据,记录了用户的评论和意见,适用于情感分析任务。主要特征如下:...
    packageimg
  • 世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin

    2025年4月24日   

    世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin 数据来源:互联网公开数据 标签:新闻页面,数据集,文本分析,自然语言处理,全球新闻,媒体研究,信息提取,社会学研究 数据概述:该数据集包含来自土耳其广播电视台TRT Haber的全球新闻页面数据,记录了世界范围内的新闻报道内容。主要特征如下:...
    packageimg
  • 科研文章主题建模分析数据集-独立日机器学习黑客松2020-aswathrao

    2025年4月24日   

    科研文章主题建模分析数据集-独立日机器学习黑客松2020-aswathrao 数据来源:互联网公开数据 标签:机器学习,自然语言处理,主题建模,科研文章,文本分析,计算机科学,物理学,数学,统计学,生物学,金融学 数据概述:...
    packageimg
  • 西班牙国会发言标点检测数据集

    2025年4月24日   

    西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1....
    packageimg
  • 文本处理测试数据集-sandeep100joshi

    2025年4月24日   

    文本处理测试数据集-sandeep100joshi 数据来源:互联网公开数据 标签:文本处理,测试,数据集,自然语言处理,机器学习,文本分析,数据清洗,模型评估 数据概述: 该数据集包含用于文本处理任务的测试数据,记录了各种文本信息。主要特征如下: 时间跨度: 数据记录的时间范围不限,主要关注文本内容本身。 地理范围:...
    packageimg
  • 产品关键词生成数据集-sarafrancic

    2025年4月24日   

    产品关键词生成数据集-sarafrancic 数据来源:互联网公开数据 标签:产品,关键词,生成,文本分析,自然语言处理,机器学习,搜索引擎优化,市场营销 数据概述:该数据集包含从各种来源收集的产品描述和相应的关键词,用于训练和评估关键词生成模型。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。 地理范围:数据来源广泛,涵盖全球市场。...
    packageimg
  • 邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan

    2025年4月24日   

    邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。...
    packageimg