找到5,740个数据集

标签: 文本分析

过滤结果
  • 通用文学网站完整文本数据集DatasetfromCommonLitWebsitewithFullText-yuewang123

    2025年4月25日   

    通用文学网站完整文本数据集DatasetfromCommonLitWebsitewithFullText-yuewang123 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,文学研究,课程资源,学术资源 数据概述:...
    packageimg
  • 亚马逊图书评论数据集AmazonBookReviewsDataset-jayllan23

    2025年4月23日   

    亚马逊图书评论数据集AmazonBookReviewsDataset-jayllan23 数据来源:互联网公开数据 标签:图书评论,消费者行为,数据集,文本分析,机器学习,情感分析,电子商务,数据挖掘 数据概述: 该数据集包含来自亚马逊平台的图书评论数据,记录了用户对图书的评分,评论内容及相关元信息。主要特征如下:...
    packageimg
  • 萨提亚-纳德拉推文数据集2009-2023SatyaNadellaTweetsDataset2009-2023-muhammadavici

    2025年4月25日   

    萨提亚-纳德拉推文数据集2009-2023SatyaNadellaTweetsDataset2009-2023-muhammadavici 数据来源:互联网公开数据 标签:社交媒体,推文,数据集,文本分析,机器学习,领导力,科技行业,时间序列...
    packageimg
  • 哈利波特魔法学院分院数据集HarryPotterHousesDataset-sanjay0614

    2025年4月25日   

    哈利波特魔法学院分院数据集HarryPotterHousesDataset-sanjay0614 数据来源:互联网公开数据 标签:哈利波特,数据集,分院,机器学习,文本分析,角色分析,电影,文学 数据概述: 该数据集包含了哈利波特系列电影和书籍中主要角色的相关数据,用于分析角色特征和预测分院结果。主要特征如下:...
    packageimg
  • 笑话综合数据集CombinedJokesDataset-ihdufxr2024

    2025年4月25日   

    笑话综合数据集CombinedJokesDataset-ihdufxr2024 数据来源:互联网公开数据 标签:笑话,数据集,自然语言处理,文本分析,娱乐,机器学习,语言学,文化研究 数据概述:该数据集包含来自多个来源的笑话数据,记录了各类笑话的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 多选题与文本上下文数据集-hark99

    2025年4月25日   

    多选题与文本上下文数据集-hark99 数据来源:互联网公开数据 标签:多选题,上下文理解,自然语言处理,数据集,文本分析,机器学习,考试,语言模型 数据概述:该数据集包含多选题及其对应的文本上下文,旨在用于研究和评估模型在理解文本和回答选择题方面的能力。主要特征如下: 时间跨度:数据收集的时间范围不限。...
    packageimg
  • 生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

    2025年4月25日   

    生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:...
    packageimg
  • DACON语言翻译输出数据集-geying

    2025年4月25日   

    DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。...
    packageimg
  • 新冠疫情期间推特疫情信息数据集COVID-19TwitterDataset-tg2004

    2025年4月25日   

    新冠疫情期间推特疫情信息数据集COVID-19TwitterDataset-tg2004 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,数据集,文本分析,自然语言处理,舆情分析,疫情传播 数据概述: 该数据集包含来自推特平台关于新冠疫情的相关推文数据,记录了疫情期间公众对疫情的讨论,观点和信息传播。主要特征如下:...
    packageimg
  • 电影关键词数据集MoviesKeywordsDataset-leonatorres

    2025年4月25日   

    电影关键词数据集MoviesKeywordsDataset-leonatorres 数据来源:互联网公开数据 标签:电影,关键词,数据集,文本分析,自然语言处理,推荐系统,电影研究,文化研究 数据概述:该数据集包含来自电影数据库的数据,记录了电影的关键词。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。...
    packageimg
  • 主题分类数据集TopicsClassificationDataset-luisfredgs

    2025年4月25日   

    主题分类数据集TopicsClassificationDataset-luisfredgs 数据来源:互联网公开数据 标签:主题分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,数据分析 数据概述:该数据集包含来自多个来源的文本数据,记录了不同主题的文档或文本片段。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 网约车平台用户评价情感分析数据集GojekReviewSentimentDataset-achmadshidiq

    2025年4月25日   

    网约车平台用户评价情感分析数据集GojekReviewSentimentDataset-achmadshidiq 数据来源:互联网公开数据 标签:情感分析,用户评价,数据集,机器学习,自然语言处理,文本分析,网约车,消费者行为 数据概述:该数据集包含来自网约车平台Gojek的用户评价数据,记录了用户对平台服务的评价内容及其情感倾向。主要特征如下:...
    packageimg
  • 僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda

    2025年4月25日   

    僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta

    2025年4月25日   

    推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:...
    packageimg
  • 单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1

    2025年4月25日   

    单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1 数据来源:互联网公开数据 标签:自然语言处理,词频统计,数据集,文本分析,机器学习,语言模型,统计学,数据挖掘 数据概述: 该数据集包含来自多种文本来源的单字词频统计信息,记录了不同语言或文本中单个字的出现频率。主要特征如下:...
    packageimg
  • 情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98

    2025年4月25日   

    情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,情感分析,心理学,自然语言处理,文本分析,人工智能 数据概述: 该数据集包含来自多个来源的情绪识别数据,主要记录了人类情绪的文本表达,适用于情绪分类和情感分析等任务。主要特征如下:...
    packageimg
  • 简历数据分析数据集ResumeDataAnalysisDataset-someetsingh

    2025年4月25日   

    简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:...
    packageimg
  • 数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber

    2025年4月25日   

    2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:...
    packageimg
  • 维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1

    2025年4月25日   

    维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:...
    packageimg
  • 预处理输入数据数据集-isabbaggin

    2025年4月25日   

    预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。...
    packageimg