找到5,740个数据集

标签: 文本分析

过滤结果
  • Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein

    2025年4月24日   

    Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein 数据来源:互联网公开数据 标签:社交媒体,书籍,讨论,数据集,文本分析,自然语言处理,情感分析,内容推荐 数据概述:...
    packageimg
  • 阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi

    2025年4月24日   

    阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi 数据来源:互联网公开数据 标签:序列标注,自然语言处理,数据集,命名实体识别,机器学习,语言处理,NLP,文本分析 数据概述: 该数据集包含阿拉伯语的序列标注数据,采用IOB标注格式记录了文本中的命名实体。主要特征如下:...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul

    2025年4月24日   

    Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul 数据来源:互联网公开数据 标签:在线教育,课程描述,数据集,自然语言处理,机器学习,教育技术,文本分析,课程分类 数据概述: 该数据集包含来自Udemy平台的课程描述数据,记录了2022年平台上部分课程的详细信息。主要特征如下:...
    packageimg
  • IMDB电影评论数据集2011-2017年-ivancanepa

    2025年4月24日   

    IMDB电影评论数据集2011-2017年-ivancanepa 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,文本分析,娱乐研究,社会学 数据概述:该数据集包含来自IMDB的50,000条电影评论,记录了用户对电影的感受和评价。主要特征如下: 时间跨度:数据记录的时间范围从2011年到2017年。...
    packageimg
  • Ankit推理数据集AnkitInferenceDataset-andysama79

    2025年4月24日   

    Ankit推理数据集AnkitInferenceDataset-andysama79 数据来源:互联网公开数据 标签:推理,数据集,自然语言处理,机器学习,文本分析,人工智能,深度学习,语言模型 数据概述: 该数据集包含来自Ankit项目的推理数据,记录了用于训练和评估自然语言处理模型的文本数据。主要特征如下:...
    packageimg
  • 巴西BuzzFeed点击诱饵标题数据集-rogeriochaves

    2025年4月24日   

    巴西BuzzFeed点击诱饵标题数据集-rogeriochaves 数据来源:互联网公开数据 标签:点击诱饵,巴西,BuzzFeed,标题,自然语言处理,文本分析,社交媒体,内容创作 数据概述: 该数据集包含了来自巴西BuzzFeed网站的点击诱饵标题数据,旨在研究和分析巴西葡萄牙语环境下的标题生成和内容传播规律。主要特征如下:...
    packageimg
  • 自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus

    2025年4月24日   

    自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,深度学习,人工智能,信息检索 数据概述: 该数据集来源于ChAIi问答任务竞赛,专注于自然语言处理领域的问答系统研究。主要特征如下:...
    packageimg
  • 情感分析多模态数据集MOSIText-OnlyDataset-arminkgarj

    2025年4月24日   

    情感分析多模态数据集MOSIText-OnlyDataset-arminkgarj 数据来源:互联网公开数据 标签:情感分析,多模态数据,数据集,自然语言处理,机器学习,情感计算,文本分析,情感识别 数据概述: 该数据集来自情感分析多模态数据集(MOSI),专注于文本数据的情感分析。主要特征如下:...
    packageimg
  • Reddit拆分数据集RedditSplitDataset-rajkumargovarthanan

    2025年4月24日   

    Reddit拆分数据集RedditSplitDataset-rajkumargovarthanan 数据来源:互联网公开数据 标签:Reddit, 数据集, 社交媒体, 文本分析, 自然语言处理, 机器学习, 情感分析, 社会研究 数据概述:该数据集包含来自Reddit社交网络的帖子数据,经过拆分处理,适用于文本分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998

    2025年4月24日   

    亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998 数据来源:互联网公开数据 标签:电商,商品评论,自然语言处理,多语言,情感分析,机器学习,文本分析,亚马逊 数据概述: 该数据集由亚马逊提供,包含了来自亚马逊平台的商品评论数据,覆盖多种语言。主要特征如下:...
    packageimg
  • 推特样本数据集TwitterSampleDataset-siddheshshelke

    2025年4月24日   

    推特样本数据集TwitterSampleDataset-siddheshshelke 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,信息传播 数据概述: 该数据集包含来自推特平台的公开用户数据,记录了用户发布的推文内容及相关信息。主要特征如下:...
    packageimg
  • 乌尔都语命名实体识别数据集UrduNERDataset-themohal

    2025年4月24日   

    乌尔都语命名实体识别数据集UrduNERDataset-themohal 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语言技术,乌尔都语,实体识别 数据概述: 该数据集包含乌尔都语文本中的命名实体识别数据,记录了乌尔都语文本中的人名,地名,组织名等实体信息。主要特征如下:...
    packageimg
  • 克莱德制作数据集2Claude-madeDatasets2-patricknormile

    2025年4月24日   

    克莱德制作数据集2Claude-madeDatasets2-patricknormile 数据来源:互联网公开数据 标签:数据集,机器学习,自然语言处理,人工智能,文本分析,数据挖掘,深度学习,模型训练 数据概述: 该数据集由克莱德团队制作,包含了丰富的文本数据资源,适用于自然语言处理,机器学习和人工智能领域的应用。主要特征如下:...
    packageimg
  • 板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa

    2025年4月24日   

    板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa 数据来源:互联网公开数据 标签:板球,体育,数据集,文本分析,机器学习,自然语言处理,体育新闻,赛事报道 数据概述: 该数据集包含来自Cricinfo网站的比赛文本数据,记录了板球比赛的相关信息。主要特征如下:...
    packageimg
  • 绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya

    2025年4月24日   

    绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya 数据来源:互联网公开数据 标签:情景喜剧,电视剧,数据集,文本分析,角色互动,剧本分析,自然语言处理,文化研究 数据概述: 该数据集包含了电视剧《绝命毒师》的情景喜剧相关数据,记录了剧集中对话,场景和角色互动等信息。主要特征如下: 时间跨度:...
    packageimg
  • 多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan

    2025年4月24日   

    多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan 数据来源:互联网公开数据 标签:多语言,文本分析,情绪识别,情感计算,自然语言处理,机器学习,心理学,数据集 数据概述:该数据集包含来自多个来源的多语言文本数据,记录了不同语言文本中的情绪标注。主要特征如下:...
    packageimg
  • 谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530

    2025年4月24日   

    谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,人工智能,语义理解,信息检索 数据概述: 该数据集是谷歌问答数据集的扩展版本,包含来自谷歌问答社区的问答数据,记录了用户提交的问题及其对应的回答内容。主要特征如下:...
    packageimg
  • 常见教育文本预处理数据集PreprocessCommonLitDataset-mkhoatd

    2025年4月24日   

    常见教育文本预处理数据集PreprocessCommonLitDataset-mkhoatd 数据来源:互联网公开数据 标签:教育研究,文本预处理,数据集,自然语言处理,机器学习,教育技术,文本分析,学术资源 数据概述: 该数据集包含来自CommonLit教育平台的数据,记录了常见教育文本的预处理信息。主要特征如下:...
    packageimg
  • 土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11

    2025年4月24日   

    土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分析,自然语言处理,机器学习,土耳其语,文本分类,网络安全 数据概述: 该数据集包含了土耳其语的电子邮件数据,用于垃圾邮件检测和分类。主要特征如下:...
    packageimg