找到5,740个数据集

标签: 文本分析

过滤结果
  • 互联网电影资料库IMDbKindle书籍数据集-ktr123

    2025年4月24日   

    互联网电影资料库IMDbKindle书籍数据集-ktr123 数据来源:互联网公开数据 标签:电影,书籍,IMDb,Kindle,评论,情感分析,推荐系统,文本分析 数据概述: 该数据集包含来自互联网电影资料库(IMDb)和Kindle书籍的数据,记录了电影和书籍之间的关联信息以及用户评论。主要特征如下: 时间跨度:...
    packageimg
  • LLM文本检测数据集-wcylxh

    2025年4月24日   

    LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...

    2025年4月24日   

    预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:...
    packageimg
  • IMDB电影推荐系统数据集IMDBRecommendedSystemsDataset-esrabicakci

    2025年4月24日   

    IMDB电影推荐系统数据集IMDBRecommendedSystemsDataset-esrabicakci 数据来源:互联网公开数据 标签:电影推荐,数据集,用户评价,机器学习,推荐系统,文本分析,情感分析,电影数据 数据概述:该数据集由Esrabicakci提供,包含了IMDB电影网站上的用户评价数据,适用于电影推荐系统的构建和分析。主要特征如下:...
    packageimg
  • IMDb电影评论数据集IMDbDatasetof50kMovieReviews-sebastiancarvalho

    2025年4月24日   

    IMDb电影评论数据集IMDbDatasetof50kMovieReviews-sebastiancarvalho 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本分析,数据科学,电影研究 数据概述:该数据集包含来自IMDb的50,000条电影评论数据,记录了用户对电影的评论内容及其对应的评分。主要特征如下:...
    packageimg
  • 女性服装电商平台评价数据集WomensClothingE-commerceReviewsDataset-sreenathkk

    2025年4月24日   

    女性服装电商平台评价数据集WomensClothingE-commerceReviewsDataset-sreenathkk 数据来源:互联网公开数据 标签:电商平台,服装,消费者评价,数据集,文本分析,自然语言处理,电子商务,市场研究 数据概述: 该数据集包含来自女性服装电商平台的消费者评价数据,记录了用户对服装商品的评价信息。主要特征如下:...
    packageimg
  • 跨站脚本攻击XSS漏洞检测数据集-sergiomahia

    2025年4月24日   

    跨站脚本攻击XSS漏洞检测数据集-sergiomahia 数据来源:互联网公开数据 标签:网络安全,XSS,漏洞检测,机器学习,自然语言处理,文本分析,安全研究,威胁情报 数据概述: 该数据集包含用于检测跨站脚本攻击(XSS)漏洞的文本数据,记录了各种恶意注入的HTML/JavaScript代码片段,以及对应的标签信息。主要特征如下:...
    packageimg
  • 印地语到印地语-英迪亚语翻译数据集HinditoHinglishTranslationDataset-parthplc

    2025年4月24日   

    印地语到印地语-英迪亚语翻译数据集HinditoHinglishTranslationDataset-parthplc 数据来源:互联网公开数据 标签:印地语,印地语-英迪亚语,数据集,自然语言处理,机器翻译,文本分析,语言学,人工智能 数据概述:该数据集包含来自多个来源的印地语到印地语-...
    packageimg
  • 国籍分类数据集NationalityClassificationDataset-gauravduttakiit

    2025年4月24日   

    国籍分类数据集NationalityClassificationDataset-gauravduttakiit 数据来源:互联网公开数据 标签:国籍分类,数据集,机器学习,文本分析,自然语言处理,数据挖掘,人工智能,多语言 数据概述: 该数据集包含来自互联网公开来源的国籍分类数据,记录了不同国籍的身份标识信息。主要特征如下:...
    packageimg
  • 电影描述数据集MovieDescriptionDataset-sushilhub

    2025年4月24日   

    电影描述数据集MovieDescriptionDataset-sushilhub 数据来源:互联网公开数据 标签:电影,描述,数据集,文本分析,自然语言处理,情感分析,机器学习,内容推荐 数据概述: 该数据集包含来自多个电影数据库的电影描述数据,记录了电影的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • 情绪数据-愤怒-悲伤-喜悦-恐惧数据集-raoofnaushad

    2025年4月24日   

    情绪数据-愤怒-悲伤-喜悦-恐惧数据集-raoofnaushad 数据来源:互联网公开数据 标签:情绪分析,情感识别,数据集,自然语言处理,文本分析,机器学习,情绪分类,心理学 数据概述:该数据集包含来自互联网的文本数据,记录了表达愤怒,悲伤,喜悦和恐惧四种情绪的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,覆盖了多个时间段的文本。...
    packageimg
  • 数据80万条新冠疫苗推文数据集

    2025年4月24日   

    数据80万条新冠疫苗推文数据集 数据来源:互联网公开数据 标签:新冠疫苗,推文,社交媒体,用户行为,文本分析,时间序列,疫苗接种,疫情传播 数据概述:...
    packageimg
  • 图书信息与描述数据集BookswithDescriptionDataset-fakhriabbas

    2025年4月24日   

    图书信息与描述数据集BookswithDescriptionDataset-fakhriabbas 数据来源:互联网公开数据 标签:图书信息,数据集,文本分析,自然语言处理,信息检索,教育研究,出版行业 数据概述:该数据集包含来自公开图书信息库的数据,记录了各类图书的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • 神经信息处理系统大会NIPS论文引用数据集NIPS2022论文引用数据集-kolosovanatoliy

    2025年4月24日   

    神经信息处理系统大会NIPS论文引用数据集NIPS2022论文引用数据集-kolosovanatoliy 数据来源:互联网公开数据 标签:机器学习,数据集,论文引用,学术研究,自然语言处理,文本分析,知识图谱,影响力分析 数据概述:...
    packageimg
  • CommonLit阅读理解测评数据集-jackson786

    2025年4月24日   

    CommonLit阅读理解测评数据集-jackson786 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,文本分析,教育,数据集,机器学习,文本分类,语言模型 数据概述: 该数据集包含CommonLit公司的阅读理解测评数据,记录了学生在阅读不同文本后的理解能力评估结果。主要特征如下:...
    packageimg
  • 带时间戳的文本标注数据集-vanniagm

    2025年4月24日   

    带时间戳的文本标注数据集-vanniagm 数据来源:互联网公开数据 标签:文本数据,时间戳,标注,自然语言处理,数据集,文本分析,信息抽取,机器学习 数据概述: 该数据集包含带时间戳的文本数据,记录了文本内容及其对应的时间信息。主要特征如下: 时间跨度:数据记录的时间范围取决于原始文本数据的时间跨度,可能从数小时到数年不等。...
    packageimg
  • 法语维基百科数据集WikiFrenchDataset-manueldesiretaira

    2025年4月24日   

    法语维基百科数据集WikiFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自法语维基百科的数据,记录了维基百科中各个条目的内容。主要特征如下: 时间跨度:数据记录的时间范围从2001年到2023年。...
    packageimg
  • 招聘信息分类数据集JobSearchClassifiedsDataset-vrashad

    2025年4月24日   

    招聘信息分类数据集JobSearchClassifiedsDataset-vrashad 数据来源:互联网公开数据 标签:招聘,分类,文本分析,自然语言处理,机器学习,数据集,职位描述,就业市场 数据概述: 该数据集包含来自招聘网站的分类信息,记录了各类招聘信息的数据。主要特征如下:...
    packageimg
  • Keras深度学习框架数据集KerasData-anouargmili

    2025年4月24日   

    Keras深度学习框架数据集KerasData-anouargmili 数据来源:互联网公开数据 标签:深度学习,Keras,数据集,图像识别,文本分析,自然语言处理,机器学习,计算机视觉 数据概述: 该数据集包含了Keras深度学习框架中常用的示例数据集,涵盖了图像,文本,序列等多种数据类型,方便用户进行模型构建和训练。主要特征如下:...
    packageimg