找到5,735个数据集

标签: 文本分析

过滤结果
  • 垃圾邮件预测电子邮件数据集EmailSpamPredictionDataset-daramnikhil

    2025年4月23日   

    垃圾邮件预测电子邮件数据集EmailSpamPredictionDataset-daramnikhil 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,数据集,机器学习,分类,预测,网络安全,文本分析 数据概述: 该数据集包含用于垃圾邮件预测的电子邮件数据,记录了大量电子邮件的文本内容及标签信息,适用于垃圾邮件分类和预测等任务。主要特征如下:...
    packageimg
  • 电子邮件数据集10万条记录EmailDatasetwith100kRecords-mravikiran

    2025年4月23日   

    电子邮件数据集10万条记录EmailDatasetwith100kRecords-mravikiran 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,垃圾邮件检测,情感分析,机器学习,数据挖掘 数据概述: 该数据集包含来自公开渠道的电子邮件数据,记录了电子邮件的内容,发送者,接收者,主题,发送时间等信息。主要特征如下:...
    packageimg
  • Instagram社交媒体伊朗评论数据集PersianCommentintheInstagramDataset-alibehdarnejad

    2025年4月23日   

    Instagram社交媒体伊朗评论数据集PersianCommentintheInstagramDataset-alibehdarnejad 数据来源:互联网公开数据 标签:社交媒体,伊朗评论,数据集,文本分析,自然语言处理,机器学习,文化研究,社会学研究...
    packageimg
  • 随机诗歌数据集RandomPoemsDataset-garried

    2025年4月23日   

    随机诗歌数据集RandomPoemsDataset-garried 数据来源:互联网公开数据 标签:诗歌,文学,自然语言处理,文本分析,数据集,文化研究,机器学习,文本生成 数据概述: 该数据集包含来自公开诗歌资源的随机诗歌数据,记录了不同风格和主题的诗歌作品。主要特征如下: 时间跨度:数据记录的时间范围从古代到现代,包含不同历史时期的诗歌作品。...
    packageimg
  • 情感分析处理数据集ProcessedDataEmotionDataset-duonghieu

    2025年4月23日   

    情感分析处理数据集ProcessedDataEmotionDataset-duonghieu 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分析,情感识别,数据清洗,文本挖掘 数据概述: 该数据集包含经过处理的情感分析数据,记录了大量文本数据及其对应的情感标签。主要特征如下:...
    packageimg
  • CommonLit阅读理解文本摘要数据集-shinomoriaoshi

    2025年4月23日   

    CommonLit阅读理解文本摘要数据集-shinomoriaoshi 数据来源:互联网公开数据 标签:阅读理解,文本摘要,自然语言处理,机器学习,教育,数据集,文本分析,语言模型 数据概述:该数据集包含来自CommonLit网站的阅读理解文章及其对应的文本摘要。主要特征如下:...
    packageimg
  • 亚马逊数据科学书籍评论数据集-2023-vvorotnikov

    2025年4月23日   

    亚马逊数据科学书籍评论数据集-2023-vvorotnikov 数据来源:互联网公开数据 标签:亚马逊,数据科学,书籍评论,用户评价,评分,文本分析,大数据 数据概述:...
    packageimg
  • 对话摘要生成数据集DialogSummarizationDataset-sukalp1899

    2025年4月23日   

    对话摘要生成数据集DialogSummarizationDataset-sukalp1899 数据来源:互联网公开数据 标签:对话摘要,数据集,自然语言处理,机器学习,文本分析,人工智能,语言模型,对话系统 数据概述:该数据集包含来自多个来源的对话记录及其对应的摘要,适用于对话摘要生成任务。主要特征如下:...
    packageimg
  • 金融新闻情感分析数据集-kimo26

    2025年4月23日   

    金融新闻情感分析数据集-kimo26 数据来源:互联网公开数据 标签:金融,新闻,情感分析,自然语言处理,机器学习,文本分析,市场情绪,舆情分析 数据概述: 该数据集包含来自各种来源的金融新闻文本,并标注了对应的情感极性。主要特征如下: 时间跨度: 数据记录的时间范围取决于新闻来源,通常涵盖数年甚至更长时间。 地理范围:...
    packageimg
  • BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad

    2025年4月23日   

    BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分析,深度学习,语言模型,AI研究,文本分类 数据概述:该数据集包含通过BERT模型处理后的文本数据结果,记录了BERT模型对输入文本的分析和处理输出。主要特征如下:...
    packageimg
  • 多类别邮件分类数据集MulticlassEmailClassificationDataset-kevinzb56

    2025年4月23日   

    多类别邮件分类数据集MulticlassEmailClassificationDataset-kevinzb56 数据来源:互联网公开数据 标签:邮件分类,数据集,文本分析,机器学习,自然语言处理,信息分类,电子邮件,数据分析 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了不同类别的邮件内容。主要特征如下:...
    packageimg
  • 项目文件数据集-justingrima

    2025年4月23日   

    项目文件数据集-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文档处理,数据挖掘,文本分析,信息检索,版本控制 数据概述: 该数据集包含了一系列项目文件的相关数据,记录了项目中各种类型文件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了项目文件的创建,修改和版本控制时间。...
    packageimg
  • 中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar

    2025年4月23日   

    中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语资源,文本分析,语言技术,人工智能 数据概述: 该数据集包含来自中越双语平行语料库的数据,记录了中越两种语言的对应文本。主要特征如下:...
    packageimg
  • Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp

    2025年4月23日   

    Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,网络文化,内容挖掘 数据概述: 该数据集包含来自Reddit平台的热门帖子标题数据,记录了平台上备受关注的帖子的标题信息。主要特征如下:...
    packageimg
  • 垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819

    2025年4月23日   

    垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819 数据来源:互联网公开数据 标签:垃圾短信,语音识别,数据集,机器学习,文本分析,自然语言处理,通信,反垃圾 数据概述: 该数据集包含了垃圾短信的语音识别结果,记录了通过语音识别技术转换后的垃圾短信文本数据。主要特征如下:...
    packageimg
  • 情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert

    2025年4月23日   

    情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert 数据来源:互联网公开数据 标签:情感分析,评论数据,数据集,自然语言处理,机器学习,文本分析,市场研究,用户体验 数据概述: 该数据集包含来自互联网公开平台的用户评论数据,记录了用户对不同产品,服务或内容的情感表达。主要特征如下:...
    packageimg
  • 多语言标记数据集MultilangTokensDataset-pranav51286

    2025年4月23日   

    多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:...
    packageimg
  • 金苹果VK和Telegram平台用户互动数据分析数据集-2024年6月12日-evgeny1928

    2025年4月23日   

    金苹果VK和Telegram平台用户互动数据分析数据集-2024年6月12日-evgeny1928 数据来源:互联网公开数据 标签:社交媒体,用户互动,内容分析,VK,Telegram,金苹果,帖子,互动数据,文本分析 数据概述:...
    packageimg
  • 电影情感分析数据集MovieSentimentAnalysisDataset-naufalalfarisi

    2025年4月23日   

    电影情感分析数据集MovieSentimentAnalysisDataset-naufalalfarisi 数据来源:互联网公开数据 标签:电影,情感分析,数据集,自然语言处理,机器学习,文本分析,评论,社交媒体 数据概述:该数据集包含来自多个电影评论网站的用户评论,记录了对电影的情感评价。主要特征如下:...
    packageimg
  • 网页链接与描述数据集-fan1dy

    2025年4月23日   

    网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。...
    packageimg