找到5,744个数据集

标签: 文本分析

过滤结果
  • 社交媒体医疗评论数据集TwitterMedicalReviewsDataset-ojasgolatkar

    2025年4月26日   

    社交媒体医疗评论数据集TwitterMedicalReviewsDataset-ojasgolatkar 数据来源:互联网公开数据 标签:社交媒体,医疗评论,数据集,文本分析,情感分析,健康信息,自然语言处理,机器学习 数据概述: 该数据集包含来自Twitter平台的医疗相关评论数据,记录了用户对医疗服务,药品,健康信息等的评论内容。主要特征如下:...
    packageimg
  • 亚马逊电子商务产品评论数据集AmazonE-commerceProductReviewDataset-henryshan

    2025年4月26日   

    亚马逊电子商务产品评论数据集AmazonE-commerceProductReviewDataset-henryshan 数据来源:互联网公开数据 标签:电子商务,产品评论,数据集,文本分析,情感分析,机器学习,消费者行为,自然语言处理 数据概述: 该数据集包含来自亚马逊电子商务平台的用户产品评论数据,记录了消费者对各类商品的评价信息。主要特征如下:...
    packageimg
  • TripAdvisor评论分析数据集TripAdvisor评论分析数据集-javieraahmesreansyah

    2025年4月26日   

    TripAdvisor评论分析数据集TripAdvisor评论分析数据集-javieraahmesreansyah 数据来源:互联网公开数据 标签:旅游评论,数据集,自然语言处理,机器学习,文本分析,酒店评价,顾客反馈,旅游行业 数据概述:该数据集包含来自TripAdvisor的已清理评论数据,特别适用于旅游评论分析,情感分析等任务。主要特征如下:...
    packageimg
  • 电商网站动态链接标注数据集EcommerceWebsitesDynamicURLsDataset-urlclusterer

    2025年4月26日   

    电商网站动态链接标注数据集EcommerceWebsitesDynamicURLsDataset-urlclusterer 数据来源:互联网公开数据 标签:电商,动态链接,数据集,URL,网络爬虫,机器学习,数据标注,文本分析 数据概述: 该数据集包含来自电商网站的动态链接数据,记录了经过标注的电商网站URL信息。主要特征如下: 时间跨度:...
    packageimg
  • 对话数据LSTM语言模型数据集Convo-LSTMDataset-michelegentili

    2025年4月26日   

    对话数据LSTM语言模型数据集Convo-LSTMDataset-michelegentili 数据来源:互联网公开数据 标签:对话数据,LSTM,自然语言处理,数据集,机器学习,文本分析,人工智能,对话系统 数据概述:该数据集包含来自多种来源的对话数据,特别适用于训练LSTM语言模型以进行自然语言处理任务。主要特征如下:...
    packageimg
  • 黑客新闻网站评论文本数据集HackerNewsTokenizedDataset-michapaliski

    2025年4月25日   

    黑客新闻网站评论文本数据集HackerNewsTokenizedDataset-michapaliski 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,新闻评论,情感分析,机器学习,数据挖掘,社区互动 数据概述: 该数据集包含来自黑客新闻网站(Hacker News)的评论文本数据,主要记录了用户在该网站上的评论内容。主要特征如下:...
    packageimg
  • 维基百科错误纠正数据集WikipediaErrorCorrectionsDataset-neechalkaran

    2025年4月25日   

    维基百科错误纠正数据集WikipediaErrorCorrectionsDataset-neechalkaran 数据来源:互联网公开数据 标签:维基百科,错误纠正,数据集,自然语言处理,文本分析,机器学习,信息质量,数据清洗 数据概述: 该数据集包含来自维基百科的错误纠正数据,记录了维基百科页面中存在的错误及其纠正信息。主要特征如下:...
    packageimg
  • 大型语言模型融合数据集LLMMergingDataset-aakashgupta21

    2025年4月25日   

    大型语言模型融合数据集LLMMergingDataset-aakashgupta21 数据来源:互联网公开数据 标签:大型语言模型,模型融合,数据集,自然语言处理,机器学习,人工智能,文本分析,深度学习 数据概述: 该数据集包含来自多个大型语言模型的数据,记录了模型融合过程中使用的文本数据和相关特征。主要特征如下:...
    packageimg
  • 自然语言处理文件数据集NLPFilesDataset-germanarley

    2025年4月25日   

    自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,语义分析,文本分类,人工智能 数据概述: 该数据集包含来自多个公开来源的自然语言处理相关文本文件,记录了不同类型的文本数据。主要特征如下:...
    packageimg
  • 瑞克与莫蒂Discord聊天机器人数据集RickandMortyDiscordChatbotDataset-zerofactorialisone

    2025年4月25日   

    瑞克与莫蒂Discord聊天机器人数据集RickandMortyDiscordChatbotDataset-zerofactorialisone 数据来源:互联网公开数据 标签:瑞克与莫蒂,Discord,聊天记录,数据集,自然语言处理,文本分析,机器学习,角色互动 数据概述: 该数据集包含了瑞克与莫蒂(Rick and...
    packageimg
  • YouTube评论数据集YouTubeCommentDataset-dharshinibalaji

    2025年4月25日   

    YouTube评论数据集YouTubeCommentDataset-dharshinibalaji 数据来源:互联网公开数据 标签:YouTube,评论,数据集,自然语言处理,文本分析,情感分析,社交媒体,用户行为 数据概述: 该数据集包含来自 YouTube 平台的评论数据,记录了用户在 YouTube 视频下方的评论信息。主要特征如下:...
    packageimg
  • AI生成内容检测数据集SanjanaAIFinalDataset-ksanjana2001

    2025年4月25日   

    AI生成内容检测数据集SanjanaAIFinalDataset-ksanjana2001 数据来源:互联网公开数据 标签:人工智能,文本分析,内容生成,数据集,机器学习,自然语言处理,检测模型,虚假信息 数据概述: 该数据集包含由Sanjana AI项目生成的内容以及人工标注的真实性标签,用于训练和评估AI生成内容的检测模型。主要特征如下:...
    packageimg
  • 情绪识别数据集主题-情绪识别场景-文本分析对象-中性-悲伤-快乐-愤怒时间-未指定-taherhasan

    2025年4月25日   

    情绪识别数据集主题-情绪识别场景-文本分析对象-中性-悲伤-快乐-愤怒时间-未指定-taherhasan 数据来源:互联网公开数据 标签:情绪识别,数据集,文本分析,自然语言处理,机器学习,情感计算,心理学,人工智能 数据概述:该数据集包含来自GoEmotions项目的情绪标注文本数据,主要记录了中性,悲伤,快乐和愤怒四种情绪的文本样本。主要特征如下:...
    packageimg
  • 网络欺凌预测数据集2021-2022数据集CyberbullyingPredictionDataset-sanzidasiddike3633

    2025年4月25日   

    网络欺凌预测数据集2021-2022数据集CyberbullyingPredictionDataset-sanzidasiddike3633 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,预测模型,机器学习,数据挖掘,文本分析,网络行为 数据概述:...
    packageimg
  • 种族歧视推文数据集RacismTweetsDataset-raghadabdullah

    2025年4月25日   

    种族歧视推文数据集RacismTweetsDataset-raghadabdullah 数据来源:互联网公开数据 标签:社交媒体,种族歧视,数据集,文本分析,情感分析,机器学习,社会研究,网络安全 数据概述: 该数据集包含来自社交媒体平台推文的文本数据,记录了涉及种族歧视的相关内容。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2022年。...
    packageimg
  • 电影票房与用户评价数据集10KMovieDataset-arifalam786

    2025年4月25日   

    电影票房与用户评价数据集10KMovieDataset-arifalam786 数据来源:互联网公开数据 标签:电影,票房,用户评价,数据集,电影分析,机器学习,文本分析,娱乐业 数据概述: 该数据集包含来自多个来源的电影数据,记录了电影的票房收入,用户评价,电影元数据等信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。...
    packageimg
  • 安然公司邮件数据集TruncatedEnronDataset-loryn808

    2025年4月25日   

    安然公司邮件数据集TruncatedEnronDataset-loryn808 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,社交网络分析,金融,欺诈,数据泄露 数据概述: 该数据集包含来自安然公司员工的电子邮件,记录了安然公司破产前后的内部通信。主要特征如下: 时间跨度:数据记录的时间范围为1999年至2002年。...
    packageimg
  • 古兰经数据集QuranDataDataset-raghadraghad

    2025年4月25日   

    古兰经数据集QuranDataDataset-raghadraghad 数据来源:互联网公开数据 标签:古兰经,宗教,数据集,文本分析,语言学,文学,语义分析,伊斯兰研究 数据概述: 该数据集包含了古兰经的文本数据,适用于宗教研究,文本分析和语言学研究等任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了古兰经的成书时期及后续版本。...
    packageimg
  • AST-SQL数据集AST-SQLDataset-youssefhazemfarouk

    2025年4月25日   

    AST-SQL数据集AST-SQLDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:自然语言处理,SQL生成,数据集,机器学习,数据库,文本分析,语言模型,数据查询 数据概述: 该数据集专注于自然语言到SQL的转换任务,记录了如何将自然语言查询语句转换为相应的SQL查询语句。主要特征如下:...
    packageimg
  • 英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa

    2025年4月25日   

    英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:...
    packageimg