找到5,732个数据集

标签: 文本分析

过滤结果
  • 隐私测试法律案例数据集-minhnguyendichnhat

    2025年4月22日   

    隐私测试法律案例数据集-minhnguyendichnhat 数据来源:互联网公开数据 标签:法律案例,隐私保护,数据集,法律研究,隐私法,机器学习,自然语言处理,文本分析 数据概述: 该数据集包含来自不同来源的法律案例,主要涉及隐私保护相关的法律问题。主要特征如下: 时间跨度: 数据记录的时间范围为近年来,涵盖了最新的法律案例。 地理范围:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechTrawlforTrollDataset-sanghviharshil

    2025年4月22日   

    社交媒体仇恨言论检测数据集HateSpeechTrawlforTrollDataset-sanghviharshil 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,数据集,自然语言处理,文本分析,机器学习,情感分析,舆情监测 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与分析。主要特征如下:...
    packageimg
  • 聊天消息记录数据集ChatMessagesDataset-somya2115

    2025年4月22日   

    聊天消息记录数据集ChatMessagesDataset-somya2115 数据来源:互联网公开数据 标签:社交互动,数据集,文本分析,机器学习,自然语言处理,情感分析,聊天记录,行为研究 数据概述: 该数据集包含来自公开聊天平台的消息记录,记录了用户之间的聊天内容和互动行为。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 全球GPT-1N外部模型评估数据集-sasrdw

    2025年4月22日   

    全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。...
    packageimg
  • 儿童教育学习数据集ChildEducationLearningDataset-jerry111001

    2025年4月22日   

    儿童教育学习数据集ChildEducationLearningDataset-jerry111001 数据来源:互联网公开数据 标签:儿童,教育,学习,数据集,机器学习,文本分析,自然语言处理,行为分析 数据概述: 该数据集包含儿童教育学习相关的数据,记录了儿童在学习过程中的行为和表现。主要特征如下:...
    packageimg
  • 古兰经阿拉伯语词根数据集-mazharkarimi

    2025年4月22日   

    古兰经阿拉伯语词根数据集-mazharkarimi 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,词根,语言学,文本分析,自然语言处理,宗教研究,语义分析 数据概述: 该数据集包含了古兰经中出现的阿拉伯语词根信息。主要特征如下: 时间跨度: 数据记录的时间范围为古兰经的创作时期。 地理范围: 数据涵盖了古兰经文本中使用的所有阿拉伯语词根。...
    packageimg
  • 对话摘要数据集SAMSUM-jainikkhil

    2025年4月22日   

    对话摘要数据集SAMSUM-jainikkhil 数据来源:互联网公开数据 标签:对话摘要,文本摘要,自然语言处理,数据集,机器学习,语言模型,文本分析,信息检索 数据概述:该数据集包含来自社交媒体平台的对话摘要数据,记录了用户之间的对话及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 食谱评价与用户反馈数据集-shivanshpandeys

    2025年4月22日   

    食谱评价与用户反馈数据集-shivanshpandeys 数据来源:互联网公开数据 标签:食谱,评价,用户反馈,文本分析,情感分析,自然语言处理,机器学习,美食 数据概述: 该数据集包含来自各种来源的食谱评价和用户反馈数据,记录了用户对不同食谱的评价和反馈。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:...
    packageimg
  • DAIGT混合段落数据集v1-2024-serjhenrique

    2025年4月22日   

    DAIGT混合段落数据集v1-2024-serjhenrique 数据来源:互联网公开数据 标签:DAIGT,混合数据集,段落,机器学习,人类生成,文本分析,概率分布 数据概述: 本数据集是DAIGT...
    packageimg
  • 词云生成与分析数据集WordCloudGenerationandAnalysisDataset-omkarm0542

    2025年4月22日   

    词云生成与分析数据集WordCloudGenerationandAnalysisDataset-omkarm0542 数据来源:互联网公开数据 标签:词云,文本分析,数据集,数据可视化,自然语言处理,关键词提取,频率分析,信息检索 数据概述: 该数据集包含用于词云生成和分析的文本数据,记录了不同来源的文本内容和对应的词频信息。主要特征如下: 时间跨度:...
    packageimg
  • 推特灾难事件数据集TweetDisasterDataset-rjmanoj

    2025年4月22日   

    推特灾难事件数据集TweetDisasterDataset-rjmanoj 数据来源:互联网公开数据 标签:推特,灾难事件,自然语言处理,文本分析,机器学习,情感分析,社交媒体,危机管理 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与灾难事件相关的推文信息。主要特征如下:...
    packageimg
  • 表情符号转阿拉伯文本数据集EmojitoArabicTextDataset-hatemamine

    2025年4月22日   

    表情符号转阿拉伯文本数据集EmojitoArabicTextDataset-hatemamine 数据来源:互联网公开数据 标签:表情符号,文本转换,数据集,自然语言处理,机器学习,翻译,阿拉伯语,文本分析 数据概述:该数据集包含来自多个来源的表情符号与阿拉伯文本的对应关系数据,记录了表情符号及其对应的阿拉伯文本描述。主要特征如下:...
    packageimg
  • 冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726

    2025年4月22日   

    冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726 数据来源:互联网公开数据 标签:文学作品,数据集,文本分析,数据分析,机器学习,自然语言处理,故事分析,小说研究 数据概述: 该数据集包含来自《冰与火之歌》系列文学作品的数据,记录了该系列小说的文本内容及相关元数据。主要特征如下:...
    packageimg
  • CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin

    2025年4月22日   

    CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin 数据来源:互联网公开数据 标签:文本分析,阅读理解,自然语言处理,教育,数据集,机器学习,文本难度,语言学 数据概述: 该数据集包含CommonLit公司提供的文本阅读理解训练数据,旨在评估文本的可读性和难度。主要特征如下:...
    packageimg
  • 棒球比赛自动化洞察数据集AutomatedInsightsBaseballGameRoundupDataset-jialin97

    2025年4月22日   

    棒球比赛自动化洞察数据集AutomatedInsightsBaseballGameRoundupDataset-jialin97 数据来源:互联网公开数据 标签:棒球,体育,数据集,比赛分析,自然语言处理,数据挖掘,机器学习,文本分析 数据概述: 该数据集包含来自自动化洞察(Automated...
    packageimg
  • 僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal

    2025年4月22日   

    僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:...
    packageimg
  • 新闻处理数据集NewsProcessedDataset-mario123475

    2025年4月22日   

    新闻处理数据集NewsProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻,数据处理,文本分析,自然语言处理,机器学习,数据挖掘,信息提取,情感分析 数据概述:该数据集包含来自互联网的新闻数据,经过预处理和清洗,适用于文本分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti

    2025年4月22日   

    自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti 数据来源:互联网公开数据 标签:自然语言处理,特征工程,数据集,文本分析,机器学习,语言学,数据科学,人工智能...
    packageimg
  • TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin

    2025年4月22日   

    TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,视频内容,演讲者,主题分类,自然语言处理,教育与培训 数据概述:该数据集包含来自TED官方网站的演讲内容,记录了自2006年以来的TED演讲的详细信息和文本内容。主要特征如下:...
    packageimg
  • 越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia

    2025年4月22日   

    越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia 数据来源:互联网公开数据 标签:自然语言处理,文本分析,停用词,越南语,数据集,语言学,文本挖掘,信息检索 数据概述: 该数据集包含了越南语的停用词列表,旨在帮助文本处理和自然语言处理任务。主要特征如下:...
    packageimg