找到5,735个数据集

标签: 文本分析

过滤结果
  • 印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi

    2025年4月24日   

    印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi 数据来源:互联网公开数据 标签:印地语,歌曲歌词,数据集,自然语言处理,文本分析,机器学习,音乐学,语言研究 数据概述: 该数据集包含来自印地语流行音乐作品的歌曲歌词数据,记录了印地语歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • 学生作业评分数据集TrainingDataAssignment1Dataset-andreasvalen

    2025年4月24日   

    学生作业评分数据集TrainingDataAssignment1Dataset-andreasvalen 数据来源:互联网公开数据 标签:教育,学生作业,评分,数据集,机器学习,文本分析,自然语言处理,学术资源 数据概述: 该数据集包含学生作业的评分数据,旨在用于训练和评估文本分析和机器学习模型。主要特征如下:...
    packageimg
  • 文本可读性分析数据集Readability-FoldsDataset-abhishek

    2025年4月24日   

    文本可读性分析数据集Readability-FoldsDataset-abhishek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,可读性评估,机器学习,教育技术,数据集,文本处理,语言模型 数据概述: 该数据集专注于文本可读性分析,记录了不同文本样本的可读性特征和评分。主要特征如下:...
    packageimg
  • 中等难度文章数据集MediumArticlesDataset-ashishkumargupta920

    2025年4月24日   

    中等难度文章数据集MediumArticlesDataset-ashishkumargupta920 数据来源:互联网公开数据 标签:中等难度文章,数据集,文本分析,自然语言处理,机器学习,内容创作,写作指导,教育 数据概述:该数据集来源于Medium平台,包含了一系列中等难度的文章数据,适用于文本分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 俄罗斯民法典数据集RussianCivilCodeDataset-visualcomments

    2025年4月24日   

    俄罗斯民法典数据集RussianCivilCodeDataset-visualcomments 数据来源:互联网公开数据 标签:民法典,法律,法规,俄罗斯,文本分析,自然语言处理,法学,法律文本 数据概述: 该数据集包含了俄罗斯民法典的全部内容,旨在为研究俄罗斯民事法律提供全面的文本资料。主要特征如下:...
    packageimg
  • 垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007

    2025年4月24日   

    垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,自然语言处理,机器学习,信息检索,文本挖掘 数据概述: 该数据集包含大量的电子邮件数据,用于垃圾邮件的识别和分类。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含不同时期的电子邮件。...
    packageimg
  • Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-mar...

    2025年4月24日   

    Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-marouanesidali 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,数据集,情感识别,语言学,机器学习 数据概述:...
    packageimg
  • 社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14

    2025年4月24日   

    社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述:...
    packageimg
  • 日本新干线旅行体验数据集-balaji1989

    2025年4月24日   

    日本新干线旅行体验数据集-balaji1989 数据来源:互联网公开数据 标签:交通运输,旅行体验,数据集,用户评价,文本分析,情感分析,机器学习,日本 数据概述: 该数据集包含了关于日本新干线旅行体验的文本数据,记录了用户对新干线旅行的各种评价和反馈。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了用户发布评价的时间段。 地理范围:...
    packageimg
  • Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval

    2025年4月24日   

    Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval 数据来源:互联网公开数据 标签:毒性检测,文本分析,自然语言处理,情感分析,数据集,机器学习,深度学习,社会科学 数据概述: 该数据集由 Jigsaw 组织提供,旨在促进对在线评论中毒性言论严重程度的评估。主要特征如下:...
    packageimg
  • 印地语语法学习数据集-donutkashvi

    2025年4月24日   

    印地语语法学习数据集-donutkashvi 数据来源:互联网公开数据 标签:印地语,语法,语言学,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含印地语语法学习相关的数据,旨在为印地语学习者和语言学研究人员提供资源。主要特征如下: 时间跨度:数据收集时间跨度不定,涵盖了印地语的多种语法现象。...
    packageimg
  • 自然语言处理灾难推文分类数据集NLPDisasterTweetClassificationDataset-nareshkumarmarrapu

    2025年4月24日   

    自然语言处理灾难推文分类数据集NLPDisasterTweetClassificationDataset-nareshkumarmarrapu 数据来源:互联网公开数据 标签:自然语言处理,推文,灾难,分类,文本分析,机器学习,社交媒体,应急管理 数据概述: 该数据集包含了从Twitter上收集的推文数据,旨在用于灾难事件相关的推文分类。主要特征如下:...
    packageimg
  • 鬼灭之刃动画剧集脚本数据集-jaytimber

    2025年4月24日   

    鬼灭之刃动画剧集脚本数据集-jaytimber 数据来源:互联网公开数据 标签:动画,剧本,动漫,鬼灭之刃,影视剧本,文本分析,文化研究,日语 数据概述: 该数据集包含鬼灭之刃动画剧集的脚本数据,记录了动画剧集中各集的内容和对话。主要特征如下: 时间跨度:数据记录的时间范围涵盖鬼灭之刃动画剧集的所有季。...
    packageimg
  • 小型语句情感分析数据集-alouloufiras

    2025年4月24日   

    小型语句情感分析数据集-alouloufiras 数据来源:互联网公开数据 标签:情感分析,文本分析,数据集,自然语言处理,机器学习,情绪识别,NLP,中文 数据概述:该数据集包含短小的中文语句,并标注了对应的情感极性。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代汉语的使用场景。...
    packageimg
  • 推特仇恨言论数据集TwitterHateSpeechDataset-dhruvi07

    2025年4月24日   

    推特仇恨言论数据集TwitterHateSpeechDataset-dhruvi07 数据来源:互联网公开数据 标签:仇恨言论,推特,社交媒体,文本分析,自然语言处理,情感分析,数据集,机器学习 数据概述: 该数据集包含了来自推特(Twitter)平台的推文数据,用于仇恨言论检测和分析。主要特征如下:...
    packageimg
  • 数据2019年美国数据分析师职位分析数据集-anjolaoluwaajayi

    2025年4月24日   

    2019年美国数据分析师职位分析数据集-anjolaoluwaajayi 数据来源:互联网公开数据 标签:数据分析,职位分析,美国,2019年,招聘信息,文本分析,自然语言处理,职业发展 数据概述:该数据集包含了2019年在美国发布的多个数据分析师职位信息。主要特征如下: 时间跨度:数据记录的时间范围为2019年全年。 地理范围:数据主要覆盖美国境内。...
    packageimg
  • 新闻文本数据集ScrapedNewsDataDataset-eilhie

    2025年4月24日   

    新闻文本数据集ScrapedNewsDataDataset-eilhie 数据来源:互联网公开数据 标签:新闻数据,文本分析,数据集,自然语言处理,机器学习,信息提取,数据挖掘,新闻媒体 数据概述: 该数据集包含来自互联网的公开新闻数据,记录了各类新闻文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从【起始年份】到【结束年份】。...
    packageimg
  • 问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk

    2025年4月24日   

    问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义理解,语言模型,教育技术,数据挖掘 数据概述: 该数据集包含来自多个来源的问题重述和表达优化数据,记录了不同领域问题的原始表述及其优化后的重述。主要特征如下:...
    packageimg
  • Jigsaw评论毒性验证数据集-hmikraminfo

    2025年4月24日   

    Jigsaw评论毒性验证数据集-hmikraminfo 数据来源:互联网公开数据 标签:自然语言处理,文本分析,毒性检测,数据集,机器学习,情感分析,评论,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,用于验证和评估文本毒性检测模型。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了大量的近期评论数据。...
    packageimg
  • 对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla

    2025年4月24日   

    对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla 数据来源:互联网公开数据 标签:对话记录,文本清理,数据集,自然语言处理,机器学习,文本分析,数据预处理,语言学 数据概述:该数据集包含经过清理的对话记录,适用于自然语言处理,文本分析等任务。主要特征如下:...
    packageimg