找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 学术论文引用关系数据集PaperDataset-changpham2k

    2025年4月24日   

    学术论文引用关系数据集PaperDataset-changpham2k 数据来源:互联网公开数据 标签:学术论文,引用关系,数据集,文献计量学,知识图谱,自然语言处理,学术研究,科研分析 数据概述: 该数据集包含学术论文的引用关系数据,记录了论文之间的引用和被引用关系。主要特征如下: 时间跨度:数据记录的时间范围从1900年至今。...
    packageimg
  • 新闻社论与评论分析数据集NewsEditorialswithAnalysisDataset-rw2627

    2025年4月24日   

    新闻社论与评论分析数据集NewsEditorialswithAnalysisDataset-rw2627 数据来源:互联网公开数据 标签:新闻分析,社论,数据集,文本挖掘,自然语言处理,情感分析,媒体研究,机器学习 数据概述: 该数据集包含来自多个新闻媒体的社论和评论文章,记录了不同作者对各类社会事件,政策和公共话题的立场与观点。主要特征如下:...
    packageimg
  • 印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi

    2025年4月24日   

    印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi 数据来源:互联网公开数据 标签:印地语,歌曲歌词,数据集,自然语言处理,文本分析,机器学习,音乐学,语言研究 数据概述: 该数据集包含来自印地语流行音乐作品的歌曲歌词数据,记录了印地语歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • 众筹项目描述数据集KickstarterProjectsDescriptionsDataset-alonsopuente

    2025年4月24日   

    众筹项目描述数据集KickstarterProjectsDescriptionsDataset-alonsopuente 数据来源:互联网公开数据 标签:众筹,项目描述,数据集,自然语言处理,机器学习,项目管理,商业分析,市场营销 数据概述: 该数据集包含来自Kickstarter平台的众筹项目描述数据,记录了各个项目的详细信息。主要特征如下:...
    packageimg
  • 学生作业评分数据集TrainingDataAssignment1Dataset-andreasvalen

    2025年4月24日   

    学生作业评分数据集TrainingDataAssignment1Dataset-andreasvalen 数据来源:互联网公开数据 标签:教育,学生作业,评分,数据集,机器学习,文本分析,自然语言处理,学术资源 数据概述: 该数据集包含学生作业的评分数据,旨在用于训练和评估文本分析和机器学习模型。主要特征如下:...
    packageimg
  • 文本可读性分析数据集Readability-FoldsDataset-abhishek

    2025年4月24日   

    文本可读性分析数据集Readability-FoldsDataset-abhishek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,可读性评估,机器学习,教育技术,数据集,文本处理,语言模型 数据概述: 该数据集专注于文本可读性分析,记录了不同文本样本的可读性特征和评分。主要特征如下:...
    packageimg
  • 数据2019年骄傲新闻文章数据集2019PrideNewsArticlesDataset-peakmetrics

    2025年4月24日   

    2019年骄傲新闻文章数据集2019PrideNewsArticlesDataset-peakmetrics 数据来源:互联网公开数据 标签:新闻文章,数据集,新闻分析,文本挖掘,情感分析,新闻媒体,机器学习,自然语言处理 数据概述: 该数据集包含来自2019年关于“骄傲”(Pride)主题的新闻文章,记录了相关新闻事件的报道和评论。主要特征如下:...
    packageimg
  • 中等难度文章数据集MediumArticlesDataset-ashishkumargupta920

    2025年4月24日   

    中等难度文章数据集MediumArticlesDataset-ashishkumargupta920 数据来源:互联网公开数据 标签:中等难度文章,数据集,文本分析,自然语言处理,机器学习,内容创作,写作指导,教育 数据概述:该数据集来源于Medium平台,包含了一系列中等难度的文章数据,适用于文本分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 俄罗斯民法典数据集RussianCivilCodeDataset-visualcomments

    2025年4月24日   

    俄罗斯民法典数据集RussianCivilCodeDataset-visualcomments 数据来源:互联网公开数据 标签:民法典,法律,法规,俄罗斯,文本分析,自然语言处理,法学,法律文本 数据概述: 该数据集包含了俄罗斯民法典的全部内容,旨在为研究俄罗斯民事法律提供全面的文本资料。主要特征如下:...
    packageimg
  • 大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin

    2025年4月24日   

    大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin 数据来源:互联网公开数据 标签:自然语言处理,大规模,中文,基准模型,数据集,文本生成,语言理解,机器学习,人工智能 数据概述: 该数据集是LGQBM(大规模高质量中文基准模型)项目的一部分,旨在支持中文自然语言处理(NLP)模型的训练和评估。主要特征如下:...
    packageimg
  • 垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007

    2025年4月24日   

    垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,自然语言处理,机器学习,信息检索,文本挖掘 数据概述: 该数据集包含大量的电子邮件数据,用于垃圾邮件的识别和分类。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含不同时期的电子邮件。...
    packageimg
  • Groww平台用户评论数据集2024年2月13日-jaiprakashsiyyadri

    2025年4月24日   

    Groww平台用户评论数据集2024年2月13日-jaiprakashsiyyadri 数据来源:互联网公开数据 标签:用户评论,金融科技,投资理财,情感分析,自然语言处理,数据集,用户体验,Groww 数据概述: 该数据集包含了来自 Groww 平台的10万条用户评论,记录了用户对该平台投资理财服务的反馈。主要特征如下: 时间跨度:...
    packageimg
  • Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-mar...

    2025年4月24日   

    Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-marouanesidali 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,数据集,情感识别,语言学,机器学习 数据概述:...
    packageimg
  • Flickr30K图像描述数据集Flickr30KImageCaptionsDataset-sayedul45

    2025年4月24日   

    Flickr30K图像描述数据集Flickr30KImageCaptionsDataset-sayedul45 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,机器学习,图像标注,视觉理解,多模态学习...
    packageimg
  • 社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14

    2025年4月24日   

    社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述:...
    packageimg
  • 情感分析数据集SentimentalDataset-felixkiprotich

    2025年4月24日   

    情感分析数据集SentimentalDataset-felixkiprotich 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同场景下的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval

    2025年4月24日   

    Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval 数据来源:互联网公开数据 标签:毒性检测,文本分析,自然语言处理,情感分析,数据集,机器学习,深度学习,社会科学 数据概述: 该数据集由 Jigsaw 组织提供,旨在促进对在线评论中毒性言论严重程度的评估。主要特征如下:...
    packageimg
  • 文本编辑与隐私保护数据集Redaction-NewDataset-edithram23

    2025年4月24日   

    文本编辑与隐私保护数据集Redaction-NewDataset-edithram23 数据来源:互联网公开数据 标签:文本编辑,隐私保护,数据集,自然语言处理,数据脱敏,机器学习,信息安全,隐私计算 数据概述: 该数据集包含用于文本编辑和隐私保护任务的文本数据,记录了原始文本及其经过不同程度编辑后的版本。主要特征如下:...
    packageimg
  • 印地语语法学习数据集-donutkashvi

    2025年4月24日   

    印地语语法学习数据集-donutkashvi 数据来源:互联网公开数据 标签:印地语,语法,语言学,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含印地语语法学习相关的数据,旨在为印地语学习者和语言学研究人员提供资源。主要特征如下: 时间跨度:数据收集时间跨度不定,涵盖了印地语的多种语法现象。...
    packageimg
  • 孟加拉国物流应用客户评论数据集-mdrittiquealam

    2025年4月24日   

    孟加拉国物流应用客户评论数据集-mdrittiquealam 数据来源:互联网公开数据 标签:物流,客户评论,情感分析,自然语言处理,移动应用,数据集,用户体验,孟加拉国 数据概述: 该数据集包含了来自孟加拉国物流应用的用户评论数据,旨在分析用户对物流服务的体验和反馈。主要特征如下: 时间跨度:...
    packageimg