-
学术论文引用关系数据集PaperDataset-changpham2k
学术论文引用关系数据集PaperDataset-changpham2k 数据来源:互联网公开数据 标签:学术论文,引用关系,数据集,文献计量学,知识图谱,自然语言处理,学术研究,科研分析 数据概述: 该数据集包含学术论文的引用关系数据,记录了论文之间的引用和被引用关系。主要特征如下: 时间跨度:数据记录的时间范围从1900年至今。... -
新闻社论与评论分析数据集NewsEditorialswithAnalysisDataset-rw2627
新闻社论与评论分析数据集NewsEditorialswithAnalysisDataset-rw2627 数据来源:互联网公开数据 标签:新闻分析,社论,数据集,文本挖掘,自然语言处理,情感分析,媒体研究,机器学习 数据概述: 该数据集包含来自多个新闻媒体的社论和评论文章,记录了不同作者对各类社会事件,政策和公共话题的立场与观点。主要特征如下:... -
印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi
印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi 数据来源:互联网公开数据 标签:印地语,歌曲歌词,数据集,自然语言处理,文本分析,机器学习,音乐学,语言研究 数据概述: 该数据集包含来自印地语流行音乐作品的歌曲歌词数据,记录了印地语歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
众筹项目描述数据集KickstarterProjectsDescriptionsDataset-alonsopuente
众筹项目描述数据集KickstarterProjectsDescriptionsDataset-alonsopuente 数据来源:互联网公开数据 标签:众筹,项目描述,数据集,自然语言处理,机器学习,项目管理,商业分析,市场营销 数据概述: 该数据集包含来自Kickstarter平台的众筹项目描述数据,记录了各个项目的详细信息。主要特征如下:... -
学生作业评分数据集TrainingDataAssignment1Dataset-andreasvalen
学生作业评分数据集TrainingDataAssignment1Dataset-andreasvalen 数据来源:互联网公开数据 标签:教育,学生作业,评分,数据集,机器学习,文本分析,自然语言处理,学术资源 数据概述: 该数据集包含学生作业的评分数据,旨在用于训练和评估文本分析和机器学习模型。主要特征如下:... -
文本可读性分析数据集Readability-FoldsDataset-abhishek
文本可读性分析数据集Readability-FoldsDataset-abhishek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,可读性评估,机器学习,教育技术,数据集,文本处理,语言模型 数据概述: 该数据集专注于文本可读性分析,记录了不同文本样本的可读性特征和评分。主要特征如下:... -
数据2019年骄傲新闻文章数据集2019PrideNewsArticlesDataset-peakmetrics
2019年骄傲新闻文章数据集2019PrideNewsArticlesDataset-peakmetrics 数据来源:互联网公开数据 标签:新闻文章,数据集,新闻分析,文本挖掘,情感分析,新闻媒体,机器学习,自然语言处理 数据概述: 该数据集包含来自2019年关于“骄傲”(Pride)主题的新闻文章,记录了相关新闻事件的报道和评论。主要特征如下:... -
中等难度文章数据集MediumArticlesDataset-ashishkumargupta920
中等难度文章数据集MediumArticlesDataset-ashishkumargupta920 数据来源:互联网公开数据 标签:中等难度文章,数据集,文本分析,自然语言处理,机器学习,内容创作,写作指导,教育 数据概述:该数据集来源于Medium平台,包含了一系列中等难度的文章数据,适用于文本分析,自然语言处理等任务。主要特征如下:... -
俄罗斯民法典数据集RussianCivilCodeDataset-visualcomments
俄罗斯民法典数据集RussianCivilCodeDataset-visualcomments 数据来源:互联网公开数据 标签:民法典,法律,法规,俄罗斯,文本分析,自然语言处理,法学,法律文本 数据概述: 该数据集包含了俄罗斯民法典的全部内容,旨在为研究俄罗斯民事法律提供全面的文本资料。主要特征如下:... -
大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin
大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin 数据来源:互联网公开数据 标签:自然语言处理,大规模,中文,基准模型,数据集,文本生成,语言理解,机器学习,人工智能 数据概述: 该数据集是LGQBM(大规模高质量中文基准模型)项目的一部分,旨在支持中文自然语言处理(NLP)模型的训练和评估。主要特征如下:... -
垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007
垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,自然语言处理,机器学习,信息检索,文本挖掘 数据概述: 该数据集包含大量的电子邮件数据,用于垃圾邮件的识别和分类。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含不同时期的电子邮件。... -
Groww平台用户评论数据集2024年2月13日-jaiprakashsiyyadri
Groww平台用户评论数据集2024年2月13日-jaiprakashsiyyadri 数据来源:互联网公开数据 标签:用户评论,金融科技,投资理财,情感分析,自然语言处理,数据集,用户体验,Groww 数据概述: 该数据集包含了来自 Groww 平台的10万条用户评论,记录了用户对该平台投资理财服务的反馈。主要特征如下: 时间跨度:... -
Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-mar...
Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-marouanesidali 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,数据集,情感识别,语言学,机器学习 数据概述:... -
Flickr30K图像描述数据集Flickr30KImageCaptionsDataset-sayedul45
Flickr30K图像描述数据集Flickr30KImageCaptionsDataset-sayedul45 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,机器学习,图像标注,视觉理解,多模态学习... -
社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14
社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述:... -
情感分析数据集SentimentalDataset-felixkiprotich
情感分析数据集SentimentalDataset-felixkiprotich 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同场景下的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval
Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval 数据来源:互联网公开数据 标签:毒性检测,文本分析,自然语言处理,情感分析,数据集,机器学习,深度学习,社会科学 数据概述: 该数据集由 Jigsaw 组织提供,旨在促进对在线评论中毒性言论严重程度的评估。主要特征如下:... -
文本编辑与隐私保护数据集Redaction-NewDataset-edithram23
文本编辑与隐私保护数据集Redaction-NewDataset-edithram23 数据来源:互联网公开数据 标签:文本编辑,隐私保护,数据集,自然语言处理,数据脱敏,机器学习,信息安全,隐私计算 数据概述: 该数据集包含用于文本编辑和隐私保护任务的文本数据,记录了原始文本及其经过不同程度编辑后的版本。主要特征如下:... -
印地语语法学习数据集-donutkashvi
印地语语法学习数据集-donutkashvi 数据来源:互联网公开数据 标签:印地语,语法,语言学,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含印地语语法学习相关的数据,旨在为印地语学习者和语言学研究人员提供资源。主要特征如下: 时间跨度:数据收集时间跨度不定,涵盖了印地语的多种语法现象。... -
孟加拉国物流应用客户评论数据集-mdrittiquealam
孟加拉国物流应用客户评论数据集-mdrittiquealam 数据来源:互联网公开数据 标签:物流,客户评论,情感分析,自然语言处理,移动应用,数据集,用户体验,孟加拉国 数据概述: 该数据集包含了来自孟加拉国物流应用的用户评论数据,旨在分析用户对物流服务的体验和反馈。主要特征如下: 时间跨度:...