-
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles 数据来源:互联网公开数据 标签:诗歌, 土耳其语, 文本分析, 诗歌创作, 情感分析, 文本挖掘, 自然语言处理, 文化研究 数据概述: 该数据集包含来自土耳其的诗歌文本,记录了不同诗人的作品。主要特征如下:... -
科研机构缩写预测评估数据集ResearchInstitutionAbbreviationPredictionEvaluationDataset-vanle73
科研机构缩写预测评估数据集ResearchInstitutionAbbreviationPredictionEvaluationDataset-vanle73 数据来源:互联网公开数据 标签:机构缩写, 文本预测, 机器学习, 自然语言处理, 评估数据集, 命名实体识别, 深度学习, 数据分析 数据概述:... -
中文社交媒体情感分析数据集ChineseSocialMediaSentimentAnalysisDataset-elhamamichaimae
中文社交媒体情感分析数据集ChineseSocialMediaSentimentAnalysisDataset-elhamamichaimae 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 自然语言处理, 情感分类, 中文文本, 舆情分析, 机器学习 数据概述:... -
虚假与真实新闻数据集-noyeemhossain135
虚假与真实新闻数据集-noyeemhossain135 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,数据挖掘 数据概述:该数据集包含来自互联网上的新闻文章,记录了虚假新闻和真实新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了新闻文章的发布时间。... -
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,语料库,越南语,苗语,语言学,自然语言处理,双语数据,文本数据 数据概述: 该数据集包含越南语和苗语的双语平行文本,旨在促进越南语和苗语之间的机器翻译研究。主要特征如下:... -
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword... -
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:... -
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:... -
数据1-3个月垃圾邮件与正常邮件分类数据集1-3MonthsCleanedSpamandHamEmailsDataset-ashishgoraniya
1-3个月垃圾邮件与正常邮件分类数据集1-3MonthsCleanedSpamandHamEmailsDataset-ashishgoraniya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,数据挖掘,信息安全 数据概述:... -
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings 数据来源:互联网公开数据 标签:恐怖故事,数据集,文本分析,情感分析,自然语言处理,社交媒体,机器学习,内容创作 数据概述: 该数据集包含来自Reddit平台上的恐怖故事数据,记录了用户发布的各类恐怖故事内容。主要特征如下:... -
多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat
多语言字幕数据集Opensubtitles6LanguagesforJigsaw2020-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,多语言文本,字幕数据,机器学习,文本分类,情感分析,数据集,人工智能 数据概述:... -
垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk
垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk 数据来源:互联网公开数据 标签:垃圾信息过滤,Quora问答,文本分类,自然语言处理,机器学习,数据挖掘,信息检索,网络安全 数据概述:... -
图像描述生成数据集ImageCaptionsDataset-sandhyas29
图像描述生成数据集ImageCaptionsDataset-sandhyas29 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像识别,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练图像描述生成模型。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期和场景的图像。... -
基于BERT的电影评论情感分析数据集DF-CleanedBERT-MovieReviewSentimentAnalysisDataset-trngththanhh
基于BERT的电影评论情感分析数据集DF-CleanedBERT-MovieReviewSentimentAnalysisDataset-trngththanhh 数据来源:互联网公开数据 标签:情感分析,自然语言处理,电影评论,BERT,数据集,文本分类,机器学习,情感挖掘 数据概述:... -
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345 数据来源:互联网公开数据 标签:社交媒体,Reddit,数据集,文本分析,自然语言处理,情感分析,社区研究,机器学习 数据概述: 该数据集包含了来自加州大学圣迭戈分校(UCSD)相关的 Reddit 子版块的数据,记录了用户在 Reddit... -
社交媒体用户情绪分析数据集SocialMediaUserSentimentAnalysis-shivang7514
社交媒体用户情绪分析数据集SocialMediaUserSentimentAnalysis-shivang7514 数据来源:互联网公开数据 标签:情绪分析, 社交媒体, 文本情感, 自然语言处理, 情感分类, 舆情分析, 数据挖掘, 机器学习 数据概述:... -
搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld
搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld 数据来源:互联网公开数据 标签:搜索引擎,查询分析,数据集,自然语言处理,文本挖掘,信息检索,用户行为,数据科学 数据概述: 该数据集包含来自搜索引擎的预处理和分词后的查询数据,记录了用户输入的搜索查询信息。主要特征如下:... -
豆瓣电影评论数据集-ynanyue
豆瓣电影评论数据集-ynanyue 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本挖掘,用户行为,推荐系统 数据概述: 该数据集包含来自豆瓣电影网站的电影评论数据,记录了用户对电影的评价、观影体验以及相关信息。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据抓取的时间窗口。... -
数学问题解答数据集MathematicsProblemAnsweringDataset-saadtahmid
数学问题解答数据集MathematicsProblemAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:数学, 问题解答, 自然语言处理, 文本生成, 数学教育, 问答系统, 机器学习, 数据集 数据概述: 该数据集包含来自互联网的数学问题及其对应的解答,旨在用于训练和评估数学问题解答模型。主要特征如下:... -
越南新闻数据集VietNews数据集-trananhcuong
越南新闻数据集VietNews数据集-trananhcuong 数据来源:互联网公开数据 标签:越南新闻, 数据集, 自然语言处理, 机器学习, 文本分析, 新闻学, 文本挖掘, 社会研究...