-
安卓应用分析与用户评论数据集-kakamana
安卓应用分析与用户评论数据集-kakamana 数据来源:互联网公开数据 标签:安卓应用,用户评论,情感分析,自然语言处理,移动应用,应用商店,数据挖掘,文本分析 数据概述: 该数据集包含安卓应用相关信息以及用户评论数据,用于分析用户对应用的评价和使用情况。主要特征如下: 时间跨度:数据记录的时间范围为应用发布至今。... -
命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1
命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,深度学习,人工智能 数据概述: 该数据集包含标注好的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下:... -
简历数据库CVDatabase数据分析数据集-anissamylaamri
简历数据库CVDatabase数据分析数据集-anissamylaamri 数据来源:互联网公开数据 标签:简历,数据库,人才,招聘,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自简历数据库的数据,记录了求职者的个人信息,教育背景,工作经历,技能特长等。主要特征如下:... -
坏兔子BadBunny歌曲歌词数据集2022年1月30日-lvlvlv210
坏兔子BadBunny歌曲歌词数据集2022年1月30日-lvlvlv210 数据来源:互联网公开数据 标签:音乐,歌词,坏兔子,西班牙语,数据集,文本分析,自然语言处理,文化研究 数据概述: 该数据集包含了坏兔子(Bad Bunny)的歌曲歌词数据,记录了他在2022年1月30日之前的歌曲的歌词信息。主要特征如下:... -
焦虑情绪Reddit讨论数据集2020-2023RedditAnxietyDiscussionDataset-countmein
焦虑情绪Reddit讨论数据集2020-2023RedditAnxietyDiscussionDataset-countmein 数据来源:互联网公开数据 标签:焦虑情绪,社交媒体,数据集,自然语言处理,心理健康,情感分析,机器学习,文本分析... -
印尼传统诗歌Pantun数据集-husnifadhilah
印尼传统诗歌Pantun数据集-husnifadhilah 数据来源:互联网公开数据 标签:诗歌,文学,数据集,印尼文化,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含了印度尼西亚的传统诗歌(Pantun)文本数据,记录了大量的Pantun诗句,是研究印尼传统文化和文学的重要资源。主要特征如下: 时间跨度:... -
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai 数据来源:互联网公开数据 标签:越南语,文本摘要,数据集,自然语言处理,NLP,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自越南新闻网站的文章及其对应的摘要。主要特征如下:... -
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai
高等教育领域命名实体识别数据集ThaiHocNERDataset-playerthai 数据来源:互联网公开数据 标签:命名实体识别,教育领域,数据集,自然语言处理,机器学习,文本分析,学术研究,信息提取 数据概述: 该数据集专注于高等教育领域的文本数据,记录了包含命名实体的文本样本,适用于命名实体识别(NER)任务的训练和评估。主要特征如下:... -
新闻头条数据集NewsHeadlineDataset-satyamneelmani
新闻头条数据集NewsHeadlineDataset-satyamneelmani 数据来源:互联网公开数据 标签:新闻,头条,数据集,文本分析,自然语言处理,机器学习,信息检索,舆情分析 数据概述:该数据集包含来自各大新闻媒体的头条新闻数据,记录了新闻的标题,发布时间,来源媒体,新闻类别等信息。主要特征如下:... -
大型情绪数据集LargeEmotionDataset-ubbarapusiri
大型情绪数据集LargeEmotionDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情绪识别,数据集,自然语言处理,情感分析,机器学习,心理学,文本分析,人工智能 数据概述: 该数据集包含了来自多个来源的情绪标注文本数据,适用于情绪识别和情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15 数据来源:互联网公开数据 标签:问答平台,自然语言处理,数据集,文本分析,机器学习,语义分析,社交媒体,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题数据,记录了用户提出的各种问题及其相关信息。主要特征如下:... -
Reddit抑郁症讨论数据集RedditDepressionDiscussionDataset-cngphit
Reddit抑郁症讨论数据集RedditDepressionDiscussionDataset-cngphit 数据来源:互联网公开数据 标签:心理健康,抑郁症,数据集,社交媒体,文本分析,情感分析,机器学习,心理学 数据概述: 该数据集包含来自Reddit平台的抑郁症讨论数据,记录了用户在相关版块发布的帖子,评论及互动信息。主要特征如下:... -
垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara
垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara 数据来源:互联网公开数据 标签:垃圾邮件,短信,数据集,文本分析,机器学习,自然语言处理,信息过滤,网络安全 数据概述:该数据集包含来自多个来源的垃圾邮件和短信数据,记录了不同类型的垃圾信息。主要特征如下:... -
推特用户互动数据集TwitterUserInteractionDataset-monserratromero
推特用户互动数据集TwitterUserInteractionDataset-monserratromero 数据来源:互联网公开数据 标签:社交媒体,推特,用户互动,数据集,文本分析,情感分析,机器学习,数据挖掘 数据概述: 该数据集包含来自推特平台的用户互动数据,记录了用户之间的各种互动行为。主要特征如下:... -
亚马逊手机产品评论数据集AmazonMobilePhoneReviewsDataset-rajatagg
亚马逊手机产品评论数据集AmazonMobilePhoneReviewsDataset-rajatagg 数据来源:互联网公开数据 标签:电子商务,产品评论,数据集,消费者行为,文本分析,机器学习,情感分析,自然语言处理 数据概述: 该数据集包含来自亚马逊电商平台上的手机产品用户评论数据,记录了消费者对手机产品的评价和反馈。主要特征如下:... -
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac 数据来源:互联网公开数据 标签:学术研究,论文摘要,自然语言处理,文本分析,信息检索,机器学习,学术文献,文本挖掘 数据概述: 该数据集包含来自不同学术领域的论文摘要,记录了论文的研究主题,方法,结果和结论。主要特征如下:... -
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。... -
主题平衡数据集Topic-BalancedDataset-karimamd95
主题平衡数据集Topic-BalancedDataset-karimamd95 数据来源:互联网公开数据 标签:数据集,主题分类,机器学习,平衡数据,文本分析,自然语言处理,数据分析,人工智能 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同主题的文本内容,旨在为机器学习和文本分类任务提供平衡的数据支持。主要特征如下:... -
文本相似度分析数据集前1万行CosineSimilaritiesDataset-First10kRows-prateiklohani
文本相似度分析数据集前1万行CosineSimilaritiesDataset-First10kRows-prateiklohani 数据来源:互联网公开数据 标签:文本分析,相似度,数据集,自然语言处理,机器学习,余弦相似度,数据挖掘,向量化 数据概述: 该数据集包含了文本相似度分析的结果,记录了文本对之间的余弦相似度得分。主要特征如下:... -
英国广播公司新闻文章数据集BBCNewsArticleDataset-mohamedtarek111
英国广播公司新闻文章数据集BBCNewsArticleDataset-mohamedtarek111 数据来源:互联网公开数据 标签:新闻文章,文本分析,自然语言处理,数据集,文本分类,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章数据,记录了BBC新闻网站上发布的各类新闻文章。主要特征如下:...