-
学术引用意图分类数据集
学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface... -
印度尼西亚垃圾邮件检测短信数据集1963-2021
印度尼西亚垃圾邮件检测短信数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件检测,短信数据,文本分析,分类模型,电子邮件,合法邮件,印度尼西亚 数据概述:... -
垃圾邮件分类邮件数据集
垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:... -
阿拉伯语推特情感分析数据集
阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:... -
马来西亚新闻推特账户数据集
马来西亚新闻推特账户数据集 数据来源:互联网公开数据 标签:马来西亚,新闻,推特,社交媒体分析,文本分析,时间序列,新闻媒体 数据概述: 本数据集包含2021年7月22日至2021年8月12日期间马来西亚4个主要新闻推特账户的推文信息,包括推文内容、推文来源、地理位置以及每个账户的粉丝数量。这四个账户分别是Berita Harian、Harian... -
俄罗斯矿业行业文本数据集2009-2023
俄罗斯矿业行业文本数据集2009-2023 数据来源:互联网公开数据 标签:矿业,俄罗斯,新闻,行业报告,文本分析,自然语言处理,数据挖掘 数据概述: 本数据集收录了2009年至2023年间约9万条新闻文章、新闻稿和矿业公司公共报告的俄语文本数据。数据通过自动抓取网站内容生成,经过句法切分处理,每行包含一个句子,适用于矿业行业文本分析。 数据用途概述:... -
-
Discord游戏改进建议与投票数据集-Discord服务器-时间不限
Discord游戏改进建议与投票数据集-Discord服务器-时间不限 数据来源:互联网公开数据 标签:游戏改进,Discord,社区反馈,NLP,文本分析,投票,建议,开发者,用户生成内容 数据概述:... -
COVID-19研究文章数据集
COVID-19研究文章数据集 数据来源:互联网公开数据 标签:COVID-19, 研究文章, 文本分析, 时间序列, 推荐系统, 情感分析, 机器学习 数据概述... -
调整文本数据集
调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:... -
谷歌新闻原始数据集
谷歌新闻原始数据集 数据来源:互联网公开数据 标签:谷歌新闻,原始数据,自然语言处理,文本分析,数据科学,新闻内容 数据概述: 本数据集包含从谷歌新闻收集的新闻文章集合,数据通过网络抓取获得,涵盖多个新闻来源的原始、未加工文本。该数据集提供了广泛的新聞内容,适用于自然语言处理项目、文本分析和其他需要原始文本数据的数据科学应用。 数据用途概述:... -
Goodreads书籍样本数据清洗与整理数据集
Goodreads书籍样本数据清洗与整理数据集 数据来源:互联网公开数据 标签:书籍,Goodreads,数据清洗,文本分析,图书推荐,Python,数据整理 数据概述:... -
AskReddit热门评论数据集-NLP文本分析
AskReddit热门评论数据集-NLP文本分析 数据来源:互联网公开数据 标签:AskReddit,评论,Reddit,文本分析,NLP,自然语言处理,情感分析,热门评论,数据分析,EDA 数据概述: 本数据集包含了过去一个月内AskReddit版块中,最热门的评论数据。... -
-
数据科学领域访谈博客文章互动表现数据集
数据科学领域访谈博客文章互动表现数据集 数据来源:互联网公开数据 标签:数据科学,访谈,博客,机器学习,人物访谈,文本分析,社交媒体,互动分析 数据概述: 本数据集包含了Sanyam... -
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集
印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集 数据来源:互联网公开数据 标签:Covaxin,新冠疫苗,疫苗,推文,社交媒体,巴拉特生物科技,疫情,公共卫生,文本分析 数据概述: 本数据集包含了巴拉特生物科技公司(Bharat Biotech)在Twitter平台上发布的超过200条关于Covaxin新冠疫苗的推文。... -
古兰经数字奇迹分析数据集1990-2023
古兰经数字奇迹分析数据集1990-2023 数据来源:互联网公开数据 标签:古兰经,数字奇迹,伊斯兰教,文化研究,历史文献,文本分析,数据科学 数据概述:... -
孟加拉每日英语新闻文章数据集
孟加拉每日英语新闻文章数据集 数据来源:互联网公开数据 标签:孟加拉,新闻,自然语言处理,文本分析,时间序列,媒体研究,信息提取 数据概述: 本数据集收录了孟加拉每日英语新闻文章,数据来源包括五个主要的孟加拉英语新闻门户:The Daily Star、The Financial Express、New Age bd、Dhaka Tribune 和... -
互联网公开数据集深度洞察与应用分析
标题:互联网公开数据集深度洞察与应用分析 数据内容: 该数据集包含以下字段: 1. id:标识数据记录的唯一标识符,共有53043种不同的值。 2. statement:描述具体事件或信息的文本字段,共有51074种不同的值。 3. status:表示事件或信息的状态,共有7种不同的值。 数据来源: 互联网公开数据 数据用途:... -
互联网公开数据集垃圾邮件分类与文本分析
标题:互联网公开数据集垃圾邮件分类与文本分析 数据内容:该数据集包含文本内容(text)和垃圾邮件分类(spam)两个字段。文本内容字段包含5695种不同的文本值,垃圾邮件分类字段包含两种不同的分类值(0和1)。 数据来源:互联网公开数据...