-
古兰经文本数据集1963-2021
古兰经文本数据集1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,自然语言处理,情感分析,文本分类,主题建模,语言生成,宗教文本,文化研究 数据概述:...
-
Goodreads名言数据集
Goodreads名言数据集 数据来源:互联网公开数据 标签:灵感,引用,作者,标签,点赞数,激励,数据分析,文本挖掘 数据概述: 本数据集包含了从Goodreads网站收集的名言记录。数据集包含5个字段:索引、引用内容、引用作者、引用标签(以分号分隔)和引用的点赞数。这些数据涵盖了广泛的名言,旨在帮助研究人们获取灵感的来源和模式。 数据用途概述:...
-
航空客户评论数据集
航空客户评论数据集 数据来源:互联网公开数据 标签:航空,客户评论,自然语言处理,文本清理,词元化,情感分析,预测建模 数据概述: 本数据集包含关于航空公司的客户文本评论,涵盖了乘客对航空公司服务的多方面反馈。数据集为学习、实践或测试初学者到中级的自然语言处理任务提供了丰富的资源,包括文本清理、词元化、情感分析以及基于分析结果的预测建模。...
-
印度互联网言论仇恨言论检测数据集1963-2021
印度互联网言论仇恨言论检测数据集1963-2021 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,言论分析,情绪分析,数据标注,研究工具 数据概述:...
-
泽连斯基与普京新闻稿数据集
泽连斯基与普京新闻稿数据集 数据来源:互联网公开数据 标签:乌克兰,俄罗斯,政治分析,文本挖掘,情感分析,信息战,新闻传播,政治沟通,国际关系,舆论分析 数据概述:...
-
QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题
QuAIL阅读理解多选题数据集-新闻-用户故事-小说和博客-多领域-15000题 数据来源:互联网公开数据 标签:阅读理解,多选题,自然语言处理,机器学习,文本理解,问题解答,新闻,用户故事,小说,博客 数据概述:...
-
孟加拉每日英语新闻文章数据集
孟加拉每日英语新闻文章数据集 数据来源:互联网公开数据 标签:孟加拉,新闻,自然语言处理,文本分析,时间序列,媒体研究,信息提取 数据概述: 本数据集收录了孟加拉每日英语新闻文章,数据来源包括五个主要的孟加拉英语新闻门户:The Daily Star、The Financial Express、New Age bd、Dhaka Tribune 和...
-
谷歌应用商店热门游戏App用户评论数据集
谷歌应用商店热门游戏App用户评论数据集 数据来源:互联网公开数据 标签:游戏App,用户评论,游戏评测,游戏分析,玩家反馈,移动游戏,谷歌应用商店 数据概述: 本数据集收录了来自谷歌应用商店的热门游戏App的Top...
-
烹饪平台用户评论与互动信息食谱评论与评分反馈数据集
数据来源 互联网公开数据 数据字段 Recipe_Name(食谱名称):用户评价所对应的食谱标题。 Recipe_Rank(食谱排名):食谱在平台前100名榜单中的排名情况。 Recipe_ID(食谱代码):每个食谱的唯一标识符。 User_ID(用户ID):用户的唯一身份标识。 User_Name(用户名):注册用户的显示名称。...
-
互联网公开简历数据集分析
标题:互联网公开简历数据集分析 数据内容: 该数据集包含2484条记录,每条记录包括以下字段: - ID:唯一标识符,共有2484种不同值。 - Resume_str:简历文本内容,共有2482种不同值。 - Resume_html:简历HTML格式内容,共有2482种不同值。 - Category:简历分类,共有24种不同值。 数据来源:...
-
互联网公开文本数据集统计分析报告
标题:互联网公开文本数据集统计分析报告 数据内容: 该数据集包含两个主要字段: 1. full_text:包含1263种不同的文本内容,每条记录代表一个完整的文本段落或短文本。 2. labels:包含2种不同的标签值,可能是二分类标签,用于对文本进行分类。 数据来源: 互联网公开数据 数据用途: 该数据集可用于多个行业的文本分析任务,例如: -...
-
互联网公开数据集深度洞察与应用分析
标题:互联网公开数据集深度洞察与应用分析 数据内容: 该数据集包含以下字段: 1. id:标识数据记录的唯一标识符,共有53043种不同的值。 2. statement:描述具体事件或信息的文本字段,共有51074种不同的值。 3. status:表示事件或信息的状态,共有7种不同的值。 数据来源: 互联网公开数据 数据用途:...
-
互联网公开数据集深入探索多领域信息资源
标题:互联网公开数据集深入探索多领域信息资源 数据内容: 该数据集包含了丰富的互联网公开数据,具体包括以下字段: 1. Class Index:表示数据分类的索引,共有4种不同的值。 2. Title:表示数据的标题或名称,共有114,350种不同的值。 3. Description:表示数据的描述信息,共有118,723种不同的值。...
-
互联网公开数据集多领域文件分类与分析
标题:互联网公开数据集多领域文件分类与分析 数据内容: 该数据集包含来自互联网公开数据的文件信息,具体包括以下数据元素: 1. 文件名称:记录文件的名称,包含6499种不同值 2. 标签:用于分类文件的标签,包含75种不同值 数据来源: 互联网公开数据 数据用途: 该数据集可用于以下行业的相关问题研究: 1....
-
互联网公开数据集多维度新闻文本信息分析
标题:互联网公开数据集多维度新闻文本信息分析 数据内容:该数据集包含从互联网公开数据中收集的多维度新闻文本信息,主要包括以下字段: 1. Title(标题):新闻标题,共包含3210种不同值,覆盖了广泛的新闻主题。 2. Link(链接):新闻链接,共包含2908种不同值,指向具体的新闻资源页面。 3....
-
互联网公开数据集垃圾邮件分类与文本分析
标题:互联网公开数据集垃圾邮件分类与文本分析 数据内容:该数据集包含文本内容(text)和垃圾邮件分类(spam)两个字段。文本内容字段包含5695种不同的文本值,垃圾邮件分类字段包含两种不同的分类值(0和1)。 数据来源:互联网公开数据...
-
互联网公开数据大规模多标签数据集
标题:互联网公开数据大规模多标签数据集 数据内容: 该数据集包含以下数据元素: 1. noamsegal:标识数据记录的唯一标识符,共有28,175种不同值。 2. pth:可能表示路径或位置信息,共有28,175种不同值。 3. label:数据记录的标签,共有8种不同值,用于分类或标注。 4....
-
互联网公开数据产品与用户评论分析数据集
标题:互联网公开数据产品与用户评论分析数据集 数据内容: 该数据集包含互联网公开数据,涵盖了产品的详细信息、用户评论以及相关元数据。具体包括以下数据元素: 1. 产品标识符(product_id):唯一标识产品的编号。 2. 产品名称(product_name):产品的名称或标题。 3. 类别(category):产品的分类信息。 4....
-
-



