-
情感与文本数据集
2025年4月23日 155 10 5
标题:情感与文本数据集 数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id)... -
大规模文本数据集分析报告
2025年4月22日 31 22 4
标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1.... -
多样化文本数据集丰富的内容资源
2025年4月22日 31 18 3
标题:多样化文本数据集丰富的内容资源 数据内容: 该数据集包含多样化的文本信息,具体字段包括: 1. FileName:表示文件的名称,包含20000种不同的文件名,展示了数据集的广泛覆盖范围。 2. Font:表示文本使用的字体类型,共有20种不同的字体,反映了不同字体的使用情况。 3.... -
互联网公开数据集多源文本标注数据集
2025年4月8日 31 14 9
标题:互联网公开数据集多源文本标注数据集 数据内容:该数据集包含了来自多个来源的文本数据,每个文本都经过标注处理,具有明确的分类标签。数据集中包含文本内容、标签以及数据来源三个主要字段。具体字段统计信息如下: text: 290,390 种不同文本内容 label: 3 种不同的分类标签 src: 11 种不同的数据来源 数据来源:互联网公开数据... -