人类撰写文本样本数据集

数据集概述

本数据集是人类撰写的文本样本集合,包含五份文档文件,均为docx格式,未进行训练/测试、数据/标签或原始/处理数据的划分,为自然语言处理(NLP)等相关研究提供基础文本资源。

文件详解

该数据集包含五个docx格式的文档文件,具体说明如下: - 文件名称及格式: - Sample of human-authored texts/1.TextESP1_Brescó.docx:docx格式文档 - Sample of human-authored texts/2.TextoESP2_Brescó.docx:docx格式文档 - Sample of human-authored texts/3.TextESP3_PablosHerrero.docx:docx格式文档 - Sample of human-authored texts/4.TextESP4_García.docx:docx格式文档 - Sample of human-authored texts/5.TextESP5_NU.docx:docx格式文档

适用场景

  • 自然语言处理研究:可作为文本预处理、特征提取等基础任务的样本数据
  • 文本分析:适用于探索人类撰写文本的语言特征、风格等研究方向
  • 实验数据支撑:为需要人类撰写文本样本的实验提供基础数据资源
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.06 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。