数据集

学生写作文本摘要评估数据集StudentWritingTextSummaryEvaluationDataset-fucheng1225

数据来源：互联网公开数据

标签：文本摘要, 学生写作, 文本分析, 评估, 自然语言处理, 写作质量, 文本相似度, 教育

数据概述：该数据集包含来自学生写作的文本摘要数据，记录了学生对给定提示文本的摘要内容，以及相关的评估指标，用于研究和分析文本摘要的质量。主要特征如下：时间跨度：数据未明确标注时间，可视为静态语料数据集。地理范围：数据未限定地理范围，适用于通用文本摘要研究。数据维度：数据集包含多个字段，包括：student_id（学生ID），prompt_id（提示ID），text（学生提交的摘要文本），summary_length（摘要长度），fixed_summary_text（人工校对的摘要文本），splling_err_num（拼写错误数量），prompt_question（提示问题），prompt_title（提示标题），prompt_text（提示文本），prompt_length（提示文本长度），length_ratio（摘要长度与提示文本长度的比例），word_overlap_count（词语重叠数量），bigram_overlap_count（二元词组重叠数量），bigram_overlap_ratio（二元词组重叠比例），trigram_overlap_count（三元词组重叠数量），trigram_overlap_ratio（三元词组重叠比例），quotes_count（引用数量）。数据格式：CSV格式，包含traincsv和testcsv两个文件，便于数据分析和模型训练。来源信息：数据集来源于公开的文本摘要项目，已进行数据清洗和标注。该数据集适合用于文本摘要质量评估、学生写作分析、自然语言处理模型训练等。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、教育技术等领域的学术研究，例如，文本摘要算法的评估、学生写作风格分析、写作辅助工具的开发等。行业应用：可以为教育科技公司提供数据支持，用于开发智能写作评估系统、个性化学习平台等。决策支持：支持教育机构评估学生的写作水平，优化教学策略，提升写作教学质量。教育和培训：作为自然语言处理、写作教学等课程的实训数据，帮助学生和研究人员深入理解文本摘要和写作评估。此数据集特别适合用于探索影响文本摘要质量的因素，评估不同摘要算法的性能，以及构建基于数据的学生写作评估模型。

数据与资源

versions_20250317141048.zipZIP
3.53 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	3.53 MiB
最后更新	2025年5月1日
创建于	2025年5月1日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

学生写作文本摘要评估数据集StudentWritingTextSummaryEvaluationDataset-fucheng1225

数据与资源

附加信息

注册成功！