数据集

学生写作文本质量评估数据集StudentWritingTextQualityAssessmentDataset-kensomeya

数据来源：互联网公开数据

标签：文本评估, 写作质量, 学生写作, 自然语言处理, 文本分析, 机器学习, 教育, 语料库

数据概述：该数据集包含学生写作文本及其相关评估信息，记录了学生针对不同提示的写作内容和质量评估结果。主要特征如下：时间跨度：数据未明确时间，可视为静态文本评估数据集。地理范围：数据未限定具体地理位置，推测为面向学生的写作练习。数据维度：数据集包括多个关键字段，如：学生ID（student_id），提示ID（prompt_id），学生写作文本（text），摘要长度（summary_length），校正后的摘要文本（fixed_summary_text），拼写错误数量（splling_err_num），提示问题（prompt_question），提示标题（prompt_title），提示文本（prompt_text），提示长度（prompt_length），长度比率（length_ratio），词重叠计数（word_overlap_count），二元词组重叠计数（bigram_overlap_count），二元词组重叠比率（bigram_overlap_ratio），三元词组重叠计数（trigram_overlap_count），三元词组重叠比率（trigram_overlap_ratio），引用计数（quotes_count），输入文本（input），以及多个内容和用词预测结果（content_pred_0-3，wording_pred_0-3，lgbcontent_pred_0-3，lgbwording_pred_0-3），最终的写作文本内容（content）和用词（wording）等。数据格式：CSV格式，包含 train.csv 和 test.csv 两个文件，便于数据分析和模型训练。该数据集适合用于学生写作质量评估、文本分析和机器学习模型的训练与评估。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于教育领域和自然语言处理交叉学科的研究，如自动评估学生写作质量、文本相似度分析、写作风格分析等。行业应用：为教育科技公司提供数据支持，特别是在开发智能写作辅助工具、个性化学习系统、自动批改系统等方面。决策支持：支持教育机构改进教学方法、评估学生的写作能力，并为学生提供个性化的反馈。教育和培训：作为自然语言处理、机器学习、教育学等相关课程的实训数据，帮助学生和研究人员深入理解文本评估和写作分析。此数据集特别适合用于探索影响学生写作质量的关键因素，构建文本评估模型，并提升学生写作水平。

数据与资源

versions_20250314045508.zipZIP
3.84 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	3.84 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。