NLP_Based_医学CT文本简单评分算法评估实验结果数据

数据集概述

本数据集为“简单评分型自然语言处理(NLP)算法评估”实验的结果数据,包含两个文件,涉及医学CT相关文本的评分预测任务,记录了文本内容、实际评分、预测评分及分类等信息,可用于分析该NLP算法的性能表现。

文件详解

  • 20230513_predicted_rating.csv
  • 文件格式:CSV
  • 字段映射介绍:包含text(原始文本)、rating(实际评分)、source(来源)、cleaned_text(清洗后文本)、predicted_rating(预测评分)、category(类别)、predicted_category(预测类别)、predicted_rating_discrete(离散化预测评分)等字段。
  • 20230513_predicted_rating.metadata.xml
  • 文件格式:XML
  • 字段映射介绍:为数据集的元数据文件,记录实验及数据相关的描述信息(具体字段未提供详细映射)。

适用场景

  • NLP算法性能评估: 分析简单评分型NLP算法在医学CT文本评分预测任务中的准确率、误差等指标。
  • 医学文本分类研究: 基于category和predicted_category字段,探究算法对医学CT文本的分类能力。
  • 文本预处理效果验证: 通过对比text与cleaned_text字段,评估文本清洗步骤对算法预测结果的影响。
  • 离散化评分模型优化: 结合predicted_rating与predicted_rating_discrete字段,优化评分离散化策略。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 23.46 MiB
最后更新 2026年2月8日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。