AI增强型糖尿病护理沟通目标数据集

数据集概述

该数据集包含从中国广泛使用的在线远程医疗平台收集的匿名医患咨询记录,专为医疗领域的自然语言处理应用设计,重点关注糖尿病相关的医疗对话,分为原始中文和英文翻译两个压缩包,便于多语言研究。

文件详解

  • 原始中文对话数据压缩包:
  • 文件名称: original_txt.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含19个TXT文件(part_1.txt至part_19.txt),每个文件含1000条中文医患多轮对话,以id=xxx等标记结构化,已去除个人身份信息
  • 英文翻译对话数据压缩包:
  • 文件名称: translated_txt.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含与原始文件一一对应的英文翻译TXT文件(如part_1_english.txt),通过Google Translate翻译,保留原始结构与格式
  • 演示文件:
  • 文件名称: diabetes_dataset_demo.html
  • 文件格式: HTML网页文件
  • 内容说明: 数据集演示文件,具体内容未提供预览

适用场景

  • 医疗自然语言处理研究: 用于训练糖尿病对话意图识别、实体抽取等NLP模型
  • 跨语言医疗AI应用: 支持中英文医疗对话系统的开发与优化
  • 医患沟通模式分析: 研究糖尿病诊疗场景下的医患交流特征
  • 医疗隐私保护技术验证: 测试医疗文本去标识化处理的有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 15.0 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。