数据集 动态流 高校招生问答数据集 数据收集过程始于对选定的高等教育机构的网站进行网络抓取,收集 2023 年 7 月至 9 月期间与高等教育机构招生主题相关的任何数据。这产生了一个主要围绕招生相关内容的原始数据集。随后,实施了细致的数据清理和组织程序来完善数据集。在注释为问答格式之前,原始数据的原始形式主要是印尼语。此后,进行了全面的注释过程,以丰富数据集中特定的招生相关信息,将其转换为次要数据。主要数据和次要数据主要仍为印尼语。为了提高数据质量,我们添加了过滤器以删除或排除:1) 非印尼语数据、2) 与招生主题无关的数据和 3) 冗余条目。这种细致的整理最终创建了一个最终数据集,经过精心准备,现在可以随时用于高等教育招生领域的研究和分析。 数据与资源 dataset_annotationfinal.jsonjpg 探索 预览 下载 招生 高校 附加信息 字段 值 最后更新 二月 8, 2025, 03:18 (UTC) 创建于 十一月 9, 2024, 13:06 (UTC)