-
ELTeC_hun_Based_匈牙利小说语料库数据2021_04
2026年1月27日 30 145 8
数据集概述 本数据集为ELTeC(欧洲文学文本集)项目下的匈牙利小说语料库2021年4月版本,包含100部编码为1级和2级的小说,总计2个文件,无目录层级结构。数据由欧洲文学历史远程阅读COST行动项目产出,支持欧洲文学的数字化研究。 文件详解 README.md 文件格式:MD...
-
PHRAME_RITA_意大利语二语学习者CEFR认证考试文本数据集
2026年1月25日 30 182 94
数据集概述 本数据集为RITA(意大利语测试评估资源),包含意大利语二语学习者为获取CEFR语言能力认证而撰写的学术考试文本,是自然语言处理(NLP)领域的专用数据集。数据由意大利研究部PRIN项目“PHRAME”开发,源自同一项目下的CELI语料库,支持CSV和XML格式的自动处理。 文件详解 文件名称:RITA_PHRAME4.zip...
-
ChatGPT_4o_Based_基于大语言模型的社会学专著影响评估研究数据
2026年1月20日 30 210 103
数据集概述 本数据集基于2014-2023年Dimensions数据库收录的2248部社会学专著摘要文本,通过ChatGPT-4o模型对摘要打分,并结合被引次数、Altmetrics数据和可读性指数开展实证分析,验证大语言模型评分与学术影响力指标的相关性,为学术专著文本分析提供新框架。 文件详解 数据文件(.xlsx格式,共8个) Principal...
-
WiLI_2018_Wikipedia_Based_多语言文本识别基准数据集
2025年12月12日 30 80 26
数据集概述 该数据集是Wikipedia语言识别基准数据集,包含235种语言的235000个段落,数据分布均衡,并提供训练集和测试集的划分。 文件详解 文件名称: wili-2018.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内包含数据集的完整内容,具体字段及结构需解压后查看原始文件 适用场景 自然语言处理研究:...
-
数据1850_1918年历史抒情诗数据与代码集
2025年12月10日 30 67 32
数据集概述 本数据集包含1850至1918年历史抒情诗研究的相关数据与代码,支撑《Geschichtslyrik, 1850–1918. Quantitative und qualitative Untersuchungen zur Geschichte einer Gattung》一书的研究,可通过指定链接获取更多信息。 文件详解...
-
美国城市气候规划中的正义整合与气候正义政策工具数据集2022
2025年12月6日 30 80 47
数据集概述 本数据集对应《美国城市日益将正义融入气候规划并创建气候正义政策工具》一文,包含支持研究的定量回归分析数据、定性编码结果及相关代码文件,为气候规划与正义关联研究提供数据支撑。 文件详解 定量分析数据文件: DataRegressionAnalysis.csv:CSV格式,含回归分析所用数据,可直接用于运行R代码 定性编码文件:...



