数据集 - 海数据

Tigrinya_Analogy_Test_词嵌入模型评估数据集

2026年2月13日 30 67 41

数据集概述本数据集是提格利尼亚语版的谷歌类比测试集，用于评估词嵌入模型质量。数据经机器翻译后由母语者人工验证，剔除了不适用的条目，最终包含一万八千四百六十五条语义和句法类比条目，分为首都、货币、家庭、时态等九个测试小节。文件详解文件名称：TigrinyaAnalogyTest.zip 文件格式：ZIP...

ZIP

Sentiment_Aligned_乌拉尔语系四语言情感分析与词嵌入数据_2023

2026年1月15日 30 3 2

数据集概述本数据集包含厄尔兹亚语、科米-齐良语、莫克沙语和乌德穆尔特语四种乌拉尔语系语言的情感分析相关数据，包括对齐的情感标注数据、词嵌入向量、代码及情感分析模型，适用于低资源语言情感分析研究。文件详解情感标注数据文件文件名称：sentiment_eval_data.json 文件格式：JSON...

ZIP

Replication_Package_Discord开发者问答辅助研究复现包数据

2026年1月15日 30 17 4

数据集概述本数据集是论文“On the Helpfulness of Answering Developer Questions on Discord with Similar Conversations and Posts from the...

ZIP

德国联邦宪法法院平衡语言使用分析附录与复现数据集

2025年12月23日 30 64 6

数据集概述本数据集包含论文《平衡是否为司法能动主义的手段？德国联邦宪法法院平衡语言使用分析》的在线附录与复现数据，采用文本数据方法（如词嵌入）分析司法推理，验证平衡语言与司法能动主义的关联，为相关法律研究提供实证支持。文件详解文件名称: replication.zip 文件格式: ZIP压缩包内容说明:...