-
Stack_Overflow代码片段生成问题标题论文数据集
2025年12月7日 30 166 134
数据集概述 该数据集是论文《Generating Question Titles for Stack Overflow from Mined Code Snippets》的配套数据,内容为从Stack Overflow数据转储中提取的代码片段及相关信息,用于支持代码片段生成问题标题的研究。 文件详解 文件名称: Code2Que-data.zip...
-
系统综述自动化文献筛选评估数据集
2025年12月6日 30 187 27
数据集概述 本数据集为系统综述自动化文献筛选的评估数据,包含扩展的文献筛选数据集、实验结果评估文件、实验复现脚本及预印本论文,用于对比自动化方法与人工标题摘要及全文筛选决策的效果。 文件详解 扩展文献数据集(CSV格式):...
-
CLiPS文体学调查语料库2016
2025年12月6日 30 52 18
数据集概述 该数据集是2016年2月汇编的CLiPS文体学调查语料库,包含学生撰写的作文和评论两类文本,附带作者(性别、年龄等)及文档(时间戳、体裁等)元数据,主要用于文体学研究,支持自然语言处理相关分析。 文件详解 文件名称: csicorpus.zip 文件格式: ZIP压缩包 内容说明:...
-
Open_Linguistics待发表文章补充材料与原始数据
2025年12月5日 30 119 4
数据集概述 本数据集包含发表于《Open Linguistics》的论文《COVID-19的语言影响:四种语言的语料库研究》的补充材料(A、B、C)及原始数据,涵盖病毒名称及相关词汇的多语言原始数据,为研究提供支撑。 文件详解 补充材料文件: Supplement A.pdf、Covid discourse Supplement...
-
德国联邦宪法法院比例原则判决标注数据集
2025年12月5日 30 41 32
数据集概述 本数据集包含德国联邦宪法法院300份判决的句子级比例原则测试标注,每份判决经至少两人标注,分歧由专家确定黄金标准。提供个人标注、黄金标准及合并数据集,含详细文档说明。 文件详解 文档说明文件: Lüders_vhmk-data-description.pdf: PDF格式,提供数据集详细说明 压缩文件: guidelines.zip:...
-
梵语词分割数据集
2025年12月4日 30 50 24
数据集概述 该数据集针对梵语词分割任务构建,包含约十一万五千个句子,每个句子提供输入字符序列、真实分割结果及所有语音可能分割的词汇和形态信息,为梵语手稿的句法与语义处理提供基础数据支持。 文件详解 该数据集包含七个文件,具体说明如下: - 压缩文件: - DCS_pick.zip:压缩文件,可能包含实验相关的Pickle格式数据 -...
-
跨数据库重复漏洞记录数据集
2025年12月4日 30 142 118
数据集概述 该数据集包含来自跨数据库和GitHub Advisory Database的重复漏洞信息,以JSON格式存储,旨在支持漏洞匹配、重复检测相关研究。包含22,145条跨数据库重复漏洞对和133条GitHub专属重复漏洞对,共两个核心文件。 文件详解 该数据集包含一个压缩文件,内部包含两个JSON格式数据文件,具体说明如下: - 压缩文件:...
-
德语词汇历时使用相关性判断数据集2021
2025年12月4日 30 119 18
数据集概述 该数据集包含针对德语词汇使用对的历时语义相关性判断数据,基于词汇语义变化标注框架构建,版本为3.0.0,更新于2021年12月15日,为研究词汇语义随时间的演变提供支持。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: durel.zip - 文件格式: ZIP压缩包 (.zip) - 内容说明:...
-
德语寻求论证对话数据集
2025年12月4日 30 115 112
数据集概述 本数据集包含十组德语寻求论证对话的原始转录文本与按子主题划分的对话文件,以TXT和PDF两种格式呈现,共二十个文件,可用于分析德语对话中的论证结构与主题分布。 文件详解 TXT格式文件(共10个): 文件示例:conversation1_transcript.txt、conversation8_transcript.txt等...



