-
议会公民身份法案讨论Voyant分析结果数据集
数据集概述 本数据集是通过在线工具Voyant对加拿大众议院和参议院关于《公民身份法案》的议会讨论文本进行分析后生成的结果文件,包含词云、趋势图等多种可视化图表,反映讨论文本的核心词汇及趋势特征。 文件详解 该数据集包含6个PNG格式的可视化文件,具体说明如下: -...
-
行业中使用提示工程生成错误报告的经验报告表单
数据集概述 本数据集是一份用于收集行业经验的表单文档,围绕“使用提示工程生成错误报告”的实验展开。表单通过结构化问题收集受访者对大语言模型(LLM)在错误报告生成中的实用性、易用性、响应质量等多维度反馈,以及使用过程中的优缺点和总体评价。 文件详解 数据集包含一个PDF格式的表单文件,具体说明如下: - 文件名称:...
-
印度时报新闻文章FinBERT评分数据集
数据集概述 本数据集包含从印度时报档案提取的新闻文章及其FinBERT评分结果,覆盖2017至2024年多个年份,以CSV、XLSX和PNG格式存储,为分析新闻文本的情感倾向提供结构化数据支持。 文件详解 CSV格式评分文件(共7个): 命名示例:score_TOI_2017.csv、score_TOI_2021.csv等...
-
头巾相关数字极化分析的YouTube评论标注数据集
数据集概述 本数据集围绕头巾相关话题的数字极化现象,收集并标注了YouTube平台的用户评论,包含原始数据、语料库文件及一致性检验文件,为研究社交媒体上的观点极化提供支持。 文件详解 数据文件(.xlsx格式): Raw Data.xlsx:原始YouTube评论数据 Corpus 1.xlsx:第一部分标注语料库 Corpus...
-
DISCERN_Based_中文健康信息质量评估完整标注数据
数据集概述 该数据集为DISCERN标注数据集,包含收集的中文健康信息文本、网页元数据、DISCERN评分结果及补充文件,涉及校准示例、评分者信度、标注指南等内容,为健康信息质量评估研究提供数据支持。 文件详解 数据文件(.xlsx格式): Webpage meta.xlsx:网页元数据文件 rater1.xlsx:第一位评分者的DISCERN评分数据...
-
古典藏文标注语料库第一部分_基于BDRC数字化文本的分词版本
数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集的古典藏文分词版本语料库,采用TiMBL的基于记忆的标注器进行词性标注,未经过后处理或人工校正,包含12个压缩文件。 文件详解 该数据集包含12个压缩文件,具体说明如下: -...
-
平台X勒索软件攻击情感分析数据集
数据集概述 本数据集围绕平台X勒索软件攻击事件展开情感分析,采用朴素贝叶斯方法探究公众对治理的信任度。数据集以压缩包形式存储,未提供文件内容预览,核心聚焦于相关事件的情感数据与分析过程。 文件详解 文件名称:PDN.zip 文件格式:ZIP压缩包(.zip) 内容说明:数据集唯一文件为压缩包,未提供内部文件结构、字段映射等具体内容预览 适用场景...
-
斯洛文尼亚语形容词形态标注数据库2024
数据集概述 本数据集包含斯洛文尼亚语中六千个最常用形容词的形态标注,基于Gigafida 2.0语料库2024年3月的抽样数据提取。标注涵盖词缀、复合结构、非派生性等核心形态特征,为斯洛文尼亚语形态学研究提供结构化数据支持。 文件详解 文件名称: Annotated database of Slovenian adjectives.xlsx 文件格式:...
-
Discord网络犯罪探索与大语言模型应用数据集
数据集概述 该数据集围绕Discord平台的网络犯罪探索展开,包含基于大语言模型的分析提示文件及标注指南,为研究网络犯罪相关内容的识别与分析提供支持。 文件详解 Annotation Guideline.pdf:PDF格式,提供网络犯罪内容标注的指导规则文档...
-
构建日志分析数据集LogChunks
数据集概述 该数据集包含从80个GitHub仓库收集的797条Travis CI构建日志,覆盖29种开发语言。日志按语言和仓库分类存储,部分日志含人工标注的构建失败原因片段,并标注关键词及结构分类,可用于构建日志分析研究。 文件详解 该数据集主要包含一个压缩文件,内部结构如下: - 文件名称: LogChunks.zip - 文件格式: ZIP...
-
需求分类模型概率分布补充材料数据集
数据集概述 本数据集是论文《Who Should Test the Requirement? A Comparative Study on Requirements Classification for Assigning Test Teams using the Pre-Trained...
-
Cochrane诊断性测试准确性参考数据集
数据集概述 该数据集为Cochrane诊断性测试准确性(DTA)参考数据集,对应2018年AMIA年会论文中描述的内容,用于系统性评价中诊断测试准确性的数据提取与合成自动化及评估流程。 文件详解 文件名称: CL145_open_set_20181101.zip 文件格式: ZIP (.zip) 内容说明:...
-
人工智能在科学数据库文献检索中的应用比较数据集
数据集概述 该数据集包含在ChatGPT、Copilot和Gemini三种人工智能工具中执行文献检索命令的所有结果,内容围绕科学数据库文献检索中不同AI工具的搜索表达式比较展开,所有结果以PDF格式呈现,支持相关研究的验证与分析。 文件详解 该数据集包含十五个PDF格式文件,文件命名以不同AI工具和实验编号标识,具体如下:...
-
基于上下文学习的大语言模型单元测试生成实证研究复现包
数据集概述 本数据集是论文《基于上下文学习的大语言模型单元测试生成实证研究》的复现包,包含支持研究结果复现的相关文件,可用于验证大语言模型在单元测试生成任务中的表现。 文件详解 文件名称: parser.zip:压缩包格式,可能包含用于解析代码或测试用例的脚本或工具。 文件名称:...
-
基于知识图谱的大语言模型谣言检测系统设计与算法优化数据集
数据集概述 本数据集围绕基于知识图谱的大语言模型谣言检测系统设计与算法优化展开,涵盖KG-RumorDetect框架的模型架构、知识图谱集成、优化技术等核心内容,为谣言检测研究提供技术方案参考。 文件详解 文件名称: archive.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含与KG-...
-
技术债务类型识别与分类机器学习复现包_ISE23
数据集概述 本数据集是论文《StackOverflow讨论中技术债务类型的机器学习识别与分类》的复现包,包含研究所需的数据集、分析代码及可视化结果,支持相关研究的复现与扩展。 文件详解 数据文件: dataset.csv:CSV格式,提供复现研究用的原始数据集,包含Id、Category、Body字段...
-
基于LLM工具支持HCI活动可用性可访问性用户体验系统文献图谱补充材料
数据集概述 本数据集是论文《Investigating LLM-based tools to support Usability, Accessibility, User eXperience in HCI activities: A Systematic Literature Mapping》的补充材料,包含与文献图谱相关的已收录论文列表等内容。...
-
DebatePorts_Args_me_2019_Based_论点检索数据集完整数据
数据集概述 该数据集为args.me语料库1.0的已清理版本,包含2019年年中从Debatewise、IDebate.org、Debatepedia和Debate.org四个辩论门户网站爬取的382545条论点,为论点检索研究提供结构化数据支持。 文件详解 文件名称:argsme-1.0-cleaned.zip 文件格式:ZIP压缩包(.zip)...
-
大型语言模型在工业测试维护流程集成研究的补充数据集
数据集概述 该数据集为论文《Exploring the Integration of Large Language Models in Industrial Test Maintenance Processes》的补充数据,包含未直接在论文中呈现的核心内容,为研究大型语言模型在工业测试维护流程中的应用提供辅助数据支持。 文件详解...
-
反腐败游戏情感数据集2023
数据集概述 该数据集为反腐败游戏(EgC v3)相关的情感数据集,包含情感分析、情境识别、情绪记录及问卷等数据文件,用于研究游戏场景中的情感相关内容,支持反腐败主题下的情感分析研究。 文件详解 该数据集包含五个文件,具体说明如下: - .xlsx格式文件(共4个): - reconhecimento da situação apresentada...



