数据集

多语言软件缺陷报告及其翻译数据集1963-2025

多语言软件缺陷报告及其翻译数据集1963-2025 数据来源：互联网公开数据标签：多语言,软件缺陷报告,翻译,自然语言处理,机器翻译,跨语言分析数据概述：本数据集包含了从开源代码仓库中提取的多语言软件缺陷报告，并提供了使用多种机器翻译模型生成的翻译版本。数据集旨在支持自然语言处理研究、缺陷分类以及跨语言分析。数据集包含缺陷报告的唯一标识符、标签、创建时间戳、缺陷描述正文、状态原因、标题、状态以及不同翻译版本及其源语言信息。数据用途概述：该数据集适用于多语言自然语言处理研究、机器翻译质量评估、软件缺陷分类自动化以及跨语言信息检索等多个场景。研究者可以利用此数据集分析不同语言的缺陷报告，比较GPT、DeepL和AWS Translate等机器翻译模型的翻译质量，自动化缺陷报告的分类和优先级排序，以及改进非英语缺陷报告的搜索和检索功能。举例：数据集包含如下字段： - number: 每个缺陷报告的唯一标识符 - labels: 分配给缺陷报告的标签，包括缺陷状态 - created_at: 缺陷报告的创建时间戳 - body: 描述缺陷的正文内容 - state_reason: 缺陷报告的状态原因（例如：已完成、未计划） - title: 缺陷报告的标题 - state: 缺陷报告是否为打开状态或关闭状态 - translation: 缺陷报告正文的翻译版本 - src_lang: 检测到的原始缺陷报告的源语言 - gpt_translation: 使用GPT模型生成的翻译 - gpt_src_lang: GPT检测到的源语言 - deepL_translation: DeepL提供的翻译 - deepL_src_lang: DeepL检测到的源语言 - aws_translation: AWS Translate提供的翻译 - aws_src_lang: AWS Translate检测到的源语言

数据与资源

多语言软件缺陷报告及其翻译数据集1963-2025.zipZIP
0.43 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.43 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。