-
生物入侵与风险分析术语评估数据
2026年2月12日 30 47 32
数据集概述 本数据集是针对生物入侵和风险分析领域术语的全球性多语言评估数据,包含四份补充材料文件,均为Excel格式,用于支持相关研究的术语标准化工作。 文件详解 文件名称:Supplementary Material 2.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含生物入侵相关术语的多语言评估数据。...
-
Data_Set_JCE_PIARDMOYON_2025数据集
2026年2月8日 30 69 32
数据集概述 本数据集包含原始数据及处理后数据,原始数据提供法语和英语两种语言版本,处理后数据包含两个Excel文件。数据集未区分训练/测试集或数据/标签,无目录结构,主要文件类型为Excel,总计包含两个文件。 文件详解 原始数据(Raw Data) 文件说明:包含法语和英语两种语言版本的原始数据 处理后数据(Treated Data)...
-
Wikidata_Based_多语言业务信息RDF转储数据
2026年1月29日 30 166 28
数据集概述 本数据集是通过wdumps工具生成的Wikidata业务相关RDF转储数据,包含韩语和英语两种语言的业务信息。数据集包含4个文件,涉及实体、标签、描述等结构化信息,可用于多语言业务数据的检索与分析。 文件详解 info.json 文件格式:JSON...
-
PeriodO_EAMENA_历史时期多语言数据库数据2021
2026年1月28日 30 66 17
数据集概述 本数据集由EAMENA项目于2021年创建,包含226个历史时期的多语言(英语和阿拉伯语)数据,托管于PeriodO LOD地名录,具有唯一ARK标识符。数据以单一JSON文件存储,无目录结构或数据拆分。 文件详解 文件名称:periodo-authority-m64td.json 文件格式:JSON...
-
WOKIE_Based_SKOS叙词表LLM自动化翻译系统支持数据
2026年1月27日 30 26 1
数据集概述 本数据集为WOKIE项目“FAIR in allen Sprachen”的附录数据,包含基于LLM的SKOS叙词表自动化翻译系统相关文件,涉及多语言翻译结果、翻译详情及原始叙词表等内容,共10个文件,用于支持该翻译系统的相关研究与应用。 文件详解 RDF格式文件(80.0%) 文件名称:unesco_reduced_en-...
-
GReduced_Based_维基百科地缘政治联系分析数据_2013
2026年1月25日 30 166 45
数据集概述 本数据集为论文“Capturing the influence of geopolitical ties from Wikipedia with reduced Google...
-
EPO_Based_欧洲专利局上诉委员会裁决多语言标题关键词数据_开源版
2026年1月21日 30 6 2
数据集概述 本数据集包含欧洲专利局(EPO)上诉委员会裁决的标题与关键词,提取自EPO 2025年3月发布的批量数据。共收录4989条记录,覆盖1979年前及之后的D、G、J、T、W类裁决,提供英、法、德三种语言版本,支持开源免费访问,可用于专利法律与技术裁决的文本分析。 文件详解...
-
wikivents_事件表示分析_Wikidata与Wikipedia方言语言数据
2026年1月18日 30 40 4
数据集概述 本数据集是wikivents项目的压缩文件,包含用于分析Wikidata和Wikipedia中事件表示的Jupyter Notebook及相关统计数据。核心内容是验证分析方言语言对基于公开来源(如Wikidata和Wikipedia)描述事件的必要性,数据由wikivents Python包处理生成。 文件详解...
-
蛋白质2_0调查数据集
2025年12月18日 30 136 123
数据集概述 本数据集为Protein 2.0项目收集的调查数据,聚焦消费者对合成/培养蛋白质产品(如肉类、鱼类、乳制品)的感知,包含多语言版本调查数据及原始问卷草案,为研究消费者对新型蛋白质产品的态度提供支持。 文件详解 数据文件(多语言调查数据):...
-
MEDDOPLACE医疗文档地点相关内容抽取黄金标准标注语料库
2025年12月14日 30 90 6
数据集概述 该数据集是MEDDOPLACE任务的黄金标准标注语料库,聚焦西班牙语医疗文档中地点相关内容的抽取,包含地点检测、归一化、分类及临床科室、国籍、患者流动等关联信息的标注,适用于生物医学自然语言处理研究。 文件详解 文件名称: meddoplace_train+test+gazz+crossmap+multilingual_231003.zip...
-
GesisDataSeachKG_Based_社会科学数据语义搜索知识图谱完整数据
2025年12月9日 30 65 22
数据集概述 该数据集是gesisDataSeachKG项目的资源集合,将Gesis Data Search中的11,965个数据集元数据(基于DDI标准)转换为RDF/S模型,包含多语言数据、11个研究组、1966-2023年的发布日期,涵盖33个语义属性和53万条三元组,支持语义搜索功能。 文件详解 文件名称: ddi_metadata_v2.zip...
-
TalentCLEF2025人力资本管理技能与职位智能语料库
2025年12月6日 30 95 53
数据集概述 本数据集为TalentCLEF2025竞赛语料库,包含多语言职位匹配(任务A)与职位技能预测(任务B)的训练、验证及测试数据,用于开发人力资本管理相关模型,支持人才匹配、技能发展与技能缺口检测等应用。 文件详解 数据集包含4个ZIP压缩文件,具体说明如下: - 压缩文件: - TaskA.zip:...
-
公共行政领域人力资源管理实践数据集
2025年12月6日 30 118 58
数据集概述 本数据集围绕公共行政领域的人力资源管理实践主题构建,包含阿拉伯语和英语版本的调查问卷文档,以及整合了两种语言版本数据的Excel文件,为相关研究提供多语言、结构化的数据支持。 文件详解 Questionnaire -Arab..pdf:PDF格式,阿拉伯语版本的调查问卷文档 Questionnaire...
-
波斯尼亚语新闻文章数据集
2025年5月6日 30 70 47
波斯尼亚语新闻文章数据集 数据来源:互联网公开数据 标签:波斯尼亚语,新闻,文本分类,情感分析,主题建模,klix.ba,自然语言处理,新闻分析,多语言数据 数据概述:...
-
-
新闻分类僧伽罗语-英语数据集
2025年5月6日 30 19 13
新闻分类僧伽罗语-英语数据集 数据来源:互联网公开数据 标签:新闻分类,僧伽罗语,英语,自然语言处理,文本分类,机器学习,多语言数据 数据概述:...
-
亚马逊商品英文评论及其法语翻译数据集
2025年4月27日 30 120 50
亚马逊商品英文评论及其法语翻译数据集 数据来源:互联网公开数据 标签:亚马逊评论,英文,法语,翻译,自然语言处理,多语言数据,商品评价 数据概述: 本数据集包含从1996年至2014年间亚马逊商品的英文评论,并提供了这些评论的法语翻译。数据集涵盖了多种商品类别,每条评论均包含原始英文文本及其对应的法语翻译,为研究多语言自然语言处理提供了丰富的数据资源。...
-
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86
2025年4月26日 30 129 47
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:...
-
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov
2025年4月25日 30 56 26
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:...
-
语言翻译数据集2010-2020数据集-amankumar2002
2025年4月23日 30 64 5
语言翻译数据集2010-2020数据集-amankumar2002 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,语言学,多语言数据,文本翻译 数据概述:该数据集包含来自多个公开来源的语言翻译数据,记录了多种语言之间的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...



