-
数据集_100个中印尼商务词汇条目
2026年2月15日 30 26 13
数据集概述 本数据集包含一百个汉印尼商务领域的双语词汇条目,以单一Excel文件形式呈现,未划分训练测试集、数据标签集或原始处理集,旨在为商务场景下的汉印尼词汇翻译与学习提供结构化参考。 文件详解 文件名称:100 Chinese–Indonesian Business Vocabulary Items Dataset.xlsx 文件格式:XLSX...
-
CuneiML_Based_楔形文字机器学习数据集
2026年2月9日 30 155 46
数据集概述 本数据集为楔形文字机器学习研究提供支持,包含38,947张楔形文字泥板照片的元数据、边界框信息,以及对应文本的音译和楔形文字Unicode编码。数据结构涵盖泥板正反两面的文字内容、地理来源、时间年代和文本类型等信息,适用于楔形文字的图像识别与文本分析任务。 文件详解 文件名称:CuneiMLv1.2.json 文件格式:JSON...
-
Compound_words_Based_阿拉伯语中文复合词样本数据
2026年1月27日 30 184 108
数据集概述 本数据集包含阿拉伯语与中文复合词相关的样本数据,聚焦两种语言复合词的对比研究场景,为语言学领域的复合词结构、构成规则等分析提供基础样本支持,数据集由单一文件构成。 文件详解 文件名称:Arabic & Chinese samples.xlsx 文件格式:XLSX...
-
Spider_Realistic_Based_Text_to_SQL模型评估数据集
2026年1月18日 30 64 19
数据集概述 本数据集是基于Spider数据集开发的Spider-Realistic评估数据集,通过移除原始问题中显式列名、保留SQL查询与数据库不变,用于测试文本转SQL模型在自然语言与数据库 schema 对齐的能力,包含5个文件,支持语义解析模型的性能评估。 文件详解 spider-realistic.json 文件格式:JSON...
-
GeoQuestions1089_Based_YAGO2geo地理空间问答数据集_v1_1
2026年1月13日 30 200 46
数据集概述 本数据集是面向YAGO2geo知识图谱的众包地理空间问答数据集,包含1089组地理空间问题、对应答案及SPARQL/GeoSPARQL查询语句,可用于地理空间问答引擎的基准测试,提供v1.1版本,共2个JSON文件。 文件详解 文件名称:GeoQuestions1089.json 文件格式:JSON...
-
Reddit_Based_实体链接数据集_多标注文本语义分析完整数据
2025年12月10日 30 23 13
数据集概述 该数据集是基于社交媒体平台Reddit创建的实体链接数据集,包含六百一十九条帖子及一千二百四十三条对应评论,由三名人工标注者对文本分组进行标注,记录了提及-实体对及不同标注者间的一致性结果,含黄金、白银、青铜三种标注类型,总计一万一千一百零三条标注数据。 文件详解 文件名称: reddit_el.zip 文件格式: ZIP压缩包(.zip)...
-
PMB_VID_德语动词性潜在习语表达式标注数据集
2025年12月9日 30 55 5
数据集概述 该数据集包含Parallel Meaning Bank中德语动词性潜在习语表达式(PIEs)的标注数据,配套Ehren等人2024年的研究。涵盖多类文件,为分析德语习语表达提供结构化标注及分析工具支持。 文件详解 文档类文件: README.md:Markdown格式,数据集说明文档,含使用方法及参考文献 Annotation...
-
BioFlow_Ontology_Based_生物流本体知识组织完整数据
2025年12月9日 30 98 11
数据集概述 该数据集包含一个PDF格式的本体文件,聚焦于BioFlow相关的本体内容,为相关领域的知识组织与语义分析提供基础数据支持。 文件详解 文件名称: BioFlow-Ontology.pdf 文件格式: PDF (.pdf) 文件内容:...
-
灵长类分类逻辑对齐数据集
2025年12月8日 30 91 72
数据集概述 该数据集包含灵长类动物分类学概念对齐的相关数据,基于《世界哺乳动物物种》第二版(MSW2)和第三版(MSW3)的灵长类分类,通过区域连接演算(RCC-5)关系实现逻辑对齐,提供分类名称与含义关联的解析结果,支持生物分类学语义演化分析。 文件详解 数据文件(CSV格式,20个文件)...
-
诺西丁_巴约维_古兰经注释与阐释奥秘_方法论分析数据集
2025年12月7日 30 185 121
数据集概述 本数据集聚焦诺西丁·巴约维的《古兰经注释与阐释奥秘》,分析其在古兰经注释领域的方法论特征、跨学科整合(语言文学、逻辑神学等)、语义分析及学术互动,揭示其在当代古兰经研究中的地位与价值。 文件详解 文件名称: Kholiqov Mukhammad Yusuf.pdf 文件格式: PDF (.pdf) 文件内容:...
-
SQL指令生成与文本理解数据集SQLInstructionGenerationandTextUnderstandingDataset-saurabhgope
2025年5月30日 30 5 4
SQL指令生成与文本理解数据集SQLInstructionGenerationandTextUnderstandingDataset-saurabhgope 数据来源:互联网公开数据 标签:SQL生成, 文本转SQL, 自然语言处理, 数据库, 语义解析, 机器学习, 数据集, 语料库 数据概述: 该数据集包含用于训练和评估文本到SQL(Text-...
-
餐饮点餐指令解析数据集RestaurantOrderInstructionParsingDataset-hanzadafayez
2025年5月30日 30 199 107
餐饮点餐指令解析数据集RestaurantOrderInstructionParsingDataset-hanzadafayez 数据来源:互联网公开数据 标签:自然语言处理, 语义解析, 意图识别, 槽位填充, 餐饮, 订单管理, 文本标注, 机器学习 数据概述:...
-
带上下文的蜘蛛数据集SpiderDatasetwithContext-npradeep357
2025年5月29日 30 5 1
带上下文的蜘蛛数据集SpiderDatasetwithContext-npradeep357 数据来源:互联网公开数据 标签:自然语言处理,数据库,文本理解,问答系统,数据集,语义解析,关系抽取,机器学习,知识图谱 数据概述:该数据集包含了用于语义解析和文本到SQL(Structured Query...
-
文本转SQL语句生成数据集Text-to-SQLGenerationDataset-minhnguyendichnhat
2025年5月28日 30 152 82
文本转SQL语句生成数据集Text-to-SQLGenerationDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, SQL, 数据库, 语义解析, 数据集, 机器学习, 代码生成 数据概述: 该数据集包含文本描述与对应的SQL查询语句,用于训练和评估文本到SQL(Text-to-...
-
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo
2025年4月29日 30 151 131
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 数据集, 知识图谱, 语义解析, 机器翻译, 语言模型, 数据增强 数据概述: 该数据集包含来自WebNLG 2022...
-
数据库查询语句生成数据集DatabaseQueryGenerationDataset-hinduhuman
2025年4月29日 30 203 58
数据库查询语句生成数据集DatabaseQueryGenerationDataset-hinduhuman 数据来源:互联网公开数据 标签:数据库, 自然语言处理, 文本生成, SQL, 语义解析, 问答系统, 数据集, 机器翻译 数据概述:...
-
自然语言到SQL转换数据集NL2SQL-himanshunayal
2025年4月26日 30 196 82
自然语言到SQL转换数据集NL2SQL-himanshunayal 数据来源:互联网公开数据 标签:自然语言处理,数据库,SQL,数据集,文本理解,语义解析,问答系统,机器学习 数据概述: 该数据集包含1000个样本,用于自然语言到SQL(NL2SQL)任务,即通过自然语言描述来生成SQL查询语句。主要特征如下:...
-
韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub
2025年4月24日 30 112 75
韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub 数据来源:互联网公开数据 标签:文本到SQL,自然语言处理,数据集,数据库,语义解析,机器学习,韩国语,代码生成 数据概述: 该数据集包含韩国语文本及其对应的SQL查询语句,用于训练和评估文本到SQL(Text-to-SQL)生成模型。主要特征如下:...
-
韩国文本到SQL生成数据集Ko-Text2SQLDataset-cocolabhub
2025年4月24日 30 186 109
韩国文本到SQL生成数据集Ko-Text2SQLDataset-cocolabhub 数据来源:互联网公开数据 标签:自然语言处理,文本到SQL,数据集,语义解析,机器学习,数据库,人工智能,韩国语 数据概述: 该数据集由韩国文本到SQL生成任务的数据组成,旨在促进韩国语环境下文本到SQL技术的研发。主要特征如下:...
-
耶鲁大学SParC数据集-上下文语义解析数据集
2025年4月19日 30 90 43
耶鲁大学SParC数据集-上下文语义解析数据集 数据来源:互联网公开数据 标签:自然语言处理,语义解析,文本转SQL,数据集,上下文理解,数据库,机器学习,人工智能 数据概述: SParC(Semantic Parsing in...



