-
CuneiML_Based_楔形文字机器学习数据集
2026年2月9日 30 200 38
数据集概述 本数据集为楔形文字机器学习研究提供支持,包含38,947张楔形文字泥板照片的元数据、边界框信息,以及对应文本的音译和楔形文字Unicode编码。数据结构涵盖泥板正反两面的文字内容、地理来源、时间年代和文本类型等信息,适用于楔形文字的图像识别与文本分析任务。 文件详解 文件名称:CuneiMLv1.2.json 文件格式:JSON...
-
基于民族主义保守主义变革语法的论文配套转录本数据
2026年2月1日 30 50 15
数据集概述 本数据集为论文"A nationalist-conservative grammar of change?"的配套转录本,包含MS Word格式(带行号)和RData格式文件,共18个文件。Word版本为行号参考基准,RData版本可用于配套可复现示例分析,涵盖民族保守主义相关文本内容,支持相关主题的文本研究。 文件详解 论文配套转录本文件...
-
Colección_de_datos_数据集合_文档数据
2026年1月30日 30 128 127
数据集概述 本数据集为单一文件的数据集合,包含一份名为UNIDAD 2 FICHAJE的文档文件,无其他子目录或文件分类,未提供训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:UNIDAD 2 FICHAJE.docx 文件格式:DOCX 字段映射介绍:未提供文件内容预览或字段信息 适用场景 文档内容分析:...
-
Cortex_Submission_统计分析原始实验数据
2026年1月30日 30 94 91
数据集概述 本数据集为Cortex提交的统计分析原始数据,包含33个文件,涉及实验设计、数据处理、结果分析等内容,覆盖模型、相关性、预测等统计维度,以及控制实验、原始数据处理、CT医学影像、图片视觉、文本词汇等多领域关键词,可支持多维度统计分析研究。 文件详解 统计分析文件(.spwb格式,15个) 示例文件:ageacquisition...
-
ChiWUG_Based_中文历时词使用图数据集_2023
2026年1月29日 30 108 105
数据集概述 本数据集包含中文历时词使用图(WUGs),聚焦词汇语义的历时变化分析。数据提供了图结构格式的词汇使用记录,可用于研究中文词汇在不同时间维度的语义演变规律,为中文词汇语义变化检测任务提供支撑。 文件详解 文件名称:chiwug.zip 文件格式:ZIP...
-
CrowdTruth_Based_众包命名实体黄金标准数据_v1_0
2026年1月23日 30 208 3
数据集概述 本数据集包含通过混合多命名实体识别(Multi-NER)众包增强方法,在英文维基百科句子中识别和分类命名实体的实验结果,提供众包标注的命名实体黄金标准数据,支持自然语言处理领域的相关研究与应用。 文件详解 文件名称:CrowdTruth/Crowdsourcing-NamedEntities-GoldStandard-v1.0.zip...
-
CultIntSoc_Corpus_Based_1935_1972年双边文化协定文本语料库
2026年1月13日 30 82 21
数据集概述 本数据集是1935-1972年间签署的双边一般文化协定文本语料库,收录了提交给国际联盟条约处(LTS)或联合国条约处(UNTS)并由其发布的协定文本,共464份,占该时期相关协定总数的约一半。所有文本以英文呈现,可用于国际文化合作领域的文本分析研究。 文件详解 文件名称:CultIntSoc Corpus, LTS+UNTS GCAs...
-
Tiefo_D_Lexicon_Based语言词汇表_Daramandugu地区_2021年4月
2026年1月8日 30 17 0
数据集概述 本数据集为Daramandugu地区Tiefo-D语言的词汇表,需与同作者的《Tiefo-D语法》(DOI:10.5281/zenodo.4715103)及《Tiefo-D文本集》(DOI:10.5281/zenodo.4715132)配合使用,使用说明见语法附录及文本集附录。后续将在密歇根大学图书馆Deep...
-
UIMA_ConceptMapper_Based_2021_BioASQ语料库药物与癫痫本体术语标注字典数据
2025年12月28日 30 197 7
数据集概述 本数据集包含用于UIMA ConceptMapper工具的字典文件,用于对2021 BioASQ语料库进行药物名称及癫痫本体术语标注。字典分别源自DrugBank词汇库及NCBO BioPortal的EpSO、ESSO、EPILONT、EPISEM、FENICS五种癫痫本体,共六个XML格式文件,可支撑生物医学文本的语义实体识别与标注。...
-
GLOVE_全球词向量表示数据集
2025年12月8日 30 98 73
数据集概述 本数据集围绕“GLOVE: GLOBAL VECTORS FOR WORD REPRESENTATION”主题,包含一份PDF文档,核心内容与全球词向量表示相关,为词向量技术研究提供基础资料支持。 文件详解 文件名称: Abdulatif Meyliev Rakhmatillayevich.pdf 文件格式: PDF 内容说明:...
-
语义和形式属性的暗指单元类型分析
2025年12月5日 30 48 39
数据集概述 该数据集包含一份关于暗指单元类型的分析文档,围绕语义和形式属性展开研究,以PDF格式呈现,为暗指语言现象的分类与特征分析提供资料支持。 文件详解 文件名称: Karimova Mastura Ablaxat qizi.pdf 文件格式: PDF 内容说明:...
-
文本生成内容语义分析数据集TextGenerationContentSemanticAnalysisDataset-hardikjindal
2025年4月29日 30 70 65
文本生成内容语义分析数据集TextGenerationContentSemanticAnalysisDataset-hardikjindal 数据来源:互联网公开数据 标签:文本生成, 语义分析, 文本摘要, 自然语言处理, 语言模型, 文本相似度, 机器写作, 数据集 数据概述:...



