找到18个数据集

标签: 多语言研究

过滤结果
  • 阿姆哈拉语监督式主题分类语料库

    2026年2月12日 30 43 28

    数据集概述 本数据集为阿姆哈拉语主题分类监督语料库,由埃塞俄比亚记者专业标注,文件名为Supervised_Topic_Classifier_Corpus.xml。数据集包含一份XML格式文件,未划分训练/测试集、数据/标签集或原始/处理集,可用于自然语言处理领域的阿姆哈拉语文本分类研究,需进一步优化完善。 文件详解...
    packageimg
  • 荷兰传记门户_生物信息_关系抽取_标注数据集

    2026年2月1日 30 85 15

    数据集概述 本数据集为荷兰传记文本的人工标注关系抽取数据集,包含14类生物信息相关关系,如出生时间、居住地、亲属关系等。数据源自荷兰传记门户,包含测试集数据及说明文档,共2个文件,用于自然语言处理领域的关系抽取任务研究。 文件详解 README.md 文件格式:.md...
    packageimg
  • Data_Set_JCE_PIARDMOYON_2025数据集

    2026年2月8日 30 12 11

    数据集概述 本数据集包含原始数据及处理后数据,原始数据提供法语和英语两种语言版本,处理后数据包含两个Excel文件。数据集未区分训练/测试集或数据/标签,无目录结构,主要文件类型为Excel,总计包含两个文件。 文件详解 原始数据(Raw Data) 文件说明:包含法语和英语两种语言版本的原始数据 处理后数据(Treated Data)...
    packageimg
  • Telugu_Suicide_Based心理健康检测泰卢固语文本数据集

    2026年2月6日 30 198 23

    数据集概述 本数据集是Kaggle英文自杀检测数据集前5万行的泰卢固语翻译版,使用IndicTrans2翻译模型生成。核心内容为含自杀倾向标注的泰卢固语文本,每条数据包含文本内容及“自杀倾向”或“非自杀倾向”的分类标签,旨在支持泰卢固语心理健康检测相关研究,共包含2个文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • 伦理影响评估_纳米安全数据共享调查原始数据

    2026年2月1日 30 196 96

    数据集概述 本数据集为2023年10月18日巴西XX纳米技术、社会与环境研讨会参与者的在线调查原始数据,聚焦纳米安全数据共享的伦理影响评估。包含葡萄牙语原始问卷回复及对应的英文翻译版本,共2个文件,支持相关伦理研究的数据分析。 文件详解 文件名称:SurveyrenanosomaEnglishraw.xlsx 文件格式:XLSX...
    packageimg
  • S7_Data_利益相关者会议转录_研究工具开发数据

    2026年1月31日 30 164 161

    数据集概述 本数据集包含斯瓦希里语的匿名化公共利益相关者会议转录文本,主要用于研究工具开发,部分内容经翻译后用于研究结果的引文部分。数据集仅包含一个文档文件,无分层或拆分结构。 文件详解 文件名称:S7 Data. Public Stakeholders Meeting transcripts.docx 文件格式:DOCX...
    packageimg
  • 附录_42种语言定量定性分析结果_xlsx_多语言样本分析结果数据

    2026年1月27日 30 24 11

    数据集概述 本数据集展示基于42种语言样本的定量与定性分析结果,包含一份Excel文件,未划分训练/测试集、数据/标签集或原始/处理数据,无子目录结构,聚焦多语言分析领域的核心结果呈现。 文件详解 文件名称:Appendix2b_Results_of_quantitative_qualitative_analysis_42_languages.xlsx...
    packageimg
  • 乌兹别克斯坦语言医学疾病治疗最新进展与创新文档

    2025年12月21日 30 110 97

    数据集概述 本数据集包含一份乌兹别克斯坦语言的文档,内容聚焦于疾病治疗领域的最新进展与创新,为相关医学主题的研究提供资料支持。 文件详解 文件名称: Xolboyev Muxtor Shodi ogli.pdf 文件格式: PDF (.pdf) 内容说明: 单篇PDF文档,具体字段未提供,推测包含疾病治疗最新进展与创新相关的文本内容。 适用场景...
    packageimg
  • Llama_3_1_70B_Instruct生物化学代谢与营养学研究档案

    2025年12月19日 30 104 34

    数据集概述 本数据集是“生成式人工智能:Llama-3.1-70B-Instruct在生物化学、代谢与营养学学科中的能力”研究的原始数据档案,包含研究使用的数据库、可编辑代码脚本及详细的代码分析报告,旨在保障研究的有效性、可靠性与可重复性。 文件详解 该数据集包含九类文件,具体说明如下: - 数据文件: - 1-Database.xlsx:...
    packageimg
  • 意大利情感词典Sentix数据集

    2025年12月18日 30 58 39

    数据集概述 本数据集为意大利语情感词典Sentix的压缩文件,包含一个情感词典相关的压缩包,可用于意大利语文本的情感分析相关研究与应用。 文件详解 文件名称: valeriobasile/sentix-v3.0.zip 文件格式: ZIP压缩包(.zip) 文件内容: 压缩包内包含Sentix意大利语情感词典相关数据,具体内容需解压后查看 适用场景...
    packageimg
  • 乌兹别克语俄语英语委婉语主题分类分组研究

    2025年12月4日 30 89 87

    数据集概述 本数据集围绕乌兹别克语、俄语和英语三种语言中委婉语的主题分类分组问题展开研究,核心内容是探讨跨语言委婉语的主题分类方法与体系。 文件详解 文件名称: Dushatova Shohsanam Baxtiyor qizi.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 数字生态系统表征有用性评估研究问卷与材料

    2025年12月11日 30 182 61

    数据集概述 该数据集包含用于评估数字生态系统表征有用性的研究问卷与材料,提供原始德语版本及对应的英文翻译版本,共4个PDF文件,为相关研究提供标准化的调查工具支持。 文件详解 文件名称:Study Questionnaire - English.pdf 文件格式:PDF 内容:英文版本的研究问卷,用于收集关于数字生态系统表征有用性的评估数据...
    packageimg
  • GramAdapt跨语言社会接触数据集2023

    2025年12月4日 30 26 15

    数据集概述 该数据集为GramAdapt跨语言社会接触数据集,由多位研究者合作构建,包含跨语言社会接触相关数据,版本为1.0.0,存储于Zenodo平台,为跨语言社会接触领域研究提供数据支持。 文件详解 文件名称:gramadapt-v1.2.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-adnanzaidi

    2025年4月26日 30 11 3

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-adnanzaidi 数据来源:互联网公开数据 标签:情感分析,数据集,文本挖掘,自然语言处理,机器学习,语言技术,情感计算,多语言研究 数据概述: 该数据集包含罗马乌尔都语文本的情感标注数据,记录了罗马乌尔都语文本内容的情感倾向。主要特征如下:...
    packageimg
  • 翻译项目CSV数据集TranslatedCSVDataset-ahensetihom

    2025年4月24日 30 17 5

    翻译项目CSV数据集TranslatedCSVDataset-ahensetihom 数据来源:互联网公开数据 标签:翻译项目,CSV数据,语言处理,自然语言处理,数据集,文本分析,机器学习,多语言研究 数据概述:该数据集包含来自多个翻译项目的CSV格式数据,记录了不同语言文本之间的翻译结果。主要特征如下:...
    packageimg
  • 土耳其语翻译版H4NO机器人数据集TurkishTranslationofH4NORobotsDataset-unofficialmerve

    2025年4月24日 30 147 34

    土耳其语翻译版H4NO机器人数据集TurkishTranslationofH4NORobotsDataset-unofficialmerve 数据来源:互联网公开数据 标签:机器人数据,土耳其语,翻译数据,数据集,自然语言处理,机器翻译,人工智能,多语言研究 数据概述:...
    packageimg
  • 卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069

    2025年4月23日 30 79 35

    卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069 数据来源:互联网公开数据 标签:印地语英语混合语,数据集,自然语言处理,多语言研究,机器学习,语言分析,文本挖掘,语言技术 数据概述:...
    packageimg
  • 英语-孟加拉语多元化翻译数据集-2023年-golammostofas

    2025年4月22日 30 29 6

    英语-孟加拉语多元化翻译数据集-2023年-golammostofas 数据来源:互联网公开数据 标签:英语,孟加拉语,翻译,自然语言处理,NLP,对话生成,文化分析,机器翻译,多语言研究 数据概述:...
    packageimg