-
阿姆哈拉语监督式主题分类语料库
2026年2月12日 30 177 87
数据集概述 本数据集为阿姆哈拉语主题分类监督语料库,由埃塞俄比亚记者专业标注,文件名为Supervised_Topic_Classifier_Corpus.xml。数据集包含一份XML格式文件,未划分训练/测试集、数据/标签集或原始/处理集,可用于自然语言处理领域的阿姆哈拉语文本分类研究,需进一步优化完善。 文件详解...
-
IDS国际大词典系列_2021汉语IDS词表数据
2026年2月9日 30 122 27
数据集概述 本数据集为Hsiao-jung Yu与Yifan Wang于2021年编制的汉语IDS词表,收录于《洲际词典系列》(The Intercontinental Dictionary Series)。该词表是汉语语言学研究的结构化资源,可用于汉语词汇、语义等相关领域的分析,数据集包含1个压缩文件。 文件详解 压缩文件...
-
Amazon_MT_Based手机多语言评论数据
2026年2月9日 30 82 7
数据集概述 本数据集包含亚马逊平台上的手机评论数据,涵盖英语、希腊语和意大利语三种语言,其中非英语评论为机器翻译版本。数据集以单一压缩文件形式呈现,未划分训练/测试集、数据/标签集或原始/处理集,可用于多语言文本分析及电商评论研究。 文件详解 文件名称:ACPMR.zip 文件格式:ZIP...
-
arabic_vfq_2_Based视力相关生活质量评分数据
2026年2月9日 30 182 139
数据集概述 本数据集包含arabic vfq 2相关的评分数据,共1个文件,文件格式为.xlsx,无目录结构,未划分训练/测试集、数据/标签集及原始/处理数据,无自述文件或内容预览。 文件详解 文件名称:arabic vfq 2 (scores).xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含与arabic vfq...
-
Data_Set_JCE_PIARDMOYON_2025数据集
2026年2月8日 30 10 4
数据集概述 本数据集包含原始数据及处理后数据,原始数据提供法语和英语两种语言版本,处理后数据包含两个Excel文件。数据集未区分训练/测试集或数据/标签,无目录结构,主要文件类型为Excel,总计包含两个文件。 文件详解 原始数据(Raw Data) 文件说明:包含法语和英语两种语言版本的原始数据 处理后数据(Treated Data)...
-
医疗教育_健康声明循证实践教学研究补充数据
2026年2月2日 30 190 53
数据集概述 本数据集为“使用健康声明向医疗专业学生教授循证实践的混合方法研究”的补充材料,包含挪威数据集的英文翻译文件及研究相关清单。总计7个文件,涵盖定量数据、开放问题、焦点小组访谈的翻译内容,以及研究报告规范清单,支持医疗教育研究的验证与复现。 文件详解 数据文件 文件名称:2_All quantitative data_English...
-
伦理影响评估_纳米安全数据共享调查原始数据
2026年2月1日 30 206 35
数据集概述 本数据集为2023年10月18日巴西XX纳米技术、社会与环境研讨会参与者的在线调查原始数据,聚焦纳米安全数据共享的伦理影响评估。包含葡萄牙语原始问卷回复及对应的英文翻译版本,共2个文件,支持相关伦理研究的数据分析。 文件详解 文件名称:SurveyrenanosomaEnglishraw.xlsx 文件格式:XLSX...
-
Extended_感官分析问卷_食品研究数据
2026年2月1日 30 151 32
数据集概述 本数据集包含针对市售煎饼预混料和扁豆基煎饼预混料的感官分析问卷,提供英文和原始葡萄牙语两个版本,用于食品感官评估研究,仅包含1个文件。 文件详解 文件名称:data Extended.docx 文件格式:DOCX 字段映射介绍:包含食品感官分析问卷内容,涵盖市售煎饼预混料和扁豆基煎饼预混料的感官评估维度,提供英文和葡萄牙语双语版本。...
-
保护现状免受绿色病毒侵害_德国政治宣传文档集
2026年2月1日 30 125 58
数据集概述 本数据集包含100个文档,均为.docx格式,主要涉及FPÖ和AfD两个政治团体的宣传内容,主题围绕反对欧盟气候政策、绿色协议等相关议题。文档未进行训练/测试、数据/标签或原始/处理的拆分,无目录结构,命名无明显规律,语义关键词涉及生物学中的“基因”。 文件详解 文件名称:包括FPÖ_52Verbot für...
-
Bangla_Based_孟加拉语信息检索测试集数据
2026年1月31日 30 202 60
数据集概述 本数据集为孟加拉语信息检索测试集,包含1182份文档(182份泰戈尔的短篇故事、小说、散文,1000份2013年《普罗托姆·阿洛》报纸文章)、94条不同复杂度的查询及查询-文档相关性判断,填补了孟加拉语信息检索标准数据集的空白。 文件详解 文件名称:README.txt 文件格式:TXT...
-
标注数据集_1986年切尔诺贝利核灾难_荷兰电视新闻
2026年1月31日 30 1 0
数据集概述 本数据集是论文“Speech-to-Local Data: Exploring ASR Files of Archived Television News (2004-2028) on the 1986 Chernobyl Nuclear...
-
Surrage_Ghezzi_免疫相关新闻视频编码数据
2026年1月31日 30 204 155
数据集概述 本数据集为论文“Use of immunology in news and YouTube videos in the context of COVID-19: politicization and information bubbles”的原始数据,包含意大利语和英语中与COVID-19免疫相关的新闻文章和视频的编码信息,共1个文件。...
-
TuReV_Corpus_突尼斯革命在线新闻报道语料库
2026年1月30日 30 142 3
数据集概述 本数据集为TuReV语料库,收录了关于突尼斯革命的在线新闻报道文本,是用于自然语言处理(NLP)研究的单文件语料库资源,可支持对突尼斯革命相关新闻内容的文本分析任务。 文件详解 文件名称:corpus TuReV.docx 文件格式:DOCX...
-
SPICE_Based_艺术与情感多语言用户反馈实验数据集
2026年1月29日 30 73 54
数据集概述 本数据集是欧盟SPICE项目下收集的艺术与情感研究数据,包含芬兰语、英语、西班牙语、希伯来语、意大利语5种语言的用户反馈,涉及12件来自都灵GAM博物馆的艺术品。数据记录了用户个人信息及对每件艺术品的5个开放式问题回答,用于训练和测试情感检测模型,共7个文件。 文件详解 多语言用户反馈文件...
-
Wikidata_Dump_主权国家标签描述别名RDF数据
2026年1月29日 30 114 55
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF数据转储,仅包含主权国家相关信息,涵盖标签、描述及别名内容。数据集包含4个文件,无实体、陈述或三元组计数,可用于获取标准化的主权国家语义信息。 文件详解 info.json 文件格式:JSON...
-
Zenodo_Source_日本公开医疗文本记录带质量评估数据
2026年1月28日 30 58 36
数据集概述 本数据集为日语书写的公开医疗文本记录,包含质量评估内容,无隐私问题,研究人员可直接使用。数据集存储于单一压缩文件中,无训练测试、数据标签或原始处理数据的划分。 文件详解 文件名称:pseudo_progressnotes_p.zip 文件格式:ZIP...
-
PeriodO_EAMENA_历史时期多语言数据库数据2021
2026年1月28日 30 105 24
数据集概述 本数据集由EAMENA项目于2021年创建,包含226个历史时期的多语言(英语和阿拉伯语)数据,托管于PeriodO LOD地名录,具有唯一ARK标识符。数据以单一JSON文件存储,无目录结构或数据拆分。 文件详解 文件名称:periodo-authority-m64td.json 文件格式:JSON...
-
Bolt_Food_2020_2023年Telegram消息数据
2026年1月28日 30 184 183
数据集概述 本数据集包含2020年1月至2023年12月期间,Bolt Food在Telegram平台向其快递员发送的4513条文本消息。消息内容以拉脱维亚语和英语撰写,覆盖了该时间段内的通知信息。数据集提供了一个Excel文件,记录了这些消息的详细内容。 文件详解 文件名称:Bolt Food push notifications...
-
Centiment_Source_南佛罗里达比斯坎湾公众态度调查数据集
2026年1月23日 30 191 50
数据集概述 本数据集为2022年5月至12月在佛罗里达州迈阿密-戴德都会区开展的比斯坎湾公众态度调查结果,通过Centiment调查面板招募1146名英语、西班牙语成年居民,采用Qualtrics平台收集数据,涵盖居民对海湾现状、生态健康变化的感知等态度与行为信息。 文件详解 文件名称:README.md 文件格式:MD...
-
ClinSpEn_CT_Based_平行英西生物医学术语数据_2022
2026年1月26日 30 41 36
数据集概述 本数据集为ClinSpEn-Clinical Terms子任务的样本、测试及背景数据,方向为西班牙语到英语(ES>EN)翻译。术语源自医学文献和临床记录,聚焦疾病、症状等类别,由专业医疗译者翻译修订,支持生物医学领域机器翻译系统开发与评估。 文件详解...



