-
语音转换挑战赛2020听力测试数据集
2025年12月22日 30 102 26
数据集概述 本数据集包含2020年语音转换挑战赛(VCC 2020)中,用于跨语言语音转换任务的众包感知评估音频文件及原始听力测试评分,支持语音转换系统性能的主观评价研究。 文件详解 文件名称: nii-yamagishilab/VCC2020-listeningtest-v1.0.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
欧洲语言社会科学叙词表2024
2025年12月22日 30 155 63
数据集概述 该数据集为欧洲语言社会科学叙词表(ELSST),覆盖政治学、社会学等十余门核心社会科学学科,包含约三千四百个概念,由欧洲社会科学数据档案联盟及其服务提供商发布,用于跨语言、跨资源的数据发现与访问。 文件详解 文件名称:ELSST_R5.ttl,格式:TTL,RDF三元组格式的叙词表数据文件...
-
跨语言缺陷定位数据集
2025年12月16日 30 64 46
数据集概述 该数据集是一个名为BuGL的跨语言缺陷定位数据集,主要用于缺陷定位相关研究。数据集以压缩包形式存储,未划分训练/测试集、数据/标签集或原始/处理数据,为相关领域提供了统一的跨语言缺陷定位数据支持。 文件详解 文件名称: BuGL.zip 文件格式: ZIP (.zip) 文件内容:...
-
不同语言系统谚语中女性形象解读数据集
2025年12月8日 30 32 10
数据集概述 本数据集聚焦不同语言系统谚语中的女性形象解读,通过单一PDF文档呈现相关研究内容,为分析跨语言文化中谚语对女性形象的建构提供资料支持。 文件详解 文件名称:Jumayeva Umida Aburahim kizi.pdf 文件格式:PDF(.pdf) 文件内容:包含关于不同语言系统谚语中女性形象解读的研究内容,具体结构需通过文档阅读确认...
-
跨语言数词系统构成结构数据集2025
2025年12月4日 30 94 8
数据集概述 该数据集呈现了2025年Rubehn等人关于跨语言数词系统构成结构的研究成果,包含数词系统构成结构的标注与推理相关数据,为计算语言类型学和多语言自然语言处理研究提供支持。 文件详解 文件名称:numeralbank/cosinus-v1.1.zip 文件格式:ZIP压缩包(.zip)...
-
文本相关性预测模型预测结果数据集
2025年9月12日 30 128 6
文本相关性预测模型预测结果数据集_Text_Relevance_Prediction_Model_Prediction_Results 数据来源:互联网公开数据 标签:文本匹配, 自然语言处理, 机器翻译, 语义理解, 深度学习, 模型预测结果, 跨语言, 数据分析 数据概述:...
-
国际新闻文本数据集
2025年7月30日 30 87 67
国际新闻文本数据集_International_News_Text_Data 数据来源:互联网公开数据 标签:新闻文本, 自然语言处理, 文本分析, 舆情分析, 情感分析, 跨语言, 新闻内容, 数据挖掘 数据概述: 该数据集包含来自CNN新闻频道的数据,记录了国际新闻报道的文本内容。主要特征如下:...
-
语言词源关系数据集-bilalelebi
2025年6月1日 30 77 41
语言词源关系数据集-bilalelebi 数据来源:互联网公开数据 标签:词源学,语言学,词汇,关系,跨语言,历史,文化,语义 数据概述:...
-
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007
2025年5月30日 30 109 25
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007 数据来源:互联网公开数据 标签:跨语言, 文本理解, 多任务学习, 机器翻译, 文本分类, 问答系统, 数据集, 自然语言处理 数据概述:...
-
印地语-英语平行语料库数据集-harshityadavjnu
2025年5月28日 30 96 6
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。...
-
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600
2025年5月20日 30 42 39
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600 数据来源:互联网公开数据 标签:文本摘要, 机器翻译, 印地语, 英语, 自然语言处理, 跨语言, 摘要生成, 文本分析 数据概述:...
-
多语言问答数据集MultilingualQuestionAnsweringDataset-kishalmandal
2025年5月18日 30 56 48
多语言问答数据集MultilingualQuestionAnsweringDataset-kishalmandal 数据来源:互联网公开数据 标签:问答系统, 机器阅读理解, 跨语言, 自然语言处理, 文本摘要, 知识获取, 印度语, 英语 数据概述: 该数据集包含来自MLQA (Multilingual Question Answering) 和...
-
跨语言视觉问答数据集Cross-lingualVisualQuestionAnsweringDataset-alhajiidibabate
2025年5月12日 30 194 30
跨语言视觉问答数据集Cross-lingualVisualQuestionAnsweringDataset-alhajiidibabate 数据来源:互联网公开数据 标签:视觉问答, 跨语言, 图像识别, 自然语言处理, 机器翻译, 图像检索, Hausa语, 英语 数据概述:...
-
多语言文本分类数据集MultilingualTextClassificationDataset-claudiovaliense
2025年5月7日 30 31 16
多语言文本分类数据集MultilingualTextClassificationDataset-claudiovaliense 数据来源:互联网公开数据 标签:文本分类, 多语言, 机器学习, 自然语言处理, 语料库, 情感分析, 跨语言, 数据集 数据概述: 该数据集包含多种语言的文本数据,旨在用于多语言文本分类任务。主要特征如下:...
-
印地语-尼泊尔语机器翻译平行语料数据集Hindi-NepaliMachineTranslationParallelCorpus-thenepaliguy
2025年5月1日 30 15 11
印地语-尼泊尔语机器翻译平行语料数据集Hindi-NepaliMachineTranslationParallelCorpus-thenepaliguy 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 尼泊尔语, 平行语料, 语言模型, 自然语言处理, 跨语言 数据概述: 该数据集包含印地语-...
-
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush
2025年5月1日 30 138 130
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 平行语料, 自然语言处理, 文本对齐, 语言模型, 跨语言 数据概述:...
-
多语言对话意图识别数据集MultilingualDialogueIntentRecognitionDataset-saumyamishra536
2025年5月1日 30 88 59
多语言对话意图识别数据集MultilingualDialogueIntentRecognitionDataset-saumyamishra536 数据来源:互联网公开数据 标签:对话系统, 意图识别, 机器翻译, 自然语言处理, 多语言, 文本分析, 语义理解, 跨语言 数据概述:...
-
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297
2025年5月1日 30 24 17
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297 数据来源:互联网公开数据 标签:努佩语, 古兰经, 翻译, 语言学, 文本分析, 跨语言, 宗教, 语义分析 数据概述: 该数据集包含古兰经的英文和努佩语(Nupe)翻译,记录了古兰经经文的跨语言对照。主要特征如下:...
-
孟加拉语心理健康对话数据集BengaliMentalHealthDialogueDataset-modhudeb
2025年5月1日 30 138 11
孟加拉语心理健康对话数据集BengaliMentalHealthDialogueDataset-modhudeb 数据来源:互联网公开数据 标签:心理健康, 情感分析, 文本对话, 孟加拉语, 自然语言处理, 聊天记录, 情感识别, 跨语言 数据概述: 该数据集包含孟加拉语心理健康相关的对话记录,旨在促进对心理健康问题的理解和相关研究。主要特征如下:...
-
泰米尔语-英语跨语言仇恨言论检测数据集Tamil-EnglishCross-lingualHateSpeechDetection-syntaxicoalt
2025年4月29日 30 170 74
泰米尔语-英语跨语言仇恨言论检测数据集Tamil-EnglishCross-lingualHateSpeechDetection-syntaxicoalt 数据来源:互联网公开数据 标签:仇恨言论, 跨语言, 泰米尔语, 英语, 文本分类, 情感分析, 自然语言处理, 社交媒体 数据概述:...



