-
德国新闻文章分类数据集-2011-abhishek
2025年5月31日 30 190 178
德国新闻文章分类数据集-2011-abhishek 数据来源:互联网公开数据 标签:新闻文章,分类,德语,文本分析,自然语言处理,学术研究,工业应用 数据概述: 本数据集包含10,000篇德语新闻文章,适用于主题分类研究。数据来源于Dietmar Schabus, Marcin Skowron和Martin Trapp于2017年在ACM... -
英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar
2025年5月30日 30 189 144
英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,德语,文本翻译,深度学习,语言技术 数据概述: 该数据集来源于WMT(Workshop on Machine... -
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo
2025年5月30日 30 8 3
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:... -
用户产品评价情感分析数据集UserProductReviewSentimentAnalysisDataset-marcelzisser
2025年5月10日 30 50 19
用户产品评价情感分析数据集UserProductReviewSentimentAnalysisDataset-marcelzisser 数据来源:互联网公开数据 标签:情感分析, 用户评价, 产品评论, 文本挖掘, 情绪识别, 机器学习, 自然语言处理, 德语 数据概述:... -
德语新闻标题文本数据集GermanNewsHeadlinesTextData-aginator
2025年5月12日 30 55 45
德语新闻标题文本数据集GermanNewsHeadlinesTextData-aginator 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, 德语, 文本清洗, 时间序列, 语料库, 摘要生成 数据概述: 该数据集包含来自德国新闻媒体的德语新闻标题文本,记录了新闻标题及其对应的时间戳和经过清洗的文本。主要特征如下:... -
德语新闻文章主题提取数据集-2011-whenamancodes
2025年5月6日 30 136 20
德语新闻文章主题提取数据集-2011-whenamancodes 数据来源:互联网公开数据 标签:NLP,德语,新闻文章,主题分类,数据集,学术研究,机器学习,新闻学 数据概述:... -
德国新闻文本命名实体识别数据集-rodionshkokov
2025年4月24日 30 174 55
德国新闻文本命名实体识别数据集-rodionshkokov 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,德语,NLP,文本分析,信息抽取,机器学习 数据概述: 该数据集包含来自德国新闻网站的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下: 时间跨度: 数据记录的时间范围未明确给出,但数据内容主要来源于新闻报道。... -
德语英语翻译文本数据集-5万条-atyamvvrmanoj
2025年4月23日 30 105 20
德语英语翻译文本数据集-5万条-atyamvvrmanoj 数据来源:互联网公开数据 标签:德语,英语,翻译,文本数据,机器学习,深度学习,语言处理 数据概述:... -
有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain
2025年4月23日 30 45 27
有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,情感分析,网络安全,德语,仇恨言论 数据概述: 该数据集由Jigsaw竞赛提供,包含德语评论数据,用于有毒评论的识别和分类。主要特征如下:... -
德语国际音标发音词典数据集GermanIPAPronunciationDictionaryDataset-cdminix
2025年4月23日 30 200 131
德语国际音标发音词典数据集GermanIPAPronunciationDictionaryDataset-cdminix 数据来源:互联网公开数据 标签:德语,发音,国际音标,词典,语言学,语音学,数据集,语音识别 数据概述:该数据集包含德语单词及其对应的国际音标(IPA)发音信息,旨在为德语语音研究和语音合成提供基础数据。主要特征如下:... -
柏林房地产市场房源数据集-2023年4月-mathisjander
2025年4月22日 30 194 103
柏林房地产市场房源数据集-2023年4月-mathisjander 数据来源:互联网公开数据 标签:房地产,柏林,房源,房价,面积,能源,供暖,房间数,邮政编码,建造年份,楼层,德语,房产 数据概述: 本数据集收录了2023年4月柏林地区的房地产房源信息,数据来源于immowelt.de网站的公开房源列表。数据集包含以下字段:... -
跨语言问答数据集XQuAD多语言问答数据集-thedevastator
2025年4月21日 30 174 9
跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:... -
艾尔登法环Steam游戏评价多语言月度更新数据集
2025年4月19日 30 68 18
艾尔登法环Steam游戏评价多语言月度更新数据集 数据来源:互联网公开数据 标签:艾尔登法环,Steam,游戏评价,玩家评论,多语言,意大利语,英语,法语,西班牙语,德语,游戏数据,用户反馈 数据概述: 本数据集包含艾尔登法环(Elden... -
德国300万句子数据集
2025年4月19日 30 151 47
德国300万句子数据集 数据来源:互联网公开数据 标签:德语,句子,语料库,语言学研究,自然语言处理,文本分析,频率统计 数据概述:... -
德语新闻文章主题分类数据集
2025年4月16日 30 82 41
德语新闻文章主题分类数据集 数据来源:互联网公开数据 标签:德语,新闻,主题分类,多分类,语言模型,文本分类,研究数据集 数据概述:... -
八年级考试成绩数据集2023-2023
2025年4月15日 30 163 128
八年级考试成绩数据集2023-2023 数据来源:互联网公开数据 标签:八年级考试,学生成绩,学校表现,波兰教育,数学,波兰语,英语,法语,西班牙语,德语,俄语,意大利语 数据概述:... -
意大利-德语计算机中介交流中的语用能力获取数据集
2025年4月15日 30 169 59
意大利-德语计算机中介交流中的语用能力获取数据集 数据来源:互联网公开数据 标签:语用能力,意大利语,德语,计算机中介交流,语言学习,跨文化沟通,社会语言学 数据概述:... -
德语到英语机器翻译数据集
2025年4月15日 30 96 17
德语到英语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,德语,英语,数据集,PyTorch,自然语言处理,翻译模型 数据概述: 本数据集包含用于机器翻译的德语到英语句子对,旨在为翻译模型的训练和评估提供数据支持。数据集由28975条训练数据和1000条测试数据组成,涵盖了多样化的语言表达和上下文。 数据用途概述:... -
德语英语翻译数据集255817样本
2025年4月15日 30 49 26
德语英语翻译数据集255817样本 数据来源:互联网公开数据 标签:德语,英语,翻译,自然语言处理,深度学习,数据预处理,语言模型 数据概述:... -
德语情感词典数据集2021
2025年4月15日 30 147 80
德语情感词典数据集2021 数据来源:互联网公开数据 标签:情感分析,意见挖掘,德语,情感词典,极性评分,词性标注,词形变化 数据概述: 本数据集收录了用于情感分析和意见挖掘的德语情感词典,即SentiWS。数据集包含标记了情感极性的词及其词性标注,极性值范围为[-1,...