-
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:...
-
GDPR法规条款数据集GDPRArticlesDataset-iuliabunescu23
GDPR法规条款数据集GDPRArticlesDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据保护,隐私法规,GDPR,法律研究,政策分析,合规管理,数据安全,法律文档 数据概述: 该数据集包含欧盟通用数据保护条例(GDPR)的官方条款文本,记录了GDPR法规的详细条款和规定。主要特征如下:...
-
芝加哥警局辖区人口统计与社会经济数据集-robertyu02
芝加哥警局辖区人口统计与社会经济数据集-robertyu02 数据来源:互联网公开数据 标签:芝加哥,警局,人口统计,社会经济,辖区,犯罪,教育,收入,种族,年龄,住房,数据分析 数据概述:...
-
航空旅行信息系统意图识别训练数据集ATISIntentsTrainDataset-航空旅行信息系统意图识别训练数据集-dwaipayanduttadd
航空旅行信息系统意图识别训练数据集ATISIntentsTrainDataset-航空旅行信息系统意图识别训练数据集-dwaipayanduttadd 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,机器学习,语音识别,智能问答,人工智能,航空服务 数据概述:...
-
国家航空航天局NASA轴承数据集NARSBearingDataset-wuanming
国家航空航天局NASA轴承数据集NARSBearingDataset-wuanming 数据来源:互联网公开数据 标签:轴承,振动,数据集,机械工程,故障诊断,信号处理,机器学习,工业应用 数据概述:该数据集由美国国家航空航天局(NASA)提供,记录了轴承在不同工况下的振动数据,用于轴承故障诊断和预测性维护。主要特征如下:...
-
植物病害诊断对话数据集-rahulrwl
植物病害诊断对话数据集-rahulrwl 数据来源:互联网公开数据 标签:植物病害,诊断,对话,自然语言处理,机器学习,农业,疾病识别,文本分析 数据概述: 该数据集包含植物病害诊断相关的对话记录,记录了用户与诊断系统之间的互动。主要特征如下: 时间跨度: 数据记录的时间范围为不确定,取决于对话的收集时间。 地理范围:...
-
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:...
-
巴西邮政编码CEP信息数据集2018年5月-wfoliveira
巴西邮政编码CEP信息数据集2018年5月-wfoliveira 数据来源:互联网公开数据 标签:巴西,邮政编码,地理信息,数据集,地址数据,数据分析,空间数据,物流 数据概述: 该数据集包含来自巴西邮政(Correios)的邮政编码(CEP)信息,记录了巴西各地的邮政编码及其对应的地址信息。主要特征如下:...
-
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
-
大型语言模型LLM考试数据集-baorbaor
大型语言模型LLM考试数据集-baorbaor 数据来源:互联网公开数据 标签:大型语言模型,LLM,考试,评估,自然语言处理,人工智能,NLP,机器学习 数据概述: 该数据集包含用于评估大型语言模型(LLM)在考试场景中的表现的数据。主要特征如下: 时间跨度:数据记录的时间范围为当前,持续更新。...
-
核物理结合能数据集-mayank102106
核物理结合能数据集-mayank102106 数据来源:互联网公开数据 标签:核物理,结合能,数据集,原子核,核结构,物理学,数据分析,科学研究 数据概述: 该数据集包含核物理结合能的数据,记录了不同原子核的结合能信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了从早期核物理实验至今的多个时期。...
-
大规模语音识别乱序数据集LargeASRShuffleDataset-gamingnation
大规模语音识别乱序数据集LargeASRShuffleDataset-gamingnation 数据来源:互联网公开数据 标签:语音识别,数据集,机器学习,自然语言处理,人工智能,语音技术,音频处理,深度学习 数据概述: 该数据集包含大规模的语音识别数据,记录了不同场景下的语音音频和对应的文本转录。主要特征如下:...
-
英语语音识别数据集LibriSpeechDataset-renusankhla
英语语音识别数据集LibriSpeechDataset-renusankhla 数据来源:互联网公开数据 标签:语音识别,数据集,英语,音频处理,机器学习,自然语言处理,人工智能,信号处理 数据概述: 该数据集为LibriSpeech项目的一部分,主要记录了英语语音的音频数据和对应的文本转录。主要特征如下:...
-
IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia
IMDB电影评论数据集IMDBMovieReviewsDataset-fernarancibia 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本分析,机器学习,影评 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:...
-
前百万个质数数据集FirstMillionPrimeNumbersDataset-manish4348
前百万个质数数据集FirstMillionPrimeNumbersDataset-manish4348 数据来源:互联网公开数据 标签:数学,质数,数据集,数论,算法研究,基础科学,数据生成,计算机科学 数据概述: 该数据集包含前一百万个质数的完整列表,记录了数学中的质数序列。主要特征如下:...
-
意大利IncisaValdarno地区3BMeteo气象数据集-annachirumbolo
意大利IncisaValdarno地区3BMeteo气象数据集-annachirumbolo 数据来源:互联网公开数据 标签:气象数据,数据集,温度,降水,风速,湿度,机器学习,环境科学 数据概述: 该数据集包含来自意大利Incisa Valdarno地区的3B Meteo气象站的详细气象数据,记录了该地区的天气状况。主要特征如下:...
-
高斯分布非平衡数据集-juliusgonsior
高斯分布非平衡数据集-juliusgonsior 数据来源:互联网公开数据 标签:高斯分布,非平衡,数据集,机器学习,分类,数据生成,统计学,不平衡数据 数据概述:该数据集包含模拟生成的高斯分布数据,用于研究和评估非平衡分类问题。主要特征如下: 时间跨度:数据为静态数据集,不涉及时间维度。 地理范围:数据不涉及地理位置信息。...
-
莫氏硬度预测数据集MohsHardnessPredictionDataset-simarjitkaur123
莫氏硬度预测数据集MohsHardnessPredictionDataset-simarjitkaur123 数据来源:互联网公开数据 标签:材料科学,硬度预测,数据集,机器学习,物理化学,数据分析,材料性能,预测模型 数据概述: 该数据集包含了关于材料的物理化学性质和对应的莫氏硬度数据,用于材料的硬度预测研究。主要特征如下:...
-
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy 数据来源:互联网公开数据 标签:数字语言,马拉雅拉姆,数据集,自然语言处理,文本分析,机器学习,语言学,人工智能 数据概述: 该数据集包含来自互联网和公开资源的马拉雅拉姆语言文本数据,记录了各种类型的马拉雅拉姆文本。主要特征如下:...
-
土耳其网络数据集TurkishWebDatasettg-2024-1-denizhanahin
土耳其网络数据集TurkishWebDatasettg-2024-1-denizhanahin 数据来源:互联网公开数据 标签:网络数据,土耳其,数据集,文本分析,机器学习,自然语言处理,社交媒体,数据挖掘 数据概述: 该数据集包含来自土耳其互联网公开数据的信息,记录了土耳其网络环境下的各类文本数据。主要特征如下:...



