-
孟加拉语语音转录数据集BanglatoIPA-jakir57
孟加拉语语音转录数据集BanglatoIPA-jakir57 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 文本处理, 机器翻译, 语音合成 数据概述: 该数据集包含孟加拉语文本及其对应的国际音标(IPA)转录,旨在支持孟加拉语语音相关的研究与应用。主要特征如下:... -
学生答辩信息管理数据集StudentDefenseInformationManagementDataset-oussamabenhamida
学生答辩信息管理数据集StudentDefenseInformationManagementDataset-oussamabenhamida 数据来源:互联网公开数据 标签:学生答辩, 学术研究, 教育管理, 数据分析, 导师信息, 答辩状态, 文本处理, 关系抽取 数据概述: 该数据集包含学生答辩相关信息,记录了学生的实习答辩情况。主要特征如下:... -
编程语言学习资源推荐数据集ProgrammingLanguageLearningResourceRecommendation-ctrlz
编程语言学习资源推荐数据集ProgrammingLanguageLearningResourceRecommendation-ctrlz 数据来源:互联网公开数据 标签:编程语言, 学习资源, 推荐系统, 数据分析, 计算机科学, 文本处理, 机器学习, Python 数据概述:... -
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua 数据来源:互联网公开数据 标签:机器翻译, 俄语, 文本翻译, 自然语言处理, 文本对齐, 语言模型, 翻译评估, 文本处理 数据概述:... -
自然语言理解模型训练代码数据集NaturalLanguageUnderstandingModelTrainingCode-daominhkhanh
自然语言理解模型训练代码数据集NaturalLanguageUnderstandingModelTrainingCode-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, 深度学习, 文本处理, 神经网络, 数据增强, 模型训练, 代码, PyTorch 数据概述:... -
地址标准化训练数据集AddressStandardizationTrainingData-godgod3
地址标准化训练数据集AddressStandardizationTrainingData-godgod3 数据来源:互联网公开数据 标签:地址标准化, 数据清洗, 文本处理, 自然语言处理, 机器学习, 数据标注, 地理信息, 文本匹配 数据概述: 该数据集包含从互联网获取的地址信息,记录了非标准地址与其对应的标准地址。主要特征如下:... -
人工智能项目代码分析数据集ArtificialIntelligenceProjectCodeAnalysis-tomorrow2ayebizche
人工智能项目代码分析数据集ArtificialIntelligenceProjectCodeAnalysis-tomorrow2ayebizche 数据来源:互联网公开数据 标签:人工智能, 项目代码, 代码分析, 机器学习, Python, 开源项目, 软件工程, 文本处理 数据概述:... -
机器学习预测单位数据集MachineLearningPredictionUnitDataset-rkdey842
机器学习预测单位数据集MachineLearningPredictionUnitDataset-rkdey842 数据来源:互联网公开数据 标签:机器学习, 预测, 单位转换, 数据分析, 文本处理, 数值预测, 异常值处理, 数据集 数据概述:... -
银行常见问题解答数据集BankFAQsDataset-somanathkshirasagar
银行常见问题解答数据集BankFAQsDataset-somanathkshirasagar 数据来源:互联网公开数据 标签:银行, FAQ, 问答系统, 金融, 文本处理, 知识库, 客户服务, 自然语言处理 数据概述: 该数据集包含来自银行的常见问题解答,记录了客户可能遇到的问题及其对应的答案。主要特征如下:... -
文本数据预处理Python脚本与文档数据集TextDataPreprocessingPythonScriptsandDocuments-aliloubak
文本数据预处理Python脚本与文档数据集TextDataPreprocessingPythonScriptsandDocuments-aliloubak 数据来源:互联网公开数据 标签:文本处理, 数据预处理, Python, 脚本, 数据清洗, 自然语言处理, 代码分析, 文档 数据概述:... -
漫威与DC漫画人物信息数据集MarvelandDCComicsCharactersInformation-shijilan
漫威与DC漫画人物信息数据集MarvelandDCComicsCharactersInformation-shijilan 数据来源:互联网公开数据 标签:漫画人物, 漫威, DC, 人物属性, 角色分析, 数据挖掘, 文本处理, 数据可视化 数据概述:... -
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 语言学, 国际音标, 文本处理, 自然语言处理, 声学模型 数据概述:... -
情绪识别数据集EmotionRecognitionDataset-meenploy
情绪识别数据集EmotionRecognitionDataset-meenploy 数据来源:互联网公开数据 标签:情绪识别, 情感分析, 机器学习, 二元分类, 数据标注, 文本处理, 情感分类, 情绪标签 数据概述: 该数据集包含由多个数值特征组成的数据记录,用于进行情绪识别。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态数据集。... -
商品信息零售价格分析数据集ProductInformationRetailPriceAnalysis-devidasmhatre
商品信息零售价格分析数据集ProductInformationRetailPriceAnalysis-devidasmhatre 数据来源:互联网公开数据 标签:商品识别, 零售数据, 价格分析, 商品分类, 文本处理, 零售商分析, 市场对比, 商品推荐 数据概述:... -
文本处理能力提升数据集
文本处理能力提升数据集 数据来源:互联网公开数据 标签:文本处理,自然语言处理,编码技能,学习资源,技术培训,数据清洗,特征提取,文本分析,机器学习 数据概述:... -
全球语言翻译数据集WorldLanguageTranslationsDataset-cynthiawestcynths
全球语言翻译数据集WorldLanguageTranslationsDataset-cynthiawestcynths 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,多语言,机器学习,文本处理,人工智能,跨文化研究 数据概述: 该数据集包含来自全球多语言翻译项目的数据,记录了多种语言之间的文本翻译内容。主要特征如下:... -
常见拼写错误纠正数据集-therahasya00
常见拼写错误纠正数据集-therahasya00 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校正,语言学,机器学习,文本处理,中文 数据概述: 该数据集包含常见的中文拼写错误及其对应的正确词汇。主要特征如下: 时间跨度:数据记录的时间范围无明确限定,持续更新和维护。 地理范围:数据主要涵盖中国大陆地区常用的中文词汇和表达。... -
印地语验证标记数据集HindiValidationTokensDataset-pranav51286
印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:... -
地址标准化与纠正小型数据集-hamzanabil
地址标准化与纠正小型数据集-hamzanabil 数据来源:互联网公开数据 标签:地址标准化,数据清洗,文本处理,机器学习,自然语言处理,数据质量,地理信息系统,地址解析 数据概述: 该数据集包含来自公开渠道的地址数据,记录了各种格式的地址信息,旨在用于地址标准化和纠正任务。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的地址信息。... -
序列数据分析入门数据集IntroductiontoSequenceDataAnalytics-bhallaakshit
序列数据分析入门数据集IntroductiontoSequenceDataAnalytics-bhallaakshit 数据来源:互联网公开数据 标签:序列数据,时间序列分析,机器学习,数据分析,文本处理,自然语言处理,金融分析,生物信息学 数据概述: 该数据集主要用于序列数据分析的入门学习和实践,包含了多种类型的序列数据。主要特征如下: 时间跨度:...