-
阿拉伯语文本预处理数据集ArabicTextPreprocessingDataset-meshaalalharthy
阿拉伯语文本预处理数据集ArabicTextPreprocessingDataset-meshaalalharthy 数据来源:互联网公开数据 标签:阿拉伯语, 文本处理, 自然语言处理, 语料库, 文本清洗, 词汇分析, 字符分析, 机器学习 数据概述: 该数据集包含阿拉伯语文本,主要用于阿拉伯语文本的预处理与分析任务。主要特征如下:... -
隐私保护项目代码库功能分析数据集PrivacyProtectionProjectCodebaseFunctionAnalysis-maxiaokai
隐私保护项目代码库功能分析数据集PrivacyProtectionProjectCodebaseFunctionAnalysis-maxiaokai 数据来源:互联网公开数据 标签:代码分析, 隐私保护, 文本处理, 机器学习, 自然语言处理, 软件工程, 代码库, 风险评估 数据概述: 该数据集包含来自名为“maxiaokai-... -
SMOGN过采样算法示例数据集SMOGNOversamplingAlgorithmExamplesDataset-koweihuang
SMOGN过采样算法示例数据集SMOGNOversamplingAlgorithmExamplesDataset-koweihuang 数据来源:互联网公开数据 标签:过采样, SMOGN, 数据增强, 不平衡数据, 机器学习, 算法示例, 数据集, 文本处理 数据概述: 该数据集包含SMOGN(Synthetic Minority Over-... -
股票市场代码映射数据集StockMarketCodeMappingDataset-pinkyverma0256
股票市场代码映射数据集StockMarketCodeMappingDataset-pinkyverma0256 数据来源:互联网公开数据 标签:股票市场, 代码映射, 股票数据, 金融数据, 数据清洗, 市场分析, 数据标注, 文本处理 数据概述: 该数据集包含来自多种来源的股票市场代码映射信息,记录了不同股票代码之间的对应关系。主要特征如下:... -
越南地址行政区划优化数据集VietnamAddressAdministrativeDivisionOptimization-namngl
越南地址行政区划优化数据集VietnamAddressAdministrativeDivisionOptimization-namngl 数据来源:互联网公开数据 标签:地址解析, 地理信息, 行政区划, 数据清洗, 越南, 文本处理, 地理编码, 数据标准化 数据概述:... -
草稿文档完整性分析数据集DraftDocumentCompletenessAnalysis-turebogale
草稿文档完整性分析数据集DraftDocumentCompletenessAnalysis-turebogale 数据来源:互联网公开数据 标签:草稿文档, 文本分析, 完整性评估, 数据清洗, 文本处理, 机器学习, 文本挖掘, 异常检测 数据概述: 该数据集包含一系列草稿文档的文本片段,记录了不同草稿的文本内容。主要特征如下:... -
商品信息零售价格分析数据集ProductInformationRetailPriceAnalysis-sohammhatre112
商品信息零售价格分析数据集ProductInformationRetailPriceAnalysis-sohammhatre112 数据来源:互联网公开数据 标签:商品识别, 零售数据, 价格分析, 商品分类, 文本处理, 零售商分析, 市场对比, 商品推荐 数据概述:... -
社交媒体情感分析增强推文数据集SocialMediaSentimentAnalysisAugmentedTweets-rohitsingh9990
社交媒体情感分析增强推文数据集SocialMediaSentimentAnalysisAugmentedTweets-rohitsingh9990 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本处理, 文本增强, 自然语言处理, 数据增强, 情绪识别, 文本标注 数据概述:... -
多语言文本识别数据集MultilingualTextIdentificationDataset-divanshu22
多语言文本识别数据集MultilingualTextIdentificationDataset-divanshu22 数据来源:互联网公开数据 标签:文本分类, 语言识别, 多语言, 自然语言处理, 文本分析, 语料库, 机器学习, 文本处理 数据概述: 该数据集包含多种语言的文本片段,记录了不同语言的文本内容及其对应的语言标签。主要特征如下:... -
图像描述中文文本处理数据集ImageCaptionChineseTextProcessingDataset-chenglonglee9
图像描述中文文本处理数据集ImageCaptionChineseTextProcessingDataset-chenglonglee9 数据来源:互联网公开数据 标签:图像描述, 文本处理, 语义分析, 命名实体识别, 文本标注, 自然语言处理, 数据清洗, 机器学习 数据概述:... -
学生学习资源预测结果分析数据集StudentLearningResourcePredictionResultAnalysis-shripadpate
学生学习资源预测结果分析数据集StudentLearningResourcePredictionResultAnalysis-shripadpate 数据来源:互联网公开数据 标签:学生学习, 预测分析, 机器学习, 数据评估, 文本处理, 异常检测, 数据集, 结果分析 数据概述:... -
语音数据诊断分析数据集SpeechDataDiagnosticAnalysisDataset-domi2314
语音数据诊断分析数据集SpeechDataDiagnosticAnalysisDataset-domi2314 数据来源:互联网公开数据 标签:语音识别, 语音分析, 医疗诊断, 语音标注, 疾病检测, 数据清洗, 机器学习, 文本处理 数据概述:... -
文本生成指令数据集TextGenerationInstructionDataset-yuanzhezhou
文本生成指令数据集TextGenerationInstructionDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 指令, 自然语言处理, 机器学习, 语料库, 文本处理, 数据标注, 提示词 数据概述: 该数据集包含用于文本生成的指令,记录了多种文本生成任务的提示词示例。主要特征如下:... -
神经实体识别模型训练数据集NeuralEntityRecognitionModelTrainingDataset-ziyuli0104
神经实体识别模型训练数据集NeuralEntityRecognitionModelTrainingDataset-ziyuli0104 数据来源:互联网公开数据 标签:神经实体识别, 自然语言处理, 命名实体识别, 模型训练, 预训练模型, 文本处理, 深度学习, 数据集 数据概述:... -
用户电影偏好与观影行为数据集UserMoviePreferenceandViewingBehaviorDataset-udi123
用户电影偏好与观影行为数据集UserMoviePreferenceandViewingBehaviorDataset-udi123 数据来源:互联网公开数据 标签:电影推荐, 用户行为分析, 电影偏好, 数据挖掘, 情感分析, 文本处理, 机器学习, 社交媒体 数据概述:... -
音乐流派分析金属乐队数据集MusicGenreAnalysisMetalBands-konstantinnna
音乐流派分析金属乐队数据集MusicGenreAnalysisMetalBands-konstantinnna 数据来源:互联网公开数据 标签:音乐流派, 金属音乐, 乐队信息, 音乐数据, 数据分析, 文本处理, 乐队分类, 音乐推荐 数据概述: 该数据集包含来自音乐网站或相关平台的金属乐队信息,记录了乐队的名称、流派等相关数据。主要特征如下:... -
餐饮订单文本分析数据集FoodOrderTextAnalysis-salmaboudy
餐饮订单文本分析数据集FoodOrderTextAnalysis-salmaboudy 数据来源:互联网公开数据 标签:订单分析, 文本处理, 自然语言处理, 餐饮行业, 意图识别, 情感分析, 数据标注, 机器学习 数据概述: 该数据集包含来自餐饮行业的订单文本数据,记录了顾客提交的订单描述。主要特征如下:... -
数学问题解答步骤数据集MathematicalProblemSolvingSteps-james113001
数学问题解答步骤数据集MathematicalProblemSolvingSteps-james113001 数据来源:互联网公开数据 标签:数学教育, 问题求解, 步骤分析, 文本处理, 自然语言处理, 数据集构建, 预代数, 算术 数据概述: 该数据集包含数学问题及其对应的解答步骤,记录了学生在解决数学问题时所使用的步骤和最终答案。主要特征如下:... -
自然语言处理问答SFT数据集NaturalLanguageProcessingQuestion-AnsweringSFTDataset-odedregev
自然语言处理问答SFT数据集NaturalLanguageProcessingQuestion-AnsweringSFTDataset-odedregev 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, SFT, 文本生成, 机器学习, 数据集, 文本处理, 知识库 数据概述:... -
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman 数据来源:互联网公开数据 标签:文本质量, 语言学, 文本相似度, 多语言, 文本处理, 语料库, 数据清洗, 机器学习 数据概述:...