-
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,人工智能,信息提取,文本处理,教育技术 数据概述: 该数据集包含来自维基百科“如何”类文章的文本及其对应的摘要,记录了各类操作指南和教程的详细内容和简明摘要。主要特征如下:... -
机器学习模型训练数据集MachineLearningModelTrainingDataset-ethanzhang9371
机器学习模型训练数据集MachineLearningModelTrainingDataset-ethanzhang9371 数据来源:互联网公开数据 标签:机器学习, 模型训练, 文本处理, 数据集, 预训练模型, 自然语言处理, 深度学习, 数据样本 数据概述:... -
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny 数据来源:互联网公开数据 标签:孟加拉语, 文本处理, 分句, 文本分割, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702 数据来源:互联网公开数据 标签:文本处理, 索引, 信息检索, 语料库, 关键词提取, 机器学习, 自然语言处理, 数据清洗 数据概述: 该数据集包含来自不同来源的文本数据,记录了经过处理的文本内容及其对应的索引信息。主要特征如下:... -
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本处理, 自然语言处理, 机器学习, 文本预处理, 词干提取, 二分类 数据概述: 该数据集包含来自推特的俄语文本数据,用于情感分析研究。主要特征如下:... -
文本增强语料数据集TextAugmentationCorpus-fareedmohamed
文本增强语料数据集TextAugmentationCorpus-fareedmohamed 数据来源:互联网公开数据 标签:文本增强, 数据增强, 自然语言处理, 文本生成, 机器学习, 噪声注入, 文本处理, 语料库 数据概述: 该数据集包含经过文本增强处理的语料,记录了原始文本及其对应的增强版本,主要用于训练和评估文本增强模型。主要特征如下:... -
孟加拉语-英语语言分类合成权重数据集-nazmuddhohaansary
孟加拉语-英语语言分类合成权重数据集-nazmuddhohaansary 数据来源:互联网公开数据 标签:语言分类,数据集,机器学习,文本处理,自然语言处理,孟加拉语,英语,合成数据 数据概述: 该数据集包含了用于孟加拉语和英语语言分类任务的合成数据,旨在评估和训练语言识别模型。主要特征如下:... -
代码自动补全Python代码数据集CodeAutocompletionPythonCodeDataset-aidarkhuzin1
代码自动补全Python代码数据集CodeAutocompletionPythonCodeDataset-aidarkhuzin1 数据来源:互联网公开数据 标签:代码补全, Python, 机器学习, 代码生成, 编程语言, 深度学习, 文本处理, 数据集 数据概述:... -
文档分类数据集PhanLoaiVanBanDataset-beosup
文档分类数据集PhanLoaiVanBanDataset-beosup 数据来源:互联网公开数据 标签:文档分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,文本处理 数据概述: 该数据集包含来自多个来源的文档数据,记录了不同类型的文本内容及其分类标签。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
文本分类与情感分析数据集CLEFDataSplitDataset-hwigeon
文本分类与情感分析数据集CLEFDataSplitDataset-hwigeon 数据来源:互联网公开数据 标签:文本分类,情感分析,数据集,自然语言处理,机器学习,数据挖掘,文本处理,人工智能 数据概述: 该数据集来源于CLEF(会议与实验论坛)项目,主要包含用于文本分类和情感分析任务的文本数据。主要特征如下:... -
商品评论文本摘要数据集ProductReviewTextSummarization-allenye66
商品评论文本摘要数据集ProductReviewTextSummarization-allenye66 数据来源:互联网公开数据 标签:文本摘要, 情感分析, 商品评论, 自然语言处理, 文本处理, 机器翻译, 数据清洗, 深度学习 数据概述:... -
文本毒性对比分析数据集TextToxicityComparisonAnalysisDataset-aronbryant
文本毒性对比分析数据集TextToxicityComparisonAnalysisDataset-aronbryant 数据来源:互联网公开数据 标签:文本分析, 毒性检测, 情感分析, 负面情绪, 文本处理, 机器学习, 语料库, 对比分析 数据概述: 该数据集包含来自互联网的文本数据,记录了不同文本的毒性程度对比。主要特征如下:... -
商品描述文本处理数据集ProductDescriptionTextProcessingDataset-aayush895
商品描述文本处理数据集ProductDescriptionTextProcessingDataset-aayush895 数据来源:互联网公开数据 标签:商品描述, 文本处理, 文本分析, 商品分类, 自然语言处理, 零售, 机器学习, 数据清洗 数据概述: 该数据集包含来自电商平台的商品描述信息,记录了不同商品的详细文本描述。主要特征如下:... -
HTML代码规范纠正数据集HTMLCodeStandardizationCorrection-kartik1045
HTML代码规范纠正数据集HTMLCodeStandardizationCorrection-kartik1045 数据来源:互联网公开数据 标签:HTML, 代码规范, 文本处理, 数据清洗, 网页开发, 编程实践, 错误修复, 代码校正 数据概述: 该数据集包含HTML代码片段,记录了不符合规范的HTML代码及其对应的规范代码。主要特征如下:... -
Spotify音乐特征分析数据集SpotifyMusicFeatureAnalysis-henrydalrymple
Spotify音乐特征分析数据集SpotifyMusicFeatureAnalysis-henrydalrymple 数据来源:互联网公开数据 标签:音乐分析, 音乐特征, Spotify, 机器学习, 音频分析, 歌曲推荐, 数据挖掘, 文本处理 数据概述:... -
图像标注实体数值预测数据集ImageAnnotationEntityValuePrediction-dravikumar
图像标注实体数值预测数据集ImageAnnotationEntityValuePrediction-dravikumar 数据来源:互联网公开数据 标签:图像识别, 实体标注, 数值预测, 机器学习, 计算机视觉, 数据分析, 文本处理, 度量单位 数据概述:... -
音乐歌词与MIDI文件数据集MusicLyricsandMIDIFilesDataset-kerensteinberg
音乐歌词与MIDI文件数据集MusicLyricsandMIDIFilesDataset-kerensteinberg 数据来源:互联网公开数据 标签:歌词分析, MIDI音乐, 音乐创作, 文本处理, 音乐数据, 自然语言处理, 音乐检索, 机器学习 数据概述: 该数据集包含音乐歌词文本和对应的MIDI音乐文件。主要特征如下:... -
代码安全漏洞检测PHP代码片段数据集CodeSecurityVulnerabilityDetectionPHPCodeSnippets-youssefha...
代码安全漏洞检测PHP代码片段数据集CodeSecurityVulnerabilityDetectionPHPCodeSnippets-youssefhazemfarouk 数据来源:互联网公开数据 标签:代码安全, 漏洞检测, PHP, 静态分析, 文本处理, 安全审计, 机器学习, 恶意代码 数据概述:... -
文本情感分析多模态数据集MultimodalTextSentimentAnalysisDataset-giorgiorossi
文本情感分析多模态数据集MultimodalTextSentimentAnalysisDataset-giorgiorossi 数据来源:互联网公开数据 标签:情感分析, 文本处理, 多模态, 自然语言处理, 机器学习, 情感分类, 文本特征, Spacy 数据概述:... -
法律判决摘要匿名化数据集LegalJudgmentSummaryAnonymizationDataset-thejasrao
法律判决摘要匿名化数据集LegalJudgmentSummaryAnonymizationDataset-thejasrao 数据来源:互联网公开数据 标签:法律, 判决, 摘要, 匿名化, 自然语言处理, 文本处理, 数据清洗, 信息安全 数据概述:...