找到261个数据集

标签: 文本处理

过滤结果
  • 无词干提取文本数据集DatasetTanpaStemming-skripsheet

    2025年4月26日   

    无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:...
    packageimg
  • 新闻摘要生成数据集NewsSummaryGenerationDataset-diwakarshukla74

    2025年4月26日   

    新闻摘要生成数据集NewsSummaryGenerationDataset-diwakarshukla74 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本生成,数据集,机器学习,文本处理,信息提取,人工智能 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的摘要,记录了新闻内容与摘要之间的映射关系。主要特征如下:...
    packageimg
  • 书籍文本错误纠正数据集-shuaibing

    2025年4月26日   

    书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。...
    packageimg
  • 英语-德语翻译数据集English-to-GermanTranslationDataset-shashanknecrothapa

    2025年4月26日   

    英语-德语翻译数据集English-to-GermanTranslationDataset-shashanknecrothapa 数据来源:互联网公开数据 标签:机器翻译,语言学习,数据集,自然语言处理,人工智能,双语对照,文本处理,教育应用 数据概述: 该数据集包含英语到德语的文本翻译对,记录了大量的英语句子及其对应的德语翻译。主要特征如下:...
    packageimg
  • 自然语言处理作业二数据集NLPHomework2Dataset-andrewmilko

    2025年4月26日   

    自然语言处理作业二数据集NLPHomework2Dataset-andrewmilko 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器学习,文本处理,深度学习,作业 数据概述: 该数据集用于自然语言处理(NLP)的作业二,主要包含文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:...
    packageimg
  • 单词批处理与梯度提升决策树模型WordBatchLGBMSeed1Dataset-sihaodi

    2025年4月26日   

    单词批处理与梯度提升决策树模型WordBatchLGBMSeed1Dataset-sihaodi 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,梯度提升决策树,文本处理,模型训练,数据挖掘,算法研究 数据概述:...
    packageimg
  • 标记预处理脚本数据集MarkedPreprocessingScriptDataset-slx3zippy

    2025年4月25日   

    标记预处理脚本数据集MarkedPreprocessingScriptDataset-slx3zippy 数据来源:互联网公开数据 标签:文本处理,预处理,数据集,自然语言处理,脚本,Python,数据清洗,文本分析 数据概述: 该数据集包含用于文本预处理的Python脚本和相关数据,主要用于演示和评估文本处理流程。主要特征如下:...
    packageimg
  • 数据10kBPE分词器概率数据集10kBPETokenizerProbasDataset-kareem87

    2025年4月25日   

    10kBPE分词器概率数据集10kBPETokenizerProbasDataset-kareem87 数据来源:互联网公开数据 标签:分词器,BPE,概率分布,数据集,自然语言处理,机器学习,文本处理,算法研究 数据概述:...
    packageimg
  • 迷你日志文件分析数据集MiniLogFileAnalysisDataset-tanyasaraswat

    2025年4月25日   

    迷你日志文件分析数据集MiniLogFileAnalysisDataset-tanyasaraswat 数据来源:互联网公开数据 标签:日志分析,数据集,数据挖掘,文本处理,机器学习,异常检测,信息安全,系统管理 数据概述: 该数据集包含来自迷你日志文件的数据,记录了系统或应用程序的活动信息。主要特征如下:...
    packageimg
  • 摘要生成与格式化数据集SAMSUMSummaryFormattedasJSONwithQwen2-7bDataset-lcwsstg

    2025年4月25日   

    摘要生成与格式化数据集SAMSUMSummaryFormattedasJSONwithQwen2-7bDataset-lcwsstg 数据来源:互联网公开数据 标签:自然语言处理,摘要生成,数据集,机器学习,文本处理,数据格式化,人工智能,语言模型 数据概述:...
    packageimg
  • 文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23

    2025年4月25日   

    文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,信息提取,文本分析,隐私保护,合规性 数据概述:该数据集包含来自多个来源的文本数据,记录了文本中敏感信息的屏蔽和分类任务。主要特征如下:...
    packageimg
  • 人工智能与法律合并数据集AILAMergeDataset-michaelhsie1024

    2025年4月25日   

    人工智能与法律合并数据集AILAMergeDataset-michaelhsie1024 数据来源:互联网公开数据 标签:人工智能,法律,数据集,机器学习,法律研究,数据分析,文本处理,智能合约 数据概述: 该数据集为 AILA 项目的一部分,主要记录了人工智能在法律领域的应用数据,适用于法律研究,文本处理和智能合约分析等任务。主要特征如下:...
    packageimg
  • 额外文件数据集ExtraFilesDataset-nhmquang

    2025年4月25日   

    额外文件数据集ExtraFilesDataset-nhmquang 数据来源:互联网公开数据 标签:文件分析,数据集,数据挖掘,文本处理,机器学习,数据安全,信息检索,文件类型 数据概述: 该数据集包含了各种文件类型的数据,旨在为文件分析,数据挖掘和机器学习研究提供支持。主要特征如下: 时间跨度:...
    packageimg
  • 数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun

    2025年4月25日   

    数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun 数据来源:互联网公开数据 标签:自然语言处理,数据集,分词器,文本处理,机器学习,语言模型,数据预处理,工具集 数据概述: 该数据集包含用于自然语言处理的多种工具和数据集,主要支持文本分词,数据预处理等任务。主要特征如下:...
    packageimg
  • HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74

    2025年4月25日   

    HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face...
    packageimg
  • 项目文件分析数据集FilestoUseforProjectDataset-justingrima

    2025年4月24日   

    项目文件分析数据集FilestoUseforProjectDataset-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文本处理,数据挖掘,信息检索,文档管理,软件工程 数据概述: 该数据集包含了用于项目的文件信息,旨在支持项目管理,文件分析和相关研究。主要特征如下:...
    packageimg
  • 预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...

    2025年4月24日   

    预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:...
    packageimg
  • 模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67

    2025年4月24日   

    模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67 数据来源:互联网公开数据 标签:模糊匹配,相似度分析,数据集,自然语言处理,文本匹配,文本处理,数据清洗,人工智能 数据概述: 该数据集包含使用FuzzyWuzzy库进行文本相似度匹配的输出结果,记录了不同文本字符串之间的相似度分数。主要特征如下:...
    packageimg
  • 小型英语文本转换数据集ETT-smallDataset-neptureillusion

    2025年4月24日   

    小型英语文本转换数据集ETT-smallDataset-neptureillusion 数据来源:互联网公开数据 标签:文本处理,时间序列,机器学习,自然语言处理,英语,数据集,文本分析,预测 数据概述: 该数据集包含小型英语文本数据,专注于文本转换和预测任务。主要特征如下: 时间跨度: 数据记录的时间范围为特定时间段,具体取决于数据集的构建方式。...
    packageimg
  • 单模型输入文本情感分析数据集-ocden22

    2025年4月24日   

    单模型输入文本情感分析数据集-ocden22 数据来源:互联网公开数据 标签:情感分析,数据集,文本处理,自然语言处理,机器学习,情感分类,文本情感,人工智能 数据概述: 该数据集包含用于单模型输入文本情感分析的文本数据,主要用于训练和评估情感分析模型。主要特征如下: 时间跨度:数据无特定时间范围,涵盖各类文本数据。...
    packageimg