找到11,686个数据集

标签: TXT

过滤结果
  • 个人身份信息PII泄露检测数据集-takaito

    2025年4月24日   

    个人身份信息PII泄露检测数据集-takaito 数据来源:互联网公开数据 标签:数据安全,PII,数据集,机器学习,文本分析,信息安全,隐私保护,自然语言处理 数据概述:该数据集包含了用于个人身份信息(PII,Personal Identifiable...
    packageimg
  • 现代英语到莎士比亚英语翻译数据集-abdelazizsidenna

    2025年4月24日   

    现代英语到莎士比亚英语翻译数据集-abdelazizsidenna 数据来源:互联网公开数据 标签:语言学,翻译,数据集,自然语言处理,文本转换,莎士比亚,机器学习,文本分析 数据概述: 该数据集旨在提供现代英语到莎士比亚英语的翻译对,用于训练和评估翻译模型。主要特征如下:...
    packageimg
  • 匈牙利国家文件数据集-coad07

    2025年4月24日   

    匈牙利国家文件数据集-coad07 数据来源:互联网公开数据 标签:匈牙利,国家,政治,经济,社会,数据集,地理,历史 数据概述: 该数据集包含关于匈牙利国家的文件,记录了匈牙利的政治,经济,社会,地理和历史等方面的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了从现代到历史时期的匈牙利相关信息。...
    packageimg
  • Python代码使用数据集-muruka12

    2025年4月24日   

    Python代码使用数据集-muruka12 数据来源:互联网公开数据 标签:Python, 数据集, 数据分析, 编程, 机器学习, 数据处理, 教程, 示例 数据概述: 该数据集包含一系列用Python代码处理的数据集,记录了如何使用Python进行数据分析和机器学习任务。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语文本数据集-mogazeyalmogazey

    2025年4月24日   

    阿拉伯语文本数据集-mogazeyalmogazey 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,自然语言处理,语言学,情感分析,机器翻译,文本挖掘,阿拉伯文化 数据概述: 该数据集包含大量阿拉伯语文本数据,涵盖了多种来源和主题。主要特征如下:...
    packageimg
  • 索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410

    2025年4月24日   

    索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410 数据来源:互联网公开数据 标签:索赔分析,自然语言处理,文本分析,数据集,信息抽取,机器学习,金融科技,风险管理 数据概述:...
    packageimg
  • Matplotlib真实世界案例数据集-niketanmoon

    2025年4月24日   

    Matplotlib真实世界案例数据集-niketanmoon 数据来源:互联网公开数据 标签:Matplotlib,数据可视化,图表,Python,数据分析,可视化工具,统计图表,实战案例 数据概述: 该数据集包含一系列使用 Matplotlib 库进行数据可视化的真实世界案例。主要特征如下: 时间跨度: 数据涵盖各种时间范围,取决于具体案例。...
    packageimg
  • 化学反应Smiles数据集ChemicalReactionDataset-ReactionSMILES-riddhimanghatak

    2025年4月24日   

    化学反应Smiles数据集ChemicalReactionDataset-ReactionSMILES-riddhimanghatak 数据来源:互联网公开数据 标签:化学,化学反应,数据集,SMILES,机器学习,化学信息学,药物发现,分子建模 数据概述: 该数据集包含来自化学研究领域的化学反应数据,记录了化学反应的详细描述。主要特征如下:...
    packageimg
  • 大规模语言模型数据LLMData数据集-snehapriyaamp

    2025年4月24日   

    大规模语言模型数据LLMData数据集-snehapriyaamp 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,数据集,文本数据,机器学习,预训练,语言模型,数据清洗 数据概述: 该数据集包含用于训练和评估大规模语言模型(LLM)的文本数据,涵盖多种来源和语言。主要特征如下:...
    packageimg
  • 英语到泰卢固语翻译数据集-krizzna69

    2025年4月24日   

    英语到泰卢固语翻译数据集-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,泰卢固语,英语,自然语言处理,深度学习,翻译模型 数据概述: 该数据集包含英语到泰卢固语的翻译数据,记录了英语句子及其对应的泰卢固语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不限,通常涵盖不同时期和语境下的翻译。...
    packageimg
  • 下一代测序NGS数据摘要统计数据集-cbonfield

    2025年4月24日   

    下一代测序NGS数据摘要统计数据集-cbonfield 数据来源:互联网公开数据 标签:基因组学,NGS,测序数据,统计分析,生物信息学,数据集,数据可视化,生物学 数据概述:该数据集包含下一代测序(NGS)数据的摘要统计信息,记录了不同NGS实验的统计指标。主要特征如下: 时间跨度:数据记录的时间范围取决于具体NGS实验,通常包含多个时间点的数据。...
    packageimg
  • 车辆跟踪数据集MOT追踪数据-ubaydulloasatullaev

    2025年4月24日   

    车辆跟踪数据集MOT追踪数据-ubaydulloasatullaev 数据来源:互联网公开数据 标签:交通,车辆跟踪,数据集,目标检测,多目标跟踪,计算机视觉,自动驾驶,智能交通 数据概述: 该数据集包含车辆跟踪数据,记录了车辆在不同场景下的运动轨迹和相关信息。主要特征如下: 时间跨度:数据记录的时间范围不确定,取决于具体数据来源。...
    packageimg
  • 阿帕卡清洗数据集Bhojpuri语音数据-satyamtiwarii

    2025年4月24日   

    阿帕卡清洗数据集Bhojpuri语音数据-satyamtiwarii 数据来源:互联网公开数据 标签:语音数据,自然语言处理,机器学习,数据集,语言模型,语音识别,人工智能,语言技术 数据概述: 该数据集包含来自阿帕卡(Alpaca)项目清洗后的语音数据,记录了比哈尔普尔语(Bhojpuri)的语音样本和对应的文本内容。主要特征如下:...
    packageimg
  • 情感表达与语音识别数据集IEMOCAPLabelsDataset-jiten597

    2025年4月24日   

    情感表达与语音识别数据集IEMOCAPLabelsDataset-jiten597 数据来源:互联网公开数据 标签:情感分析,语音识别,数据集,心理学,机器学习,情感计算,人机交互,语音情感 数据概述: 该数据集包含来自IEMOCAP(Indiana University Multimodal Emotion Corpus for...
    packageimg
  • 亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21

    2025年4月24日   

    亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源:互联网公开数据 标签:情感分析,罗马乌尔都语,数据集,自然语言处理,机器学习,文本分析,亚马逊评论,语言学 数据概述: 该数据集包含了来自亚马逊的罗马乌尔都语评论数据,用于情感分析任务。主要特征如下: 时间跨度: 数据记录时间跨度未知,但包含了亚马逊用户在一定时期内发表的评论。...
    packageimg
  • 美国国家癌症研究所60种癌细胞株数据集NCI-60Data-ukveteran

    2025年4月24日   

    美国国家癌症研究所60种癌细胞株数据集NCI-60Data-ukveteran 数据来源:互联网公开数据 标签:癌症研究,细胞株,药物筛选,数据集,生物信息学,肿瘤学,化学信息学,基因表达 数据概述: 该数据集包含来自美国国家癌症研究所(NCI)的60种人类癌细胞株的药物筛选数据,记录了不同细胞株对多种抗癌药物的反应。主要特征如下:...
    packageimg
  • 可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit

    2025年4月24日   

    可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源:互联网公开数据 标签:文本分析,可读性评估,数据集,自然语言处理,教育研究,机器学习,语料库,语言技术 数据概述: 该数据集包含用于可读性评估的文本数据,记录了多种不同难度级别的文本样本。主要特征如下: 时间跨度:...
    packageimg
  • 垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs

    2025年4月24日   

    垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs 数据来源:互联网公开数据 标签:垃圾邮件,邮件过滤,数据集,自然语言处理,文本分类,机器学习,信息检索,垃圾邮件检测 数据概述: 该数据集包含了大量标记为垃圾邮件(spam)和正常邮件(ham)的邮件数据,主要用于垃圾邮件过滤模型的训练和评估。主要特征如下:...
    packageimg
  • 真实洞察数据集FRICKMyRealInsightsMeansDataset-aniruddhkb

    2025年4月24日   

    真实洞察数据集FRICKMyRealInsightsMeansDataset-aniruddhkb 数据来源:互联网公开数据 标签:消费者行为,情感分析,用户洞察,市场调查,文本分析,社交媒体,机器学习,数据挖掘 数据概述: 该数据集包含来自FRICK My Real Insights...
    packageimg
  • 预处理与词形还原测试数据数据集-marouanesidali

    2025年4月24日   

    预处理与词形还原测试数据数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,数据集,文本分析,机器学习,NLP,测试数据 数据概述: 该数据集包含了经过预处理和词形还原处理的文本数据,主要用于测试和评估文本处理算法的性能。主要特征如下:...
    packageimg