找到261个数据集

标签: 文本处理

过滤结果
  • 恩尼翁2006年电子邮件垃圾邮件与正常邮件分类数据集

    2025年4月20日   

    恩尼翁2006年电子邮件垃圾邮件与正常邮件分类数据集 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件分类,正常邮件,文本处理,数据预处理,机器学习,文本分析 数据概述:...
    packageimg
  • 文本分析与数据挖掘课程数据集

    2025年4月19日   

    文本分析与数据挖掘课程数据集 数据来源:互联网公开数据 标签:文本分析,数据挖掘,课程资源,教学研究,文本处理,机器学习,自然语言处理 数据概述:...
    packageimg
  • 写作过程与质量分析数据集

    2025年4月19日   

    写作过程与质量分析数据集 数据来源:互联网公开数据 标签:文本处理,内存优化,写作质量,特征工程,数据预处理,机器学习,数据分析 数据概述:...
    packageimg
  • 英语词典数据集

    2025年4月18日   

    英语词典数据集 数据来源:互联网公开数据 标签:英语词汇,词典数据,词性标注,词义解析,语言学研究,文本处理,自然语言处理 数据概述:...
    packageimg
  • 伦巴第语命名实体识别与语言训练数据集

    2025年4月17日   

    伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。...
    packageimg
  • 高质量多语言翻译数据集

    2025年4月17日   

    高质量多语言翻译数据集 数据来源:互联网公开数据 标签:多语言翻译,机器学习,文本处理,自然语言处理,语言模型,国际业务,跨文化交流 数据概述:...
    packageimg
  • 印度邮件垃圾邮件分类数据集2003-2005

    2025年4月17日   

    印度邮件垃圾邮件分类数据集2003-2005 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,Ham,Spam,SpamAssassin,文本处理,电子邮件分析 数据概述:...
    packageimg
  • 自杀干预情感分析数据集

    2025年4月15日   

    自杀干预情感分析数据集 数据来源:互联网公开数据 标签:自杀干预,情感分析,心理健康,文本处理,TF-IDF,自然语言处理,情绪分类 数据概述: 本数据集基于“suicide-watch”数据集进行处理和增强,包含经过清洗的文本数据、TF-...
    packageimg
  • 疾病文章数据集

    2025年4月15日   

    疾病文章数据集 数据来源:互联网公开数据 标签:疾病,文章,文本处理,自然语言处理,Spacy,BERT,机器学习 数据概述:...
    packageimg
  • 数据3000文本恢复挑战提示数据集

    2025年4月15日   

    数据3000文本恢复挑战提示数据集 数据来源:互联网公开数据 标签:文本恢复,提示生成,创造力,文本处理,专业设置,维基百科,相似度评分 数据概述:...
    packageimg
  • 家用电器产品合成数据集

    2025年4月15日   

    家用电器产品合成数据集 数据来源:互联网公开数据 标签:家用电器,合成数据,数据清理,文本处理,产品信息,能源消耗 数据概述:...
    packageimg
  • 电影相关推文数据集

    2025年4月14日   

    电影相关推文数据集 数据来源:互联网公开数据 标签:电影,社交媒体,推文,情感分析,文本处理,大数据,自然语言处理 数据概述:...
    packageimg
  • 撰写过程与质量关联性重建文本数据集

    2025年4月14日   

    撰写过程与质量关联性重建文本数据集 数据来源:互联网公开数据 标签:撰写过程,文本质量,数据重建,机器学习,比赛数据,文本处理 数据概述: 本数据集包含用于“Linking Writing Processes to Writing Quality”...
    packageimg
  • 印度尼西亚论文错误检测数据集2023

    2025年4月14日   

    印度尼西亚论文错误检测数据集2023 数据来源:互联网公开数据 标签:论文错误检测,印度尼西亚,文本处理,自然语言处理,机器学习,数据增强,学术研究 数据概述: 本数据集来源于PERSUADE 2.0数据集,并经过Claude...
    packageimg
  • 科学知识图谱大语言模型构建数据集

    2025年4月14日   

    科学知识图谱大语言模型构建数据集 数据来源:互联网公开数据 标签:科学知识图谱,大语言模型,KG,LLM,数据集,关系提取,实体识别,文本处理 数据概述:...
    packageimg
  • GPU和CPU价格上涨原因数据集

    2025年4月14日   

    GPU和CPU价格上涨原因数据集 数据来源:互联网公开数据 标签:GPU价格, CPU价格, 文章分析, 情感分析, 文本处理, 数据清理, 市场趋势 数据概述:...
    packageimg
  • IMDB电影评分及演员信息数据集

    2025年4月14日   

    IMDB电影评分及演员信息数据集 数据来源:互联网公开数据 标签:电影,评分,演员,IMDB,娱乐,影视,数据分析,文本处理 数据概述:...
    packageimg
  • 梵语文本生成与摘要研究数据集

    2025年4月14日   

    梵语文本生成与摘要研究数据集 数据来源:互联网公开数据 标签:梵语,文本生成,新闻摘要,语言学,数据增强,文本处理 数据概述:...
    packageimg
  • 金融新闻情感数据集

    2025年4月14日   

    金融新闻情感数据集 数据来源:互联网公开数据 标签:金融新闻,情感分析,NLP,文本处理,数据清洗,股票市场 数据概述: 本数据集包含标注了情感标签的金融新闻文本,适用于自然语言处理(NLP)任务。数据集经过了一系列文本处理操作,包括去除空值、删除重复项、平衡各类情感标签的数量、去除前后空格和换行符、移除URL、展开缩写(如将“it's”转换为“it...
    packageimg
  • 印度假新闻检测与立场识别数据集2017

    2025年4月14日   

    印度假新闻检测与立场识别数据集2017 数据来源:互联网公开数据 标签:假新闻,立场检测,机器学习,新闻分析,数据可视化,情感分析,文本处理 数据概述:...
    packageimg