找到268个数据集

标签: 文本处理

过滤结果
  • 印度尼西亚论文错误检测数据集2023

    2025年4月14日   

    印度尼西亚论文错误检测数据集2023 数据来源:互联网公开数据 标签:论文错误检测,印度尼西亚,文本处理,自然语言处理,机器学习,数据增强,学术研究 数据概述: 本数据集来源于PERSUADE 2.0数据集,并经过Claude...
    packageimg
  • 科学知识图谱大语言模型构建数据集

    2025年4月14日   

    科学知识图谱大语言模型构建数据集 数据来源:互联网公开数据 标签:科学知识图谱,大语言模型,KG,LLM,数据集,关系提取,实体识别,文本处理 数据概述:...
    packageimg
  • GPU和CPU价格上涨原因数据集

    2025年4月14日   

    GPU和CPU价格上涨原因数据集 数据来源:互联网公开数据 标签:GPU价格, CPU价格, 文章分析, 情感分析, 文本处理, 数据清理, 市场趋势 数据概述:...
    packageimg
  • IMDB电影评分及演员信息数据集

    2025年4月14日   

    IMDB电影评分及演员信息数据集 数据来源:互联网公开数据 标签:电影,评分,演员,IMDB,娱乐,影视,数据分析,文本处理 数据概述:...
    packageimg
  • 梵语文本生成与摘要研究数据集

    2025年4月14日   

    梵语文本生成与摘要研究数据集 数据来源:互联网公开数据 标签:梵语,文本生成,新闻摘要,语言学,数据增强,文本处理 数据概述:...
    packageimg
  • 金融新闻情感数据集

    2025年4月14日   

    金融新闻情感数据集 数据来源:互联网公开数据 标签:金融新闻,情感分析,NLP,文本处理,数据清洗,股票市场 数据概述: 本数据集包含标注了情感标签的金融新闻文本,适用于自然语言处理(NLP)任务。数据集经过了一系列文本处理操作,包括去除空值、删除重复项、平衡各类情感标签的数量、去除前后空格和换行符、移除URL、展开缩写(如将“it's”转换为“it...
    packageimg
  • 印度假新闻检测与立场识别数据集2017

    2025年4月14日   

    印度假新闻检测与立场识别数据集2017 数据来源:互联网公开数据 标签:假新闻,立场检测,机器学习,新闻分析,数据可视化,情感分析,文本处理 数据概述:...
    packageimg
  • 调整文本数据集

    2025年4月14日   

    调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:...
    packageimg