找到11,924个数据集

标签: 自然语言处理

过滤结果
  • 鲁比亚斯评论NLP数据集

    2025年4月14日 30 16 7

    鲁比亚斯评论NLP数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,评论分析,情感分析,讽刺检测,Kaggle竞赛,文本数据 数据概述: 本数据集包含与“鲁比亚斯”相关的评论,涵盖了用户对鲁比亚斯的各类意见和反馈。数据集为自然语言处理(NLP)任务提供了丰富的文本样本,适合进行情感分析、讽刺检测等文本挖掘任务。 数据用途概述:...
    packageimg
  • 高质量文本摘要与生成示例数据集

    2025年4月15日 30 20 6

    高质量文本摘要与生成示例数据集 数据来源:互联网公开数据 标签:文本摘要,生成模型,自然语言处理,NLP,数据训练,模型优化,高质量示例 数据概述: 本数据集包含15,000个高质量的文本摘要与生成示例,由GPT-3.5...
    packageimg
  • 高质量多语言翻译数据集

    2025年4月17日 30 28 1

    高质量多语言翻译数据集 数据来源:互联网公开数据 标签:多语言翻译,机器学习,文本处理,自然语言处理,语言模型,国际业务,跨文化交流 数据概述:...
    packageimg
  • 高评分电影词干与词形还原分析数据集

    2025年4月14日 30 26 8

    高评分电影词干与词形还原分析数据集 数据来源:互联网公开数据 标签:电影,高评分,词干提取,词形还原,自然语言处理,文本分析,影视研究 数据概述: 本数据集收录了若干高评分电影的基本信息及其概述内容的词干和词形还原处理结果。数据集包含以下字段: - 电影标题:电影的名称 - 电影概述:对电影剧情的简要描述 - 类型列表:电影所属的类型或标签 -...
    packageimg
  • 高校学生招聘数据文本化数据集

    2025年4月14日 30 11 6

    高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-...
    packageimg
  • 马来语大规模文本数据集

    2025年6月1日 30 13 3

    马来语大规模文本数据集 数据来源:互联网公开数据 标签:马来语,自然语言处理,语言模型训练,文本数据,机器学习,深度学习,文本清洗 数据概述: 本数据集包含超过600万行独特的马来语文本,数据来源于多个公开数据集并经过清洗处理,确保数据的高质量和可用性。该数据集为研究人员和开发者提供了一个丰富且多样化的文本资源,适用于多种自然语言处理任务。...
    packageimg
  • 马来西亚新闻头条数据集

    2025年4月14日 30 13 8

    马来西亚新闻头条数据集 数据来源:互联网公开数据 标签:新闻头条,马来西亚,情感分析,自然语言处理,文本分类,数据分布 数据概述: 本数据集包含63,692条来自马来西亚的新闻头条,每条新闻头条都标注了情感...
    packageimg
  • 马拉雅拉姆推特数据集

    2025年4月14日 30 17 4

    马拉雅拉姆推特数据集 数据来源:互联网公开数据 标签:推特,马拉雅拉姆,情感分析,社交媒体,文本数据,用户行为,自然语言处理 数据概述:...
    packageimg
  • 马拉维新闻分类挑战数据集

    2025年4月14日 30 26 2

    马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio...
    packageimg
  • 餐饮评论情感分析数据集

    2025年8月15日 30 30 4

    餐饮评论情感分析数据集_Restaurant_Review_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 餐饮评论, 机器学习, 自然语言处理, 数据标注, 情感极性, 中文文本 数据概述: 该数据集包含来自餐饮评论平台的用户评论数据,记录了用户对餐厅的评价文本,并可用于进行情感分析。主要特征如下:...
    packageimg
  • 餐厅评论情感分析分类数据集

    2025年4月14日 30 28 10

    餐厅评论情感分析分类数据集 数据来源:互联网公开数据 标签:餐厅评论,情感分析,自然语言处理,文本分类,机器学习,监督学习,情感识别 数据概述:...
    packageimg
  • 食品与健康数据分析集

    2025年4月25日 31 14 3

    标题:食品与健康数据分析集 数据来源:互联网公开数据 数据内容: 本数据集包含以下数据元素: 1. 食品名称(Title):记录了不同食品的名称。 2. 食材(Ingredients):列出了制作每道食品所需的食材。 3. 制作步骤(Instructions):详细描述了每道食品的制作过程。 4....
    packageimg
  • 飞利浦印度员工评论数据集

    2025年4月15日 30 15 5

    飞利浦印度员工评论数据集 数据来源:互联网公开数据 标签:飞利浦,印度,员工评论,工作环境,职业发展,公司文化,数据挖掘,自然语言处理,情感分析 数据概述: 飞利浦印度员工评论数据集收集了来自Ambition Box平台的飞利浦印度员工评论,Ambition...
    packageimg
  • 预训练语义模型评估数据集

    2025年8月7日 30 16 1

    预训练语义模型评估数据集_Pre_trained_Semantic_Model_Evaluation_Dataset 数据来源:互联网公开数据 标签:语义模型, 文本相似度, 预训练模型, 评估, 自然语言处理, 迁移学习, 神经网络, 模型优化 数据概述:...
    packageimg
  • 预训练模型数据集

    2025年4月23日 30 10 1

    预训练模型数据集 数据来源:互联网公开数据 标签:预训练模型,自然语言处理,深度学习,模型训练,人工智能,模型架构,训练数据,性能评估,语言模型 数据概述:...
    packageimg
  • 预处理抑郁数据集

    2025年4月15日 30 19 6

    预处理抑郁数据集 数据来源:互联网公开数据 标签:抑郁症,心理健康,文本分析,情感分析,社交媒体,自然语言处理,情感状态 数据概述:...
    packageimg
  • 韩语仇恨言论数据集

    2025年4月23日 30 15 7

    韩语仇恨言论数据集 数据来源:互联网公开数据 标签:韩语,仇恨言论,文本分类,自然语言处理,社会分析,多分类模型,二分类模型 数据概述: 本数据集包含韩语仇恨言论文本数据,由从韩国右翼网站“일간베스트”爬取的仇恨和歧视性评论组成。数据集分为两部分: 1. hate-speech-binary-...
    packageimg
  • 韩国语词汇频率数据集

    2025年4月15日 30 19 8

    韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean...
    packageimg
  • 韩国语翻译数据集

    2025年4月15日 30 16 7

    韩国语翻译数据集 数据来源:互联网公开数据 标签:韩国语,翻译,NLP模型,机器翻译,自然语言处理,DeepL API,英译韩,语言学习 数据概述: 本数据集提供了一组从英语翻译成韩国语的文本数据,适用于GPT4ALL、Dolly、Vicuna等NLP模型的训练与研究。数据集由nlpai-lab团队整理,通过DeepL...
    packageimg
  • 韩国大学人文论文数据集

    2025年4月14日 30 22 3

    韩国大学人文论文数据集 数据来源:互联网公开数据 标签:韩国大学,人文论文,教育,学术研究,自然语言处理,文本分析,教育趋势 数据概述:...
    packageimg