找到560个数据集

标签: NLP

过滤结果
  • Kaggle反馈竞赛修正训练集-文本标注数据集

    2025年4月18日   

    Kaggle反馈竞赛修正训练集-文本标注数据集 数据来源:互联网公开数据 标签:文本分析,自然语言处理,标注数据,竞赛,反馈,文本纠错,机器学习,NLP 数据概述: 本数据集是针对Kaggle反馈竞赛(Feedback...
    packageimg
  • GitHub问题预测挑战赛问题类型预测数据集

    2025年4月18日   

    GitHub问题预测挑战赛问题类型预测数据集 数据来源:互联网公开数据 标签:GitHub,问题预测,文本分类,自然语言处理,机器学习,代码缺陷,软件开发,NLP,BERT 数据概述:...
    packageimg
  • KaggleLLM科学考试-GPT辅助作答数据集

    2025年4月17日   

    KaggleLLM科学考试-GPT辅助作答数据集 数据来源:互联网公开数据 标签:大型语言模型,LLM,科学考试,自然语言处理,NLP,数据集,Kaggle,考试,竞赛,GPT,人工智能 数据概述: 本数据集专为Kaggle...
    packageimg
  • 伊朗法律数据集

    2025年4月17日   

    伊朗法律数据集 数据来源:互联网公开数据 标签:伊朗法律,议会,立法活动,文本分析,自然语言处理,NLP,政策研究,数据分析 数据概述...
    packageimg
  • 患者医生问答土耳其语数据集

    2025年4月17日   

    患者医生问答土耳其语数据集 数据来源:互联网公开数据 标签:患者医生问答,土耳其语,医学研究,自然语言处理,NLP,医学教育,医疗沟通 数据概述:...
    packageimg
  • 泰卢固语新闻文本数据集-语言模型训练-合并数据集

    2025年4月17日   

    泰卢固语新闻文本数据集-语言模型训练-合并数据集 数据来源:互联网公开数据 标签:泰卢固语,新闻,文本,语言模型,自然语言处理,NLP,机器学习,语料库,文本数据 数据概述: 本数据集由原始泰卢固语新闻数据合并的训练集和测试集构成,整合了来自不同来源的泰卢固语新闻文章。数据集包含丰富的新闻文本内容,涵盖了各种主题和风格。 数据用途概述:...
    packageimg
  • 艾森民歌数据库MIDI转换与标记化数据集

    2025年4月17日   

    艾森民歌数据库MIDI转换与标记化数据集 数据来源:互联网公开数据 标签:音乐信息检索,民歌,MIDI,标记化,音乐分析,文本生成,NLP,艾森民歌数据库 数据概述: 本数据集包含约8500个.mid音乐文件,这些文件是源自艾森民歌数据库(Essen Folksong Database,KernScores...
    packageimg
  • Alpaca编程风格代码生成指令数据集

    2025年4月16日   

    Alpaca编程风格代码生成指令数据集 数据来源:互联网公开数据 标签:代码生成,编程风格,Alpaca,自然语言处理,机器学习,风格迁移,代码转换,NLP 数据概述:...
    packageimg
  • IMDbTop250电视剧用户评论与评分数据集-2024

    2025年4月16日   

    IMDbTop250电视剧用户评论与评分数据集-2024 数据来源:互联网公开数据 标签:IMDb, 电视剧, 评论, 评分, 用户评价, NLP, 自然语言处理, 情感分析, 文本挖掘 数据概述: 本数据集收录了截至2024年IMDb Top...
    packageimg
  • 斯瓦希里语新闻分类数据集

    2025年4月16日   

    斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
    packageimg
  • Twitter社交媒体情感分析数据集

    2025年4月16日   

    Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:...
    packageimg
  • 亚马逊服饰推荐系统数据集

    2025年4月16日   

    亚马逊服饰推荐系统数据集 数据来源:互联网公开数据 标签:服饰推荐,亚马逊,NLP,深度学习,图像识别,产品推荐,电子商务 数据概述: 本数据集包含了亚马逊平台上服饰产品的详细信息,包括产品描述、用户行为数据、历史推荐记录以及相关文本和图像数据。数据集旨在为研究和开发服饰推荐系统提供基础支持,帮助优化推荐算法,提升用户购物体验。 数据用途概述:...
    packageimg
  • IWSLT2017英语-中文翻译数据集

    2025年4月15日   

    IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging...
    packageimg
  • 基于GPT-2生成的灾难推文数据集

    2025年4月15日   

    基于GPT-2生成的灾难推文数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,灾难推文,数据增强,GPT-2,文本生成 数据概述:...
    packageimg
  • 网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用

    2025年4月15日   

    网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-...
    packageimg
  • 印度象棋策略书籍文本与游戏数据集1963-2021

    2025年4月15日   

    印度象棋策略书籍文本与游戏数据集1963-2021 数据来源:互联网公开数据 标签:国际象棋,策略书籍,NLP,文本分析,游戏分析,主题建模,文档聚类,文本生成 数据概述: 本数据集收录了国际象棋大师Edward...
    packageimg
  • 开放域问答数据集-问题与答案-2023年

    2025年4月15日   

    开放域问答数据集-问题与答案-2023年 数据来源:互联网公开数据 标签:问答,自然语言处理,NLP,文本数据,QA,问题解答,知识库,语言模型,机器学习 数据概述: 本数据集包含大量的问题与答案对,旨在为开放域问答(QA, Question...
    packageimg
  • 动漫数据集适用于NLP项目

    2025年4月15日   

    动漫数据集适用于NLP项目 数据来源:互联网公开数据 标签:动漫,推荐系统,NLP,文本分析,数据挖掘,自然语言处理,娱乐分析 数据概述: 本数据集主要用于构建著名的动漫推荐系统——Anime Odyssey。数据集涵盖了丰富的动漫信息,包括但不限于动漫名称、简介、类型、评分、评论等内容,为自然语言处理和文本分析提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • Kaggle文本数据竞赛优胜方案分析数据集-2021-2023

    2025年4月15日   

    Kaggle文本数据竞赛优胜方案分析数据集-2021-2023 数据来源:互联网公开数据 标签:Kaggle,文本数据,竞赛,机器学习,自然语言处理,NLP,解决方案,深度学习,模型,算法,优化器,集成,数据分析 数据概述: 本数据集收录了2021年至2023年间9个Kaggle文本数据竞赛中,每个竞赛前三名优胜方案的详细分析。...
    packageimg
  • 马鲁蒂铃木员工评价数据集1963-2021

    2025年4月15日   

    马鲁蒂铃木员工评价数据集1963-2021 数据来源:互联网公开数据 标签:马鲁蒂铃木,员工评价,工作环境,公司文化,职业发展,工作生活平衡,数据分析,情感分析,NLP,人力资源 数据概述: 本数据集汇集了马鲁蒂铃木(印度一家跨国汽车制造公司)员工在Ambition Box平台上分享的宝贵见解。Ambition...
    packageimg