找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 写作质量挑战构造性文章数据集

    2025年4月14日   

    写作质量挑战构造性文章数据集 数据来源:互联网公开数据 标签:写作质量,过程建模,机器学习竞赛,自然语言处理,特征工程,教育评估 数据概述: 本数据集基于“将写作过程与写作质量联系起来”竞赛的训练日志构建,包含通过代码生成的构造性文章数据。构造性文章的生成基于两个版本的代码实现:Version 02 和 Version...
    packageimg
  • 疾病百科数据集

    2025年4月14日   

    疾病百科数据集 数据来源:互联网公开数据 标签:疾病,医学,诊断,治疗,西班牙语,自然语言处理,机器学习,训练数据,健康信息 数据概述: 本数据集包含了来自西班牙语维基百科(Wikipedia...
    packageimg
  • Upwork数据科学自由职业者列表数据集-2023

    2025年4月14日   

    Upwork数据科学自由职业者列表数据集-2023 数据来源:互联网公开数据 标签:数据科学,自由职业者,Upwork,市场趋势,技能分析,地理分析,经济分析,文本挖掘 数据概述:...
    packageimg
  • 阿拉伯语方言数据集

    2025年4月14日   

    阿拉伯语方言数据集 数据来源:互联网公开数据 标签:阿拉伯语方言,社交媒体文本,文本分类,语言分析,自然语言处理,区域语言差异 数据概述: 本数据集来源于Twitter平台,包含38,394条记录,主要分为四类阿拉伯语方言,分别为埃及方言、海湾方言、约旦方言和也门方言。各类别数据分布不均衡,为研究人员提供了多样化的数据资源。 数据用途概述:...
    packageimg
  • 苹果发布会演讲记录数据集

    2025年4月14日   

    苹果发布会演讲记录数据集 数据来源:互联网公开数据 标签:苹果公司,发布会,演讲记录,自然语言处理,内容分析,文本挖掘,行业趋势 数据概述:...
    packageimg
  • 拼图目标检测数据集

    2025年4月14日   

    拼图目标检测数据集 数据来源:互联网公开数据 标签:拼图,目标检测,图像识别,计算机视觉,娱乐游戏,逻辑解题,玩具,教育 数据概述:...
    packageimg
  • 新冠疫情相似句对判定数据集

    2025年4月14日   

    新冠疫情相似句对判定数据集 数据来源:互联网公开数据 标签:新冠疫情,相似句对,文本分析,自然语言处理,疫情信息,语义分析 数据概述:...
    packageimg
  • 宝莱坞印地语歌曲数据集

    2025年4月14日   

    宝莱坞印地语歌曲数据集 数据来源:互联网公开数据 标签:宝莱坞,印地语歌曲,音乐推荐,情感分析,歌词翻译,个性化推荐,音乐分析 数据概述: 本数据集收录了大量宝莱坞印地语歌曲的相关信息,包括歌曲标题、 Hindi 歌词、 English...
    packageimg
  • 大型语言模型训练问答数据集1963-2021

    2025年4月14日   

    大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:...
    packageimg
  • 自然语言处理研究论文数据集

    2025年4月14日   

    自然语言处理研究论文数据集 数据来源:互联网公开数据 标签:自然语言处理,研究论文,文本摘要,文档分类,结构分析,文本总结,学术研究 数据概述:...
    packageimg
  • 语言分类数据集

    2025年4月14日   

    语言分类数据集 数据来源:互联网公开数据 标签:语言分类,多语言数据集,机器学习,深度学习,自然语言处理,句法分析 数据概述:...
    packageimg
  • 技能与职位描述语料库数据集

    2025年4月14日   

    技能与职位描述语料库数据集 数据来源:互联网公开数据 标签:技能,职位描述,自然语言处理,技能提取,机器学习,语料库,技能分析 数据概述: 本数据集基于大量职位描述数据构建,经过多轮数据清洗、格式标准化和预处理,最终形成了一套结构化、高质量的技能语料库。数据集包含了与技能相关的文本信息,适用于技能提取、技能分类、技能推荐等场景。 数据用途概述:...
    packageimg
  • LLM科学考试竞赛数据集-SciQ数据集

    2025年4月14日   

    LLM科学考试竞赛数据集-SciQ数据集 数据来源:互联网公开数据 标签:科学,考试,LLM,自然语言处理,人工智能,竞赛,问答,教育,机器学习 数据概述: 本数据集是Allen...
    packageimg
  • 推特情绪强度分析数据集1963-2021

    2025年4月14日   

    推特情绪强度分析数据集1963-2021 数据来源:互联网公开数据 标签:情绪分析,推特,情感强度,情绪分类,自然语言处理,文本分析,社交媒体分析 数据概述:...
    packageimg
  • 印度孟加拉语文本怀旧情感检测数据集1963-2021

    2025年4月14日   

    印度孟加拉语文本怀旧情感检测数据集1963-2021 数据来源:互联网公开数据 标签:怀旧检测,孟加拉语,YouTube评论,情感分析,文化研究,机器学习,深度学习 数据概述: 本数据集包含10,089条手动标注为怀旧或非怀旧的孟加拉语YouTube评论。这些评论是通过关键词如“Old Bangla...
    packageimg
  • 推特社交媒体数据分析与展示数据集

    2025年4月14日   

    推特社交媒体数据分析与展示数据集 数据来源:互联网公开数据 标签:推特,社交媒体,数据分析,主题趋势,用户关系,标签,Python,推文 数据概述: 本数据集旨在展示如何便捷地从Twitter获取数据并进行分析。它包含了多种类型的推特数据,主要用于演示数据获取功能和数据探索。 数据内容包括: 西班牙当日热门话题:超过500个热门标签/主题。...
    packageimg
  • 印度法律与法案数据集1074-至今

    2025年4月14日   

    印度法律与法案数据集1074-至今 数据来源:互联网公开数据 标签:印度法律,法案,历史,法律研究,文本分析,语言模型,政策分析 数据概述:...
    packageimg
  • Steam平台FIFA23游戏用户评价数据集

    2025年4月14日   

    Steam平台FIFA23游戏用户评价数据集 数据来源:互联网公开数据 标签:FIFA 23, Steam, 游戏评价, 用户反馈, 游戏数据, 电子游戏, EA, 体育游戏 数据概述: 本数据集包含了Steam平台上FIFA...
    packageimg
  • 巴西利亚Outback牛排餐厅用户点评数据集-Tripadvisor平台-2024

    2025年4月14日   

    巴西利亚Outback牛排餐厅用户点评数据集-Tripadvisor平台-2024 数据来源:互联网公开数据 标签:餐饮,点评,巴西,Outback,用户评论,情感分析,餐厅评价,旅游 数据概述:...
    packageimg
  • 美国酒店评论数据分析数据集2023

    2025年4月14日   

    美国酒店评论数据分析数据集2023 数据来源:互联网公开数据 标签:酒店,评论,数据分析,美国,州级比较,情感分析,自然语言处理 数据概述:...
    packageimg