找到16,243个数据集

标签: 自然语言处理

过滤结果
  • WordNet词汇下位词关系数据集

    2025年4月14日   

    WordNet词汇下位词关系数据集 数据来源:互联网公开数据 标签:WordNet,词汇语义,下位词,语言学,词典,自然语言处理,知识图谱 数据概述: 本数据集包含了从WordNet...
    packageimg
  • 美国诗歌基金会情绪标注诗歌数据集1963-2021

    2025年4月14日   

    美国诗歌基金会情绪标注诗歌数据集1963-2021 数据来源:互联网公开数据 标签:诗歌,情绪标注,BERT模型,文学研究,情感分析,心理学,教育 数据概述:...
    packageimg
  • 福尔摩斯探案集情感分析数据集19世纪末-20世纪初

    2025年4月14日   

    福尔摩斯探案集情感分析数据集19世纪末-20世纪初 数据来源:互联网公开数据 标签:福尔摩斯探案集,情感分析,文学分析,数据可视化,自然语言处理,读者分析,主题建模 数据概述:...
    packageimg
  • Python代码问答数据集

    2025年4月14日   

    Python代码问答数据集 数据来源:互联网公开数据 标签:Python,代码问答,机器学习,编程教育,自然语言处理,LLM训练 数据概述:...
    packageimg
  • 印度尼西亚语食谱文本数据集2023

    2025年4月14日   

    印度尼西亚语食谱文本数据集2023 数据来源:互联网公开数据 标签:食谱,文本数据,自然语言处理,推荐系统,印尼语,机器学习,数据挖掘 数据概述:...
    packageimg
  • PubMed皮肤病学研究摘要数据集

    2025年4月14日   

    PubMed皮肤病学研究摘要数据集 数据来源:互联网公开数据 标签:皮肤病学,医学,PubMed,摘要,研究,疾病,文献,数据集 数据概述:...
    packageimg
  • 乌尔都语和英语文本摘要数据集

    2025年4月14日   

    乌尔都语和英语文本摘要数据集 数据来源:互联网公开数据 标签:自然语言处理,摘要生成,乌尔都语,英语,多语言任务,机器学习 数据概述: 本数据集名为“AllDataV1”,专为自然语言处理(NLP)任务设计,特别适用于乌尔都语和英语的抽象摘要任务。数据集包含4,386条记录,共有5个字段,结构清晰,具体内容如下: 1. Unnamed:...
    packageimg
  • 世界英语圣经公会议版数据集

    2025年4月14日   

    世界英语圣经公会议版数据集 数据来源:互联网公开数据 标签:世界英语圣经,公会议版,圣经,宗教,文本数据,NLP,情感分析,宗教研究 数据概述:...
    packageimg
  • 主观问答数据集

    2025年4月14日   

    主观问答数据集 数据来源:互联网公开数据 标签:主观问答,自然语言处理,文本分析,机器学习,教育,培训,数据分析 数据概述: 该数据集包含4118段段落,每段段落配有3个问题和3个答案,形成相关的问答对。数据集以逗号分隔值文件(.csv)的形式存储。这些数据经过手动收集、清理和过滤,旨在为从提供的输入段落中生成抽取式主观问答提供高质量的数据支持。...
    packageimg
  • 土耳其众筹创业项目数据集2022

    2025年4月14日   

    土耳其众筹创业项目数据集2022 数据来源:互联网公开数据 标签:众筹,土耳其,创业项目,资金筹集,项目描述,成功因素,自然语言处理,机器学习 数据概述:...
    packageimg
  • 宝可梦物理描述数据集

    2025年4月14日   

    宝可梦物理描述数据集 数据来源:互联网公开数据 标签:宝可梦,物理描述,图像描述,游戏数据,娱乐,教育,游戏文化 数据概述: 本数据集收录了宝可梦游戏中的各宝可梦名称及其物理描述。描述内容源自宝可梦百科网站(https://bulbapedia.bulbagarden.net),适用于为宝可梦图像提供替代文本,帮助视力障碍用户或需要文字描述的场景。...
    packageimg
  • 穆克洛克FOIA数据集

    2025年4月14日   

    穆克洛克FOIA数据集 数据来源:互联网公开数据 标签:穆克洛克,FOIA,政府信息,公共记录,时间序列,数据分析,自然语言处理,机器学习 数据概述:...
    packageimg
  • 苹果VisionProReddit讨论数据集

    2025年4月14日   

    苹果VisionProReddit讨论数据集 数据来源:互联网公开数据 标签:苹果Vision Pro,Reddit,用户评论,评分,社交媒体分析,产品反馈,用户情绪 数据概述: 本数据集包含用户在特定平台或论坛上关于苹果Vision...
    packageimg
  • 谷歌应用商店App评论与下载量分析数据集-2012-2023

    2025年4月14日   

    谷歌应用商店App评论与下载量分析数据集-2012-2023 数据来源:互联网公开数据 标签:应用商店,App评论,下载量,用户行为分析,情感分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集包含了2012年至2023年期间,Google...
    packageimg
  • 跨语言文本蕴含关系分类数据集

    2025年4月14日   

    跨语言文本蕴含关系分类数据集 数据来源:互联网公开数据 标签:自然语言处理,跨语言分析,文本蕴含,机器学习,句子分类,逻辑推理,多语言支持 数据概述:...
    packageimg
  • 梵名数据集

    2025年4月14日   

    梵名数据集 数据来源:互联网公开数据 标签:梵名,名字,意义,印度文化,宗教,学习资源,语言学 数据概述: 本数据集收录了来自不同梵文经典和文献中的神祇名字及其在梵文中的含义,并翻译成英文以便更好地理解。数据集旨在为研究印度文化和宗教、学习梵文及其意义提供资源。未来将不断增加新的名字和解释。 数据用途概述:...
    packageimg
  • Reddit多任务NLP数据集

    2025年4月14日   

    Reddit多任务NLP数据集 数据来源:互联网公开数据 标签:Reddit,自杀检测,情感分析,多任务学习,自然语言处理 数据概述:...
    packageimg
  • 荷马奥德赛双语数据集

    2025年4月14日   

    荷马奥德赛双语数据集 数据来源:互联网公开数据 标签:荷马,奥德赛,双语文本,文学研究,翻译分析,语言学,比较文学 数据概述: 本数据集包含荷马史诗《奥德赛》的双语文本,包括希腊原文和英文翻译。数据集由三个表格组成,每个表格提供了分析和研究文本所需的必要信息。 希腊文本表: 包含荷马《奥德赛》的原始希腊文本。 分为三列:卷号、行号和希腊文本。...
    packageimg
  • 阿拉伯语-英语句子库25000句

    2025年4月14日   

    阿拉伯语-英语句子库25000句 数据来源:互联网公开数据 标签:阿拉伯语,英语,双语句子,自然语言处理,机器学习,语句类型,多语言理解,教育培训 数据概述: 阿拉伯语-...
    packageimg
  • 密码子使用数据集

    2025年4月14日   

    密码子使用数据集 数据来源:互联网公开数据 标签:密码子使用,基因组,生物多样性,生物信息学,分类学,编码DNA,微生物学 数据概述:...
    packageimg