找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 用于音频字幕生成的2021发布版Clotho音频标注数据集

    2025年4月15日   

    用于音频字幕生成的2021发布版Clotho音频标注数据集 数据来源:互联网公开数据 数据概述: 由芬兰坦佩雷大学(Tampere University)开发并维护,音频内容来源于 Freesound 平台(https://freesound.org),相关数据与标注遵循 Freesound 授权协议和 Tampere University...
    packageimg
  • 王朝电视剧主题新闻文章情感分析数据集-1980年代至2010年代

    2025年4月15日   

    王朝电视剧主题新闻文章情感分析数据集-1980年代至2010年代 数据来源:互联网公开数据 标签:王朝,电视剧,新闻文章,情感分析,词云,娱乐,文化,媒体,时间序列 数据概述:...
    packageimg
  • 印度LGBTQ社区骄傲月情感检测引语数据集2023

    2025年4月15日   

    印度LGBTQ社区骄傲月情感检测引语数据集2023 数据来源:互联网公开数据 标签:LGBTQ,骄傲月,情感分析,引语,社会包容,OCR,NLP,机器学习 数据概述: 本数据集收录了在印度骄傲月期间上传的引语,旨在通过机器学习模型分析这些引语的情感倾向。数据集涵盖了多种引语内容,包括正面、负面和随机情感,为研究情感分析和自然语言处理提供了丰富的素材。...
    packageimg
  • 沙特阿拉伯电信公司客户服务推文情感分析数据集

    2025年4月15日   

    沙特阿拉伯电信公司客户服务推文情感分析数据集 数据来源:互联网公开数据 标签:推特,社交媒体,客户服务,情感分析,阿拉伯语,沙特阿拉伯,电信,文本数据 数据概述:...
    packageimg
  • 关于女王伊丽莎白的4chan评论数据集

    2025年4月15日   

    关于女王伊丽莎白的4chan评论数据集 数据来源:互联网公开数据 标签:女王伊丽莎白,4chan,用户评论,政治论坛,社会舆论,网络分析 数据概述: 本数据集包含从4chan网站/pol/板块抓取的约726条用户评论,这些评论涉及女王伊丽莎白。数据集提供了公众对于女王伊丽莎白的观点和看法,为研究网络舆论和社会公众对重要人物的态度提供了素材。...
    packageimg
  • 世界各国国歌文本聚类分析数据集

    2025年4月15日   

    世界各国国歌文本聚类分析数据集 数据来源:互联网公开数据 标签:国歌,文本分析,聚类,文化,语言,音乐 数据概述: 本数据集包含研究世界各地国歌所需的所有文件,主要数据集为national_anthems.csv,该数据集来源于“lucasturtle/national-anthems-of-the-...
    packageimg
  • 办公室情景剧名言数据集

    2025年4月15日   

    办公室情景剧名言数据集 数据来源:互联网公开数据 标签:情景剧,办公室,名言,角色对话,人物分析,文本分析,文化研究 数据概述:...
    packageimg
  • 薄伽梵歌逐句数据集

    2025年4月15日   

    薄伽梵歌逐句数据集 数据来源:互联网公开数据 标签:薄伽梵歌,印度教经典,逐句翻译,宗教文本,推荐系统,文化研究,文本分析 数据概述: 本数据集包含了《薄伽梵歌》的逐句翻译,数据来源于https://www.holy-bhagavad-gita.org/。该数据集提供了《薄伽梵歌》的每一句的原文及对应的翻译,为研究印度教经典和文化提供了文本基础。...
    packageimg
  • 矛盾的-我的朋友沃森数据集

    2025年4月15日   

    矛盾的-我的朋友沃森数据集 数据来源:互联网公开数据 标签:逻辑推理,矛盾分析,英语翻译,竞争数据,文本分析,问题解决 数据概述: 本数据集包含了“矛盾的,我的朋友沃森”竞赛的翻译成英文的数据,仅有少量数据(约20-30条)存在异常或错误。数据集内容主要涉及逻辑推理、矛盾识别和问题解决等方面,为相关研究提供了可靠的基础数据支持。 数据用途概述:...
    packageimg
  • 莎士比亚戏剧亨利四世剧本数据分析集

    2025年4月15日   

    莎士比亚戏剧亨利四世剧本数据分析集 数据来源:互联网公开数据 标签:莎士比亚,戏剧,角色台词,文本分析,文学研究,幕场结构,对话内容 数据概述:...
    packageimg
  • 理性主义思想家数据集

    2025年4月15日   

    理性主义思想家数据集 数据来源:互联网公开数据 标签:理性主义,思想家,哲学,自然语言处理,数据清理,词频分析,词云,推荐系统 数据概述:...
    packageimg
  • 用于代码生成模型的手工制作数据集

    2025年4月15日   

    用于代码生成模型的手工制作数据集 数据来源:互联网公开数据 标签:代码生成,编程挑战,单元测试,自然语言处理,机器学习,OpenAI,HumanEval 数据概述:...
    packageimg
  • COVID-19疫苗文章数据集

    2025年4月15日   

    COVID-19疫苗文章数据集 数据来源:互联网公开数据 标签:COVID-19,疫苗,新闻文章,公共卫生,医疗研究,科学传播,信息收集 数据概述: 本数据集包含从多个网站搜索“COVID-19...
    packageimg
  • 卡尔加里市情感与行动性推文关联数据集2022

    2025年4月15日   

    卡尔加里市情感与行动性推文关联数据集2022 数据来源:互联网公开数据 标签:情感分析,行动性推文,卡尔加里市,社会问题,数据挖掘,公众参与,政府效率 数据概述:...
    packageimg
  • G1新闻评论数据集2023

    2025年4月15日   

    G1新闻评论数据集2023 数据来源:互联网公开数据 标签:新闻评论,社交媒体,文本分析,情感分析,新闻聚合 数据概述:...
    packageimg
  • 反垃圾邮件分类检测邮件数据集

    2025年4月15日   

    反垃圾邮件分类检测邮件数据集 数据来源:互联网公开数据 标签:反垃圾邮件,邮件分类,机器学习,数据集,Spam,Ham,文本分类,自然语言处理 数据概述:...
    packageimg
  • 好读网图书描述与分类数据集

    2025年4月15日   

    好读网图书描述与分类数据集 数据来源:互联网公开数据 标签:图书,描述,分类,好读网,教育项目,文本分析,自然语言处理 数据概述:...
    packageimg
  • 全球电影评论情感分析数据集1963-2021

    2025年4月15日   

    全球电影评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,预测分析,推荐系统,观众反馈,市场预测 数据概述:...
    packageimg
  • 社交媒体灾害相关推文清洗数据集

    2025年4月15日   

    社交媒体灾害相关推文清洗数据集 数据来源:互联网公开数据 标签:社交媒体, 灾害, 自然语言处理, 文本清洗, 拼写纠正, 数据增强, 文本分析, 机器学习 数据概述: 本数据集基于“Natural Language Processing with Disaster...
    packageimg
  • 达尔文阿尔茨海默病书写分析预测数据集

    2025年4月15日   

    达尔文阿尔茨海默病书写分析预测数据集 数据来源:互联网公开数据 标签:阿尔茨海默病,机器学习,书写分析,预测模型,数据集 数据概述: 达尔文数据集旨在帮助研究人员改进现有的机器学习方法,通过分析手写样本预测阿尔茨海默病。数据集包含经过标注的手写样本,适用于开发和验证阿尔茨海默病预测模型。 数据用途概述:...
    packageimg