找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 多语言灾害响应消息数据集

    2025年4月14日   

    多语言灾害响应消息数据集 数据来源:互联网公开数据 标签:灾害响应,多语言,消息分类,自然语言处理,文本分析,紧急救援,机器学习 数据概述:...
    packageimg
  • 伊斯兰教儿童查询监督聊天机器人数据集

    2025年4月14日   

    伊斯兰教儿童查询监督聊天机器人数据集 数据来源:互联网公开数据 标签:伊斯兰教,儿童,查询,聊天机器人,监督学习,意图识别,基础知识 数据概述:...
    packageimg
  • 数据2023年最受欢迎英语电影数据集

    2025年4月14日   

    数据2023年最受欢迎英语电影数据集 数据来源:互联网公开数据 标签:电影,英语,流行度,评分,推荐系统,数据分析,机器学习 数据概述: 本数据集收录了2023年10,000部最受欢迎的英语电影信息,涵盖电影名称、概要、上映日期、分类(流派)、流行度评分、平均评分和投票总数等关键要素。数据来源于TMDB(The Movie...
    packageimg
  • ELLIPSE英语学习者语料库

    2025年4月14日   

    ELLIPSE英语学习者语料库 数据来源:互联网公开数据 标签:英语学习者,语言能力评价,语料库,NLP,语言研究,教育评估,写作分析 数据概述:...
    packageimg
  • 天文学家电报数据集

    2025年4月14日   

    天文学家电报数据集 数据来源:互联网公开数据 标签:天文学,天文观测,快速信息传播,天文学家电报,时间序列,科学研究,天体物理学 数据概述:...
    packageimg
  • 英国HR岗位数据集

    2025年4月14日   

    英国HR岗位数据集 数据来源:互联网公开数据 标签:HR岗位,英国,招聘数据,数据清洗,自然语言处理,命名实体识别,技能提取 数据概述:...
    packageimg
  • 老友记电视剧角色对话与剧情数据集1994-2004

    2025年4月14日   

    老友记电视剧角色对话与剧情数据集1994-2004 数据来源:互联网公开数据 标签:电视剧,老友记,角色对话,剧情分析,观众互动,数据分析 数据概述:...
    packageimg
  • 乌兹别克斯坦宪法NLP数据集

    2025年4月14日   

    乌兹别克斯坦宪法NLP数据集 数据来源:互联网公开数据 标签:乌兹别克斯坦宪法,自然语言处理,NLP,乌兹别克语,自动纠正,拼写检查,语言模型 数据概述: 本数据集来源于我的YouTube频道的直播内容,旨在为乌兹别克语(O'zbek语)创建一个自动纠正(拼写检查)的概率模型。数据集包含了乌兹别克斯坦宪法的文本,为训练语言模型提供了基础。...
    packageimg
  • EasyBakery门店顾客评价数据集-GoogleMaps-多时段

    2025年4月14日   

    EasyBakery门店顾客评价数据集-GoogleMaps-多时段 数据来源:互联网公开数据 标签:餐饮,评价,消费者行为,地理位置,Google Maps,口碑分析,文本挖掘,用户评论,Easy Bakery 数据概述: 本数据集包含了超过5000条来自Easy...
    packageimg
  • 数据2024孟加拉国大选政治新闻数据集

    2025年4月14日   

    数据2024孟加拉国大选政治新闻数据集 数据来源:互联网公开数据 标签:孟加拉国大选,政治新闻,公共意见,选举预测,政治趋势,媒体分析,学术研究 数据概述: 本数据集收录了2024年孟加拉国大选相关的全面政治新闻,数据来源于《普罗通阿洛》(Prothom...
    packageimg
  • 斯里兰卡Singlish与僧伽罗语对话数据集

    2025年4月14日   

    斯里兰卡Singlish与僧伽罗语对话数据集 数据来源:互联网公开数据 标签:Singlish,僧伽罗语,对话数据集,NLP,聊天机器人,机器翻译,语言学习,社会媒体分析,语言研究 数据概述:...
    packageimg
  • RAG与Few-Shot相似问题提示数据集

    2025年4月14日   

    RAG与Few-Shot相似问题提示数据集 数据来源:互联网公开数据 标签:相似问题,嵌入向量,提示生成,RAG,Few Shot学习,自然语言处理,NLP 数据概述:...
    packageimg
  • 英语单词家族数据集1963-2021

    2025年4月14日   

    英语单词家族数据集1963-2021 数据来源:互联网公开数据 标签:英语单词,词典,自然语言处理,NLP,词汇学,教育培训 数据概述: 本数据集收录了按字母顺序排列的全部英语单词,涵盖了从A到Z的所有单词条目。数据集适用于自然语言处理项目的参考和验证,为词典编纂、词汇学研究和教育培训提供了全面的单词资源。 数据用途概述:...
    packageimg
  • 埃及航空客户评价数据集

    2025年4月14日   

    埃及航空客户评价数据集 数据来源:互联网公开数据 标签:埃及航空,客户评价,Trustpilot,航空服务,消费者反馈,旅行体验,服务质量 数据概述:...
    packageimg
  • 维基百科主页面内容数据集

    2025年4月14日   

    维基百科主页面内容数据集 数据来源:互联网公开数据 标签:维基百科,主页面,内容分析,时间序列,网络爬虫,数据分析 数据概述:...
    packageimg
  • 分钟悬疑侦探图数据集

    2025年4月14日   

    分钟悬疑侦探图数据集 数据来源:互联网公开数据 标签:文本谜题,推理,悬疑,文学,人工智能,语言模型,游戏开发 数据概述: 分钟悬疑侦探图(Minute...
    packageimg
  • 烂番茄电影评论情感分析数据集

    2025年4月14日   

    烂番茄电影评论情感分析数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,自然语言处理,情感极性,烂番茄,评论数据 数据概述: 本数据集是一个情感分类数据集,包含了来自烂番茄电影评论的5331条正面评价和5331条负面评价,共计10662条评论。这些评论都经过了预处理,平均每条评论包含21个单词。该数据集常被用作文本分类任务的基准。...
    packageimg
  • 科学考试LLM重译训练数据集

    2025年4月14日   

    科学考试LLM重译训练数据集 数据来源:互联网公开数据 标签:科学考试,LLM,数据增强,重译,日语翻译,数据集 数据概述:...
    packageimg
  • 社交媒体Twitter的反讽大师Dril用户推文数据集

    2025年4月14日   

    社交媒体Twitter的反讽大师Dril用户推文数据集 数据来源:互联网公开数据 标签:社交媒体, Twitter, 推文数据, 文本分析, 用户行为, 网络文化, 幽默, Dril 数据概述:...
    packageimg
  • 巴西电商平台商品评价数据分析数据集-亚马逊与MercadoLivre-葡萄牙语-用户评价

    2025年4月14日   

    巴西电商平台商品评价数据分析数据集-亚马逊与MercadoLivre-葡萄牙语-用户评价 数据来源:互联网公开数据 标签:电商,用户评价,商品评论,亚马逊,Mercado Livre,葡萄牙语,情感分析,自然语言处理,数据挖掘 数据概述: 本数据集包含了从巴西电商平台亚马逊(Amazon)和Mercado...
    packageimg