找到371个数据集

标签: 英语

过滤结果
  • 阿拉伯语-英语句子库25000句

    2025年4月14日   

    阿拉伯语-英语句子库25000句 数据来源:互联网公开数据 标签:阿拉伯语,英语,双语句子,自然语言处理,机器学习,语句类型,多语言理解,教育培训 数据概述: 阿拉伯语-...
    packageimg
  • 不适当词汇分类数据集

    2025年4月14日   

    不适当词汇分类数据集 数据来源:互联网公开数据 标签:词汇分类,情感分析,不适当词汇,自然语言处理,英语,Singlish 数据概述: 本数据集包含被分类为正面或负面的词汇列表,所有收录的词汇已经过预处理。数据集中每个词汇附带有情感值,用以描述该词汇是否为不适当的。数据集中的词汇包括英语和Singlish两种语言,为研究和分析词汇情感提供了双语基础。...
    packageimg
  • 欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语

    2025年4月14日   

    欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-...
    packageimg
  • Wordle游戏词汇库-5字母单词数据集

    2025年4月14日   

    Wordle游戏词汇库-5字母单词数据集 数据来源:互联网公开数据 标签:Wordle, 单词, 词汇, 语言, 游戏, 英语, 词库 数据概述: 本数据集包含13,112个五字母单词,专为Wordle游戏爱好者及语言学习者打造。数据集收录了广泛的英语词汇,涵盖常用词汇及部分生僻词汇,旨在为用户提供丰富的词汇资源,满足不同的游戏挑战和语言学习需求。...
    packageimg
  • 数据2023年最受欢迎英语电影数据集

    2025年4月14日   

    数据2023年最受欢迎英语电影数据集 数据来源:互联网公开数据 标签:电影,英语,流行度,评分,推荐系统,数据分析,机器学习 数据概述: 本数据集收录了2023年10,000部最受欢迎的英语电影信息,涵盖电影名称、概要、上映日期、分类(流派)、流行度评分、平均评分和投票总数等关键要素。数据来源于TMDB(The Movie...
    packageimg
  • 印地语-英语混合数据集

    2025年4月14日   

    印地语-英语混合数据集 数据来源:互联网公开数据 标签:印地语,英语,混合语言,评论数据,网络欺凌,文本分类,社会媒体分析 数据概述: 本数据集包含超过9000条标注的印地语-英语混合语言(Hinglish)评论。每条评论都被标注为0或1,分别表示非欺凌评论和欺凌评论。数据集提供了丰富的多语言文本样本,适用于分析和研究网络环境中的欺凌行为。...
    packageimg
  • 皮尤研究中心美国趋势面板第106波数据集

    2025年4月14日   

    皮尤研究中心美国趋势面板第106波数据集 数据来源:互联网公开数据 标签:皮尤研究中心,美国趋势面板,公众调查,2022,网络调查,英语,西班牙语,社会趋势,公众意见 数据概述:...
    packageimg
  • IMDb高分动作电影票房及影评数据集-多语言电影

    2025年4月14日   

    IMDb高分动作电影票房及影评数据集-多语言电影 数据来源:互联网公开数据 标签:动作电影,IMDb,电影票房,影评,多语言,英语,泰米尔语,中文,法语,电影数据 数据概述:...
    packageimg
  • 英语月经健康与卫生聊天机器人数据集

    2025年4月14日   

    英语月经健康与卫生聊天机器人数据集 数据来源:互联网公开数据 标签:月经健康,卫生,聊天机器人,自然语言处理,对话系统,健康咨询,英语 数据概述: 本数据集由哈比大学团队Mai作为毕业设计项目的一部分整理而成,旨在通过构建一个基于变换器的英文聊天机器人来解决月经健康和卫生相关问题。数据集来源于多个渠道,包括Hello...
    packageimg
  • 英语单词频率数据集

    2025年4月14日   

    英语单词频率数据集 数据来源:互联网公开数据 标签:单词频率,英语,语料库分析,自然语言处理,文本挖掘,数据可视化,机器学习 数据概述: 本数据集基于Google...
    packageimg
  • 英语至阿萨姆语平行数据集

    2025年2月14日   

    此文件中有数十万个英语到阿萨姆语的平行数据集。 注意-清理数据集 1_.eng.txt - 有更多并行的英语数据集 1_assamese.xt - 有更多并行的阿萨姆语数据集
    packageimg