找到8个数据集

格式: csv 标签: 自然语言处理

过滤结果
  • Nazario Phishing Email Corpus

    2025年8月20日 35 123 91

    真实钓鱼邮件与正常企业邮件
    packageimg
  • Enron email corpus

    2025年8月20日 60 186 25

    15位Enron高管共0.5M封邮件
    packageimg
  • 新加坡火车站名称统计

    2025年2月20日 30 165 36

    标题:揭开新加坡火车站名称的神秘面纱 数据内容:数据集包含新加坡火车站的中文名称,对应多个捷运站及专线简体中文名称。列出了车站代码、各站的中文名称(包括台湾繁体和大陆简体)、所在的捷运专线及对应的线路名称。此数据集中的数据旨在详细统计并对比不同火车站在不同版本中文中的译名区别。 数据来源:互联网公开数据...
    packageimg
  • 哈利·波特魔法世界里的魔法咒语及其效果🪄

    2025年2月18日 30 203 190

    该数据集全面收集了来自《哈利·波特》世界的 77 种咒语,包括它们的名称和效果的详细描述。数据涵盖了各种各样的魔法咒语,从简单的咒语到强大的防御咒语和复杂的变形术。该数据集来自 HP-API,为粉丝、研究人员和数据爱好者提供了一种结构化的方式来探索和分析《哈利·波特》系列的魔法系统。 该数据集的主要特征包括: 77 个正典咒语全集...
    packageimg
  • DeepSeek 上的推文和反应:Twitter/X 上有关 DeepSeek 模型的推文和反应

    2025年2月17日 300 93 46

    该数据集包含有关 DeepSeek 及其发布的模型的推文和反应,以及其他密切相关的关键词,例如 NVIDIA、OPENAI、ANTHROPIC、META、LLAMA 等。
    packageimg
  • 包含“绿色氢”文章标题的数据集

    2025年2月14日 176 173 68

    该数据集包含从 CNBC 和 Google RSS 网站抓取的数据 - 其中包含“绿色氢”的文章标题。此外,还包含日期、文章所涉及的组织名称及其情感分数,可用于比较每篇文章。
    packageimg
  • 印度次大陆发生的自然灾害(1990 - 2021 年)

    2025年2月12日 195 181 125

    印度的地理环境极其多样,从北部的雪山到南部的沿海平原,还有茂密的雨林和塔尔沙漠。除此之外,印度还是世界第二大人口大国(13亿人)。这种多样性带来了许多不同的自然灾害,从洪水、地震到飓风和龙卷风。更糟糕的是,由于人口众多,各种疾病传播得非常快。 该数据集包含 1990 年至 2021 年印度发生的所有灾难及其信息。 内容...
    packageimg
  • 标准文件格式数据集media-types

    2024年12月17日 30 156 14

    该数据集包含了一系列MIME类型(Multipurpose Internet Mail Extensions)的详细信息。MIME类型广泛应用于描述互联网数据格式,帮助浏览器、操作系统以及应用程序正确识别和处理文件内容。本数据集列出了多种与音频和字体格式相关的MIME类型、文件扩展名及相关链接。
    packageimg