找到2,702个数据集

标签: 数据标注

过滤结果
  • 重力探测器数据集

    2025年4月15日   

    重力探测器数据集 数据来源:互联网公开数据 标签:重力波,天体物理,机器学习,分类,数据标注,科研,公众科学 数据概述:...
    packageimg
  • 土耳其新闻标题点击诱饵分类数据集

    2025年4月15日   

    土耳其新闻标题点击诱饵分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 数据分类, 文本分析, 媒体研究, 数据标注, 文本分类 数据概述:...
    packageimg
  • 点击诱饵新闻标题分类数据集

    2025年4月14日   

    点击诱饵新闻标题分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 文本分类, 机器学习, 数据标注, 社交媒体, 新闻分析 数据概述: 本数据集包含新闻标题的分类数据,主要分为“点击诱饵”(clickbait)和“非点击诱饵”(non-...
    packageimg
  • 随机日期数据集

    2025年4月14日   

    随机日期数据集 数据来源:互联网公开数据 标签:日期识别,机器学习,自然语言处理,数据标注,文本分析,日期标注,日期提取 数据概述: 本数据集包含由Python脚本生成的随机日期数据,旨在用于机器学习模型训练,以识别文档中的日期。数据集标注了每个词或词组是否为日期,为日期标注任务提供了基础。 数据用途概述:...
    packageimg
  • 金融欺诈与非欺诈相关的新闻分类数据集

    2025年4月14日   

    金融欺诈与非欺诈相关的新闻分类数据集 数据来源:互联网公开数据 标签:金融欺诈,非欺诈,新闻分类,自然语言处理,金融科技,数据标注 数据概述 本数据集旨在帮助用户对新闻文章进行分类,区分金融欺诈相关和非欺诈相关的内容。由于现有公开数据集中缺乏满足该需求的资源,本数据集由研究团队从头构建,旨在为类似研究提供支持。 数据集包含以下两个CSV文件: 1....
    packageimg
  • 体育对象检测数据集

    2025年4月14日   

    体育对象检测数据集 数据来源:互联网公开数据 标签:体育,目标检测,图像识别,计算机视觉,机器学习,数据标注,Open Images 数据概述: 本数据集是Open Images...
    packageimg
  • NBME临床患者笔记修正数据集

    2025年4月14日   

    NBME临床患者笔记修正数据集 数据来源:互联网公开数据 标签:临床笔记,患者记录,修正,注释,医学,数据标注,校正 数据概述: 本数据集是基于Kaggle竞赛数据集(https://www.kaggle.com/competitions/nbme-score-clinical-patient-...
    packageimg
  • 命名实体识别文本信息标注数据集

    2025年4月14日   

    命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:...
    packageimg
  • TikTok视频字幕与误导信息分类数据集

    2025年4月14日   

    TikTok视频字幕与误导信息分类数据集 数据来源:互联网公开数据 标签:短视频, 社交媒体, 误导信息, 内容审核, 自然语言处理, 数据标注, 机器学习, 用户互动 数据概述 本数据集包含了来自 TikTok...
    packageimg
  • DNS隧道查询分类数据集

    2025年4月14日   

    DNS隧道查询分类数据集 数据来源:互联网公开数据 标签:DNS隧道,域名分类,网络安全,二分类问题,数据标注 数据概述: 本数据集包含标注的域名,分为两类:常规域名(标记为“0”)和使用隧道的域名(标记为“1”)。数据集旨在用于二分类任务,帮助识别和分类潜在的DNS隧道活动。 数据用途概述:...
    packageimg
  • 数据99K数据集带上下文版本2

    2025年4月14日   

    数据99K数据集带上下文版本2 数据来源:互联网公开数据 标签:文本数据,上下文,自然语言处理,机器学习,数据标注 数据概述: 本数据集包含99,000条带上下文的文本数据,旨在为自然语言处理和机器学习任务提供丰富的训练素材。数据集中的每一条记录都包含一个句子及其上下文信息,有助于模型更好地理解和生成连贯的文本。 数据用途概述:...
    packageimg
  • 社交媒体仇恨言论识别数据集-文本内容-2017

    2025年4月14日   

    社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)...
    packageimg
  • SCP幽默文章数据集

    2025年4月14日   

    SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke...
    packageimg
  • 多标签分类新闻类别数据集

    2025年4月14日   

    多标签分类新闻类别数据集 数据来源:互联网公开数据 标签:多标签分类,新闻类别,文本分析,机器学习,自然语言处理,信息提取,数据标注 数据概述:...
    packageimg
  • 道路标志数据集

    2025年4月14日   

    道路标志数据集 数据来源:互联网公开数据 标签:道路标志,图像识别,交通管理,计算机视觉,数据标注,道路安全,自动驾驶 数据概述:...
    packageimg
  • 速度减速带和坑洞数据集

    2025年4月14日   

    速度减速带和坑洞数据集 数据来源:互联网公开数据 标签:速度减速带,坑洞,图像识别,道路安全,交通监控,计算机视觉,数据标注 数据概述: 本数据集包含从现实生活中收集的标记图像,涵盖了各种条件下的速度减速带和坑洞。这些图像为计算机视觉和道路安全研究提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • 社交媒体用户性别分类分析数据集

    2025年4月14日   

    社交媒体用户性别分类分析数据集 数据来源:互联网公开数据 标签:性别分类,社交媒体分析,用户画像,机器学习,预测模型,数据标注 数据概述: 本数据集用于训练 CrowdFlower AI 性别预测器,包含 20,000...
    packageimg
  • 有毒评论分类数据集

    2025年4月14日   

    有毒评论分类数据集 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,情感分析,文本分类,机器学习,数据标注,内容安全 数据概述:...
    packageimg
  • 科学事实研究与验证数据集

    2025年4月14日   

    科学事实研究与验证数据集 数据来源:互联网公开数据 标签:科学事实,科学声明,证据摘要,研究验证,数据标注,事实核查,科学教育 数据概述:...
    packageimg
  • Coleridge竞赛数据集标签挖掘与整理数据集

    2025年4月14日   

    Coleridge竞赛数据集标签挖掘与整理数据集 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本挖掘,机器学习,命名实体识别,Coleridge竞赛,标签提取,数据标注 数据概述:...
    packageimg