-
预处理TREC2007公共语料库数据集
预处理TREC2007公共语料库数据集 数据来源:互联网公开数据 标签:垃圾邮件检测,TREC,邮件分类,机器学习,文本分析,数据预处理,spam detection 数据概述: 本数据集是基于TREC...
-
开源项目Jira问题报告数据集-问题追踪与分析-v1
开源项目Jira问题报告数据集-问题追踪与分析-v1 数据来源:互联网公开数据 标签:Jira,问题报告,开源项目,软件开发,缺陷管理,项目管理,数据分析,情感分析 数据概述:...
-
-
提示重写三元组数据集
提示重写三元组数据集 数据来源:互联网公开数据 标签:提示重写, LLM训练, 自然语言处理, 数据清洗, 字段映射, 机器学习, 人工智能 数据概述: 本数据集为用于大型语言模型(LLM)提示恢复竞赛的三元组数据集。原始数据集包含四个字段:prompt、original_text、input 和...
-
顶级活跃足球运动员数据集
顶级活跃足球运动员数据集 数据来源:互联网公开数据 标签:足球运动员,活跃球员,体育数据,足球统计,国籍分布,身高数据,脚部偏好,竞技状态 数据概述...
-
新闻真伪识别数据集-涵盖多种来源与真实新闻对比
新闻真伪识别数据集-涵盖多种来源与真实新闻对比 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,真实新闻,文本分类,机器学习,自然语言处理,舆情分析 数据概述: 本数据集整合了来自不同来源的新闻文章,经过清洗和特征工程处理,用于新闻真伪识别研究。数据集包含新闻文本及其对应的标签,标签分为两类:0代表假新闻,1代表真实新闻。 数据用途概述:...
-
-
深度伪造视频人脸图像检测数据集-深度伪造检测训练集Part32
深度伪造视频人脸图像检测数据集-深度伪造检测训练集Part32 数据来源:互联网公开数据 标签:深度伪造,人脸图像,视频分析,图像识别,机器学习,计算机视觉,Deepfake,人脸检测 数据概述: 本数据集包含了从Deepfake Detection训练数据集的Part...
-
Fitbit用户健康数据分析数据集-2016年12月
Fitbit用户健康数据分析数据集-2016年12月 数据来源:互联网公开数据 标签:Fitbit,健康数据,活动追踪,睡眠监测,心率,用户行为,健身,数据分析 数据概述: 本数据集由参与者通过亚马逊Mechanical...
-
基于CoSQL的跨领域对话式文本转SQL数据集
基于CoSQL的跨领域对话式文本转SQL数据集 数据来源:互联网公开数据 标签:自然语言处理,文本转SQL,对话系统,数据库查询,语义解析,对话状态跟踪,对话生成,对话行为预测 数据概述: CoSQL(Conversational text-to-...
-
-
对话与文学风格文本数据集
对话与文学风格文本数据集 数据来源:互联网公开数据 标签:对话风格,文学风格,文本风格转换,俄语数据,自然语言处理,机器学习,语言模型 数据概述:...
-
Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集
Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集 数据来源:互联网公开数据 标签:邮件,Enron,垃圾邮件,非垃圾邮件,文本分类,自然语言处理,数据清洗,邮件分析 数据概述:...
-
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。...
-
AI4Privacy个人身份信息PII掩蔽数据集-200K样本
AI4Privacy个人身份信息PII掩蔽数据集-200K样本 数据来源:互联网公开数据 标签:AI4Privacy, PII, 个人身份信息, 数据掩蔽, 隐私保护, 自然语言处理, 人工智能, 合成数据, 多语言, Hugging Face 数据概述: 本数据集由 AI4Privacy 开发,是隐私保护与人工智能领域的一项开创性工作。该数据集托管于...
-
巴西电商交易订单商品数据清洗与分析数据集-2016-2018
巴西电商交易订单商品数据清洗与分析数据集-2016-2018 数据来源:互联网公开数据 标签:电商,巴西,订单,商品,销售,用户行为,市场分析,数据清洗 数据概述:...
-
医疗健康患者综合信息模拟数据集
医疗健康患者综合信息模拟数据集 数据来源:互联网公开数据 标签:医疗健康,患者,数据分析,机器学习,合成数据,医疗记录,健康数据,数据科学,Python,Faker 数据概述:...
-
IMDB情感分析数据集1995-2017
IMDB情感分析数据集1995-2017 数据来源:互联网公开数据 标签:IMDB,情感分析,电影评论,词嵌入,情感分类,正向,负向 数据概述: 本数据集包含50,000条电影评论,来源于IMDB,用于情感分类任务。数据集中的每条评论被标记为正向或负向情感。评论涵盖了从1995年至2017年的电影评价,为研究情感分析提供了丰富的样本数据。...
-
Pandas1-xCookbook数据集
Pandas1-xCookbook数据集 数据来源:互联网公开数据 标签:Pandas, 数据分析, Python, 数据集, 教程, 学习, 数据处理, 案例 数据概述: 本数据集是《Pandas 1.x Cookbook》(Harrison & Petrou)一书中使用的数据集,用于书中的各种数据分析案例。...
-
疾病提取黑客马拉松数据集
疾病提取黑客马拉松数据集 数据来源:互联网公开数据 标签:疾病提取,自然语言处理,临床文本,医疗实体识别,机器学习,健康数据分析,医疗信息抽取 数据概述:...



