-
仇恨言论检测模型性能评估数据集
仇恨言论检测模型性能评估数据集 数据来源:互联网公开数据 标签:仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试 数据概述: 本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。 数据集包含3728个经过验证的测试案例,涵盖了29种功能测试。... -
YouTube评论情感分析数据集
YouTube评论情感分析数据集 数据来源:互联网公开数据 标签:YouTube,评论,情感分析,自然语言处理,文本分类,情感标注,机器学习 数据概述:... -
斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集
斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO... -
推特讽刺分类数据集
推特讽刺分类数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据 数据概述: 本数据集包含了大量推特帖子,并被分类为讽刺性内容,并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源,可用于训练和测试模型。 数据用途概述:... -
英文新闻数据集
英文新闻数据集 数据来源:互联网公开数据 标签:英文新闻,文本分类,机器学习,自然语言处理,数据预处理 数据概述: 本数据集包含5个类别,共1491条英文新闻记录。数据集涵盖多种新闻类型,提供了丰富的文本数据资源,适用于文本分类和自然语言处理等任务。 数据用途概述:... -
-
文本分类器数据集
文本分类器数据集 数据来源:互联网公开数据 标签:文本分类,语音转录,动作识别,对象识别,位置识别,机器学习,自然语言处理,数据标注 数据概述: 本数据集包含了从音频文件中提取的文本转录内容,记录了描述某一动作或过程的文字信息。数据集旨在提供用于识别动作、对象和位置的文本特征,支持训练相应的机器学习算法。 数据用途概述:... -
斯瓦希里语自然语言处理数据集
斯瓦希里语自然语言处理数据集 数据来源:互联网公开数据 标签:斯瓦希里语,自然语言处理,网络内容检测,机器学习,深度学习,人工智能,文本分类,数据安全 数据概述:... -
希腊语COVID-19疫苗接种推文数据集
希腊语COVID-19疫苗接种推文数据集 数据来源:互联网公开数据 标签:希腊语,COVID-19,疫苗接种,社交媒体分析,自然语言处理,文本分类,公共卫生,数据标注 数据概述: 本数据集包含2021年7月至8月期间收集的希腊语推文,内容聚焦于COVID-19疫苗接种相关话题。数据集中的推文经过人工标注,为研究希腊语社交媒体内容提供了高质量的文本资源。... -
原神游戏用户评论情感分析数据集
原神游戏用户评论情感分析数据集 数据来源:互联网公开数据 标签:原神,游戏评论,情感分析,NLP,市场研究,用户反馈,文本分类,情绪检测 数据概述: 本数据集包含了从Google Play... -
写作者数据集
写作者数据集 数据来源:互联网公开数据 标签:写作者,自然语言处理,文本分类,审计,多语言训练 数据概述: 本数据集包含从1963年至2021年间关于写作者的文本记录,文本主要以俄语撰写。数据集涵盖了各种类型的文档,包括但不限于文章、报告等,为自然语言处理和文本分类提供了丰富的训练素材。 数据用途概述:... -
格鲁吉亚语情感分析数据集
格鲁吉亚语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,格鲁吉亚语,自然语言处理,文本分类,社会研究 数据概述: 本数据集包含标注了情感标签的格鲁吉亚语句子,涵盖正面、负面和中性三种情感类型。数据集为研究格鲁吉亚语的情感表达和文本分析提供了丰富的语料资源。 数据用途概述:... -
汽车广告标题数据集
汽车广告标题数据集 数据来源:互联网公开数据 标签:汽车广告,模型预测,文本分类,机器学习,NLP,数据预处理,广告分析 数据概述: 本数据集包含从伊朗主流在线市场Divar抓取的汽车广告标题,每个标题均标注了对应的汽车型号,为训练和评估汽车模型预测的机器学习模型提供了宝贵资源。数据集经过预处理,包括文本规范化和标点符号去除,确保数据的一致性和可用性。... -
古兰经文本数据集1963-2021
古兰经文本数据集1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,自然语言处理,情感分析,文本分类,主题建模,语言生成,宗教文本,文化研究 数据概述:... -
互联网公开简历数据集分析
标题:互联网公开简历数据集分析 数据内容: 该数据集包含2484条记录,每条记录包括以下字段: - ID:唯一标识符,共有2484种不同值。 - Resume_str:简历文本内容,共有2482种不同值。 - Resume_html:简历HTML格式内容,共有2482种不同值。 - Category:简历分类,共有24种不同值。 数据来源:... -
互联网公开文本数据集统计分析报告
标题:互联网公开文本数据集统计分析报告 数据内容: 该数据集包含两个主要字段: 1. full_text:包含1263种不同的文本内容,每条记录代表一个完整的文本段落或短文本。 2. labels:包含2种不同的标签值,可能是二分类标签,用于对文本进行分类。 数据来源: 互联网公开数据 数据用途: 该数据集可用于多个行业的文本分析任务,例如: -... -