-
CICPDF恶意软件检测数据集2022
CICPDF恶意软件检测数据集2022 数据来源:互联网公开数据 标签:PDF恶意软件,网络安全,恶意软件检测,机器学习,数据集,特征提取,安全研究 数据概述:...
-
多领域文本蕴含语料库数据集
多领域文本蕴含语料库数据集 数据来源:互联网公开数据 标签:文本蕴含,自然语言处理,跨领域泛化,语言推理,机器学习,深度学习,NLP 数据概述:...
-
印度信贷训练数据集1963-2021
印度信贷训练数据集1963-2021 数据来源:互联网公开数据 标签:信贷,印度,贷款分析,机器学习,数据预处理,预测模型,信用评估 数据概述:...
-
山区命名实体识别数据集
山区命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,山区,自然地理,文本分析,机器学习,自然语言处理 数据概述: 本数据集用于命名实体识别(NER)任务,旨在识别文本中的山区名称。数据集中的每条记录对应一个由OpenAI的ChatGPT生成的推文或句子。数据集包含多种类型的推文/文本,其中包括专注于山区体验的内容,也可能涉及其他主题。...
-
印度尼西亚反论语料库数据集2023
印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro...
-
-
-
计算机科学与信息技术缩略语数据集
计算机科学与信息技术缩略语数据集 数据来源:互联网公开数据 标签:计算机科学,信息技术,缩略语,术语,学术,行业报告,技术讨论,教育,研究 数据概述:...
-
慈善捐赠者识别数据集1996
慈善捐赠者识别数据集1996 数据来源:互联网公开数据 标签:慈善捐赠,数据挖掘,机器学习,分类模型,特征选择,数据清理 数据概述: 本数据集源自UCI机器学习库,由Ron Kohavi和Barry...
-
田纳西州纳什维尔市房屋销售数据清洗数据集
田纳西州纳什维尔市房屋销售数据清洗数据集 数据来源:互联网公开数据 标签:房屋销售,纳什维尔,房地产,数据清洗,SQL,房价,时间序列,地理信息 数据概述:...
-
孟加拉语动词拆解数据集1963-2021
孟加拉语动词拆解数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,动词拆解,词性标注,语言学,自然语言处理 数据概述: 本数据集收录了孟加拉语中的所有根动词,并将其映射到相应的词性标注。数据集为孟加拉语的语言学研究提供了基础性的词汇和语法资源。 数据用途概述:...
-
PIA客户评论数据集
PIA客户评论数据集 数据来源:互联网公开数据 标签:PIA,客户评论,航空服务,模型构建,预测分析,特征工程,探索性数据分析 数据概述: 本数据集来源于airlinequality.com网站,包含巴基斯坦国际航空(PIA)的客户评论记录。数据集涵盖了乘客对PIA服务的反馈和评价,为分析航空服务质量提供了第一手资料。 数据用途概述:...
-
-
职位描述分类任务数据集
职位描述分类任务数据集 数据来源:互联网公开数据 标签:职位描述,分类任务,机器学习,自然语言处理,文本分析,人力资源管理 数据概述: 本数据集包含多个职位描述的文本样本,每个样本均标注有对应的分类标签。数据集内容涵盖各种行业和岗位的职位描述,旨在为构建职位描述分类任务提供高质量的训练数据。 数据用途概述:...
-
知识符号关联与大语言模型数据集
知识符号关联与大语言模型数据集 数据来源:互联网公开数据 标签:知识符号关联,大语言模型,LLM,机器学习,自然语言处理,提示生成,知识表示 数据概述:...
-
甘蔗生产数据集
甘蔗生产数据集 数据来源:互联网公开数据 标签:甘蔗,生产,卡纳塔克邦,农业,产量,地理分布,数据清理 数据概述: 本数据集包含了卡纳塔克邦30个地区的甘蔗生产数据,记录了各地区的甘蔗产量等信息。数据中存在空单元格,因此在使用前需要进行数据清洗处理。该数据集为研究卡纳塔克邦甘蔗生产提供了详细的数据支持。 数据用途概述:...
-
星巴克评论数据集
星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:...
-
俄罗斯敏感话题不适当言论数据集
俄罗斯敏感话题不适当言论数据集 数据来源:互联网公开数据 标签:敏感话题,不适当言论,网络言论,俄罗斯,自然语言处理,文本分析,社会学研究 数据概述: 本数据集专注于收集和分析涉及敏感话题的不适当言论,这些言论可能引起读者的不适或损害发言者的声誉。不适当性概念接近于毒性,但明确的毒性和明显的...
-
威斯康星州乳腺癌诊断预测数据集-EMP机器学习课程-
威斯康星州乳腺癌诊断预测数据集-EMP机器学习课程- 数据来源:互联网公开数据 标签:乳腺癌,诊断,机器学习,二分类,肿瘤,医疗,数据分析,预测,EMP课程 数据概述:...
-
生产编号序列间隙分析数据集
生产编号序列间隙分析数据集 数据来源:互联网公开数据 标签:编号序列,数据间隙,文档生产,数据质量,Gap Analysis,序列分析,数据处理 数据概述: 本数据集包含一个生产编号序列,用于间隙分析练习。数据以CSV格式存储,仅包含一列,列中包含一系列遵循“D0000001, D0000002, …....



