-
AED_TEI_Based_埃及长文本词汇排名位置值数据
2026年1月30日 30 91 9
数据集概述 本数据集包含埃及文本中词汇的排名位置值,仅覆盖超过100个词汇的文本。排名位置值通过词汇频率衡量其在文本内的相关性,为埃及学文本分析提供结构化词汇重要性参考。数据集含2个文件,以AED-TEI数据为基础。 文件详解 文件名称:readme.txt 文件格式:TXT...
-
SPECS_Based_语音风格关键词采集与背景噪声数据集
2026年1月29日 30 147 0
数据集概述 本数据集包含命令风格语音关键词(ck)、扩展命令风格语音关键词(eck)、对话风格语音(cs)三个子集及背景噪声文件夹,用于关键词识别和语音风格分析研究。所有语音为用户在安静环境下录制的16kHz 32位PCM WAV文件,背景噪声源自Google语音命令集。 文件详解 主文件 文件名称:SPECS.zip 文件格式:ZIP...
-
NCOMMS_25_07426_Based_文档数据_无时间
2026年1月29日 30 170 76
数据集概述 本数据集包含一个与NCOMMS-25-07426相关的Word文档,无额外描述信息。数据集结构简单,仅含单个文档文件,未检测到命名模式、训练测试/数据标签/原始处理等数据划分。 文件详解 文件名称:Word 文档.docx 文件格式:.docx 字段映射介绍:未提供文件内容预览,无法获取具体字段信息,仅可确认文件类型为Word文档。...
-
KORA_SEDANA_TARKIBI_Based_文档分析基础数据
2025年12月22日 30 135 81
数据集概述 本数据集包含一份PDF格式的文档,文件名为Muzaffarova Nigora Safarovna.pdf,未提供具体描述信息,文件类型单一,为纯文档类数据。 文件详解 文件名称: Muzaffarova Nigora Safarovna.pdf 文件格式: PDF (.pdf) 内容说明: 未提供该PDF文件的具体字段或内容描述 适用场景...
-
帕皮阿门托语医疗环境关键词识别语音转文本数据集
2025年12月16日 30 37 34
数据集概述 本数据集为帕皮阿门托语医疗环境下的关键词识别语音转文本研究开发,包含七个类别(六个关键词和一个未知类别)的语音样本,经过滤后共16766个样本,每个样本为一秒钟录音生成的频谱图,用于推动帕皮阿门托语关键词识别研究。 文件详解 文件名称:papiamento_keyword_spotting_dataset.zip...
-
问答游戏对话数据集QuestionAnsweringGameDialogueDataset-denniswang07
2025年4月29日 30 199 39
问答游戏对话数据集QuestionAnsweringGameDialogueDataset-denniswang07 数据来源:互联网公开数据 标签:问答游戏, 对话分析, 文本分类, 关键词识别, 知识问答, 机器学习, 数据标注, 自然语言处理 数据概述:...
-
电子邮件垃圾邮件检测特征数据集
2025年4月15日 30 134 132
电子邮件垃圾邮件检测特征数据集 数据来源:互联网公开数据 标签:垃圾邮件检测,电子邮件特征,机器学习,分类模型,关键词识别,文本分析 数据概述: 本数据集包含了用于电子邮件垃圾邮件检测的各种特征数据,涵盖了邮件的多个维度信息,如主题长度、单词数量、关键词出现情况等。这些特征为构建垃圾邮件分类模型提供了必要的数据基础。 数据用途概述:...
-
安然公司员工电子邮件通信数据集1999-2004
2025年4月14日 30 103 14
安然公司员工电子邮件通信数据集1999-2004 数据来源:互联网公开数据 标签:安然公司,员工通信,电子邮件,企业沟通,情感分析,关键词识别,语言学研究 数据概述:...



