-
语音命令数据集
2025年5月31日 30 25 10
语音命令数据集 数据来源:互联网公开数据 标签:语音识别,虚拟助手,多语言,语音命令,语音处理,人机交互,数据增强 数据概述: 本数据集包含来自多个说话者的音频录音,旨在模拟虚拟助手的语音交互场景。录音内容为用户对虚拟助手发出的个体语音命令,涵盖不同语言、流利程度及其他属性的说话者。数据集经过简化处理,适合用于语音识别模型的训练与优化。 数据用途概述:... -
语音助手消息类型分类数据集
2025年4月14日 30 26 4
语音助手消息类型分类数据集 数据来源:互联网公开数据 标签:消息类型,语音助手,自然语言处理,分类模型,问答系统,人机交互 数据概述: 本数据集包含基于消息类型的分类数据,涵盖了四种主要类型:Yes/No问题(yn)、Wh-... -
语音元音类别不平衡分类数据集
2025年4月14日 30 28 7
语音元音类别不平衡分类数据集 数据来源:互联网公开数据 标签:语音识别,语音元音,类别不平衡,谐波分析,特征提取,分类算法,机器学习 数据概述: 本数据集来自欧洲ESPRIT 5516项目“ROARS”,旨在开发和实现法语和西班牙语的实时语音识别分析系统。数据集包含来自1809个孤立音节的元音样本(例如:pa, ta,... -
语言生成器合成文本数据集
2025年4月25日 30 21 7
语言生成器合成文本数据集 数据来源:互联网公开数据 标签:自然语言处理,文本生成,语言模型训练,合成数据,数据增强,对话模拟,错误注入 数据概述: 本数据集是由Python工具Linguistic... -
语言流畅度评估多维度数据集
2025年7月19日 60 24 9
语言流畅度评估多维度数据集_Language_Fluency_Evaluation_Multi_dimensional_Dataset 数据来源:互联网公开数据 标签:文本评估, 语言学, 写作质量, 自然语言处理, 机器学习, 语言模型, 文本分析, 语义理解 数据概述:... -
语言模型对比数据集
2025年4月15日 30 18 6
语言模型对比数据集 数据来源:互联网公开数据 标签:语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能 数据概述: 本数据集包含从Govinfo网站收集的90个问题及其正确答案,并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1... -
语言检测数据集
2025年4月14日 30 14 8
语言检测数据集 数据来源:互联网公开数据 标签:语言检测,文本分类,社交媒体分析,推特数据,多语言处理 数据概述: 本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据,涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据,总计13153行,每行数据包括两个列:推文内容和对应的标签。 数据用途概述:... -
语言切换数据集
2025年4月18日 30 20 10
语言切换数据集 数据来源:互联网公开数据 标签:语言翻译,多语言数据,机器学习,NLP,跨语言分析,语言对应关系 数据概述: 本数据集包含了多种语言之间的翻译记录,主要针对源语言(language)与目标语言(language_t)之间的对应关系。通过Google... -
-
语义相似性数据集
2025年4月18日 30 24 1
语义相似性数据集 数据来源:互联网公开数据 标签:语义相似性,自然语言处理,SNLI语料库,句子对分析,文本理解,机器学习 数据概述 本数据集基于SNLI(Stanford Natural Language... -
语义相似度模型训练评估结果数据集
2025年7月28日 30 24 1
语义相似度模型训练评估结果数据集_Semantic_Similarity_Model_Training_Evaluation_Results 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 模型评估, 深度学习, 文本分析, 自然语言处理, 机器学习, STS-dev 数据概述:... -
-
诗人股票表现数据集
2025年4月15日 30 15 1
诗人股票表现数据集 数据来源:互联网公开数据 标签:股票市场,历史数据,公司表现,投资分析,金融研究,市场趋势 数据概述: 本数据集提供了特定公司历史上的股票市场表现数据,涵盖了股票价格随时间的变化趋势和波动情况。数据集覆盖了多个年份的市场数据,为分析股票历史表现提供了详实的基础。 数据用途概述:... -
-
词语难度评估数据集
2025年4月14日 30 30 9
词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean... -
-
词汇语义与修辞手法数据集-词汇同义词与词频统计
2025年4月14日 30 24 5
词汇语义与修辞手法数据集-词汇同义词与词频统计 数据来源:互联网公开数据 标签:词汇语义,同义词,修辞手法,词频统计,WordNet,自然语言处理,文本分析,语言学,语料库 数据概述:... -
-
诊所就诊时间数据集
2025年4月14日 30 18 4
诊所就诊时间数据集 数据来源:互联网公开数据 标签:诊所,就诊时间,预计时长,实际时长,就诊原因,医疗分析,患者行为 数据概述: 本数据集包含3000条关于医生就诊时间的记录,涵盖了就诊的预期时长、实际时长以及患者就诊原因等信息。这些数据为分析诊所运营效率、患者就诊行为提供了丰富的信息基础。 数据用途概述:...