互联网数据 - 分类

语音元音类别不平衡分类数据集

2025年4月14日 30 59 58

语音元音类别不平衡分类数据集数据来源：互联网公开数据标签：语音识别,语音元音,类别不平衡,谐波分析,特征提取,分类算法,机器学习数据概述：本数据集来自欧洲ESPRIT 5516项目“ROARS”，旨在开发和实现法语和西班牙语的实时语音识别分析系统。数据集包含来自1809个孤立音节的元音样本（例如：pa, ta,...

ZIP

语言生成器合成文本数据集

2025年4月25日 30 89 85

语言生成器合成文本数据集数据来源：互联网公开数据标签：自然语言处理,文本生成,语言模型训练,合成数据,数据增强,对话模拟,错误注入数据概述：本数据集是由Python工具Linguistic...

ZIP

语言流畅度评估多维度数据集

2025年7月19日 60 210 90

语言流畅度评估多维度数据集_Language_Fluency_Evaluation_Multi_dimensional_Dataset 数据来源：互联网公开数据标签：文本评估, 语言学, 写作质量, 自然语言处理, 机器学习, 语言模型, 文本分析, 语义理解数据概述：...

ZIP

语言模型对比数据集

2025年4月15日 30 60 3

语言模型对比数据集数据来源：互联网公开数据标签：语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能数据概述：本数据集包含从Govinfo网站收集的90个问题及其正确答案，并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1...

ZIP

语言检测数据集

2025年4月14日 30 69 57

语言检测数据集数据来源：互联网公开数据标签：语言检测,文本分类,社交媒体分析,推特数据,多语言处理数据概述：本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据，涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据，总计13153行，每行数据包括两个列：推文内容和对应的标签。数据用途概述：...

ZIP

语言切换数据集

2025年4月18日 30 81 78

语言切换数据集数据来源：互联网公开数据标签：语言翻译,多语言数据,机器学习,NLP,跨语言分析,语言对应关系数据概述：本数据集包含了多种语言之间的翻译记录，主要针对源语言（language）与目标语言（language_t）之间的对应关系。通过Google...

ZIP

语言分类数据集

2025年4月14日 30 151 82

语言分类数据集数据来源：互联网公开数据标签：语言分类,多语言数据集,机器学习,深度学习,自然语言处理,句法分析数据概述：...

ZIP

语义相似性数据集

2025年4月18日 30 156 145

语义相似性数据集数据来源：互联网公开数据标签：语义相似性,自然语言处理,SNLI语料库,句子对分析,文本理解,机器学习数据概述本数据集基于SNLI（Stanford Natural Language...

ZIP

语义相似度评估模型数据集

2025年11月5日 30 104 39

语义相似度评估模型数据集_Semantic_Similarity_Evaluation_Model_Dataset 数据来源：互联网公开数据标签：语义相似度, 文本嵌入, 自然语言处理, 深度学习, 模型评估, 文本分析, 预训练模型, 相似度计算数据概述：...

ZIP

语义相似度模型训练评估结果数据集

2025年7月28日 30 39 15

语义相似度模型训练评估结果数据集_Semantic_Similarity_Model_Training_Evaluation_Results 数据来源：互联网公开数据标签：语义相似度, 文本嵌入, 模型评估, 深度学习, 文本分析, 自然语言处理, 机器学习, STS-dev 数据概述：...

ZIP

语义文本嵌入向量数据集

2025年11月1日 30 47 26

语义文本嵌入向量数据集_Semantic_Text_Embedding_Vectors 数据来源：互联网公开数据标签：文本嵌入, 语义相似度, 向量化, 自然语言处理, 深度学习, 文本检索, 知识图谱, 数据集数据概述：该数据集包含基于多问答场景下，使用DistilBERT模型生成的文本嵌入向量。主要特征如下：...

ZIP

诗歌情感分析数据集

2025年4月15日 30 134 35

诗歌情感分析数据集数据来源：互联网公开数据标签：诗歌,情感分析,文学研究,机器学习,自然语言处理,文本分类数据概述：...

ZIP

诗人股票表现数据集

2025年4月15日 30 135 20

诗人股票表现数据集数据来源：互联网公开数据标签：股票市场,历史数据,公司表现,投资分析,金融研究,市场趋势数据概述：本数据集提供了特定公司历史上的股票市场表现数据，涵盖了股票价格随时间的变化趋势和波动情况。数据集覆盖了多个年份的市场数据，为分析股票历史表现提供了详实的基础。数据用途概述：...

ZIP

马尔克-试点数据集

2025年5月31日 30 29 27

马尔克-试点数据集数据来源：互联网公开数据标签：产品匹配,实体识别,二进制分类,不平衡数据,机器学习数据概述：...

ZIP

词语难度评估数据集

2025年4月14日 30 9 2

词语难度评估数据集数据来源：互联网公开数据标签：词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题数据概述本数据集包含40,481条数据记录，主要用于评估词语的难度。数据集的每个实例包含多个特征，包括词语本身、词长、词频、词频的对数变换、平均反应时间（Mean...

ZIP

词汇智商测试响应数据集

2025年4月15日 30 210 95

词汇智商测试响应数据集数据来源：互联网公开数据标签：词汇智商,测试响应,心理学研究,数据分析,公众教育,心理评估数据概述：...

ZIP

词汇语义与修辞手法数据集-词汇同义词与词频统计

2025年4月14日 30 21 0

词汇语义与修辞手法数据集-词汇同义词与词频统计数据来源：互联网公开数据标签：词汇语义,同义词,修辞手法,词频统计,WordNet,自然语言处理,文本分析,语言学,语料库数据概述：...

ZIP

词嵌入向量数据集

2025年11月20日 30 48 32

词嵌入向量数据集_Word_Embedding_Vectors 数据来源：互联网公开数据标签：词嵌入, 向量化, 自然语言处理, 深度学习, 文本分析, 语义分析, 数据集, 机器学习数据概述：该数据集包含一系列词嵌入向量，用于将文本数据转换为数值型向量，以便于机器学习模型的训练和文本分析。主要特征如下：...

ZIP

词向量语义分析数据集

2025年10月20日 30 71 67

词向量语义分析数据集_Word_Vector_Semantic_Analysis_Dataset 数据来源：互联网公开数据标签：词向量, 语义分析, 自然语言处理, 文本挖掘, 机器学习, 词嵌入, 语言模型, 情感分析数据概述：该数据集包含预训练的词向量数据，记录了词汇的语义表示，适用于各种自然语言处理任务。主要特征如下：...

ZIP

词向量相似度分析数据集

2025年9月29日 30 131 108

词向量相似度分析数据集_Word_Embedding_Similarity_Analysis 数据来源：互联网公开数据标签：词向量, 相似度计算, 自然语言处理, 文本分析, 机器学习, 嵌入, 语义分析, 数据集数据概述：该数据集包含基于词嵌入模型生成的词向量数据，用于评估和分析词语之间的语义相似度。主要特征如下：...

ZIP

找到94,895个数据集

注册成功！