找到94,594个数据集

格式: ZIP

过滤结果
  • 语言检测数据集

    2025年4月14日 30 25 1

    语言检测数据集 数据来源:互联网公开数据 标签:语言检测,文本分类,社交媒体分析,推特数据,多语言处理 数据概述: 本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据,涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据,总计13153行,每行数据包括两个列:推文内容和对应的标签。 数据用途概述:...
    packageimg
  • 语言切换数据集

    2025年4月18日 30 28 7

    语言切换数据集 数据来源:互联网公开数据 标签:语言翻译,多语言数据,机器学习,NLP,跨语言分析,语言对应关系 数据概述: 本数据集包含了多种语言之间的翻译记录,主要针对源语言(language)与目标语言(language_t)之间的对应关系。通过Google...
    packageimg
  • 语言分类数据集

    2025年4月14日 30 22 6

    语言分类数据集 数据来源:互联网公开数据 标签:语言分类,多语言数据集,机器学习,深度学习,自然语言处理,句法分析 数据概述:...
    packageimg
  • 语义相似性数据集

    2025年4月18日 30 11 9

    语义相似性数据集 数据来源:互联网公开数据 标签:语义相似性,自然语言处理,SNLI语料库,句子对分析,文本理解,机器学习 数据概述 本数据集基于SNLI(Stanford Natural Language...
    packageimg
  • 语义相似度评估模型数据集

    2025年11月5日 30 17 5

    语义相似度评估模型数据集_Semantic_Similarity_Evaluation_Model_Dataset 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 自然语言处理, 深度学习, 模型评估, 文本分析, 预训练模型, 相似度计算 数据概述:...
    packageimg
  • 语义相似度模型训练评估结果数据集

    2025年7月28日 30 28 4

    语义相似度模型训练评估结果数据集_Semantic_Similarity_Model_Training_Evaluation_Results 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 模型评估, 深度学习, 文本分析, 自然语言处理, 机器学习, STS-dev 数据概述:...
    packageimg
  • 语义文本嵌入向量数据集

    2025年11月1日 30 28 10

    语义文本嵌入向量数据集_Semantic_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义相似度, 向量化, 自然语言处理, 深度学习, 文本检索, 知识图谱, 数据集 数据概述: 该数据集包含基于多问答场景下,使用DistilBERT模型生成的文本嵌入向量。主要特征如下:...
    packageimg
  • 诗歌情感分析数据集

    2025年4月15日 30 24 7

    诗歌情感分析数据集 数据来源:互联网公开数据 标签:诗歌,情感分析,文学研究,机器学习,自然语言处理,文本分类 数据概述:...
    packageimg
  • 诗人股票表现数据集

    2025年4月15日 30 25 4

    诗人股票表现数据集 数据来源:互联网公开数据 标签:股票市场,历史数据,公司表现,投资分析,金融研究,市场趋势 数据概述: 本数据集提供了特定公司历史上的股票市场表现数据,涵盖了股票价格随时间的变化趋势和波动情况。数据集覆盖了多个年份的市场数据,为分析股票历史表现提供了详实的基础。 数据用途概述:...
    packageimg
  • 马尔克-试点数据集

    2025年5月31日 30 24 1

    马尔克-试点数据集 数据来源:互联网公开数据 标签:产品匹配,实体识别,二进制分类,不平衡数据,机器学习 数据概述:...
    packageimg
  • 词语难度评估数据集

    2025年4月14日 30 18 4

    词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean...
    packageimg
  • 词汇智商测试响应数据集

    2025年4月15日 30 16 2

    词汇智商测试响应数据集 数据来源:互联网公开数据 标签:词汇智商,测试响应,心理学研究,数据分析,公众教育,心理评估 数据概述:...
    packageimg
  • 词汇语义与修辞手法数据集-词汇同义词与词频统计

    2025年4月14日 30 16 2

    词汇语义与修辞手法数据集-词汇同义词与词频统计 数据来源:互联网公开数据 标签:词汇语义,同义词,修辞手法,词频统计,WordNet,自然语言处理,文本分析,语言学,语料库 数据概述:...
    packageimg
  • 词嵌入向量数据集

    2025年11月20日 30 16 2

    词嵌入向量数据集_Word_Embedding_Vectors 数据来源:互联网公开数据 标签:词嵌入, 向量化, 自然语言处理, 深度学习, 文本分析, 语义分析, 数据集, 机器学习 数据概述: 该数据集包含一系列词嵌入向量,用于将文本数据转换为数值型向量,以便于机器学习模型的训练和文本分析。主要特征如下:...
    packageimg
  • 词向量语义分析数据集

    2025年10月20日 30 11 3

    词向量语义分析数据集_Word_Vector_Semantic_Analysis_Dataset 数据来源:互联网公开数据 标签:词向量, 语义分析, 自然语言处理, 文本挖掘, 机器学习, 词嵌入, 语言模型, 情感分析 数据概述: 该数据集包含预训练的词向量数据,记录了词汇的语义表示,适用于各种自然语言处理任务。主要特征如下:...
    packageimg
  • 词向量相似度分析数据集

    2025年9月29日 30 11 1

    词向量相似度分析数据集_Word_Embedding_Similarity_Analysis 数据来源:互联网公开数据 标签:词向量, 相似度计算, 自然语言处理, 文本分析, 机器学习, 嵌入, 语义分析, 数据集 数据概述: 该数据集包含基于词嵌入模型生成的词向量数据,用于评估和分析词语之间的语义相似度。主要特征如下:...
    packageimg
  • 词义网络边数据集

    2025年4月15日 30 15 2

    词义网络边数据集 数据来源:互联网公开数据 标签:词义网络,同义词,自然语言处理,图数据,网络分析,词汇关联,语言学研究 数据概述...
    packageimg
  • 诊所就诊时间数据集

    2025年4月14日 30 29 1

    诊所就诊时间数据集 数据来源:互联网公开数据 标签:诊所,就诊时间,预计时长,实际时长,就诊原因,医疗分析,患者行为 数据概述: 本数据集包含3000条关于医生就诊时间的记录,涵盖了就诊的预期时长、实际时长以及患者就诊原因等信息。这些数据为分析诊所运营效率、患者就诊行为提供了丰富的信息基础。 数据用途概述:...
    packageimg
  • 评论文本毒性预测模型验证数据集

    2025年8月20日 30 29 8

    评论文本毒性预测模型验证数据集_Comment_Text_Toxicity_Prediction_Model_Validation 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 机器学习, 模型验证, 评论分析, 自然语言处理, 情感分析, 数据建模 数据概述:...
    packageimg
  • 评论情感分析评分预测数据集

    2025年7月18日 30 18 7

    评论情感分析评分预测数据集_Comment_Sentiment_Analysis_Score_Prediction 数据来源:互联网公开数据 标签:情感分析, 评论数据, 评分预测, 文本分析, 机器学习, 自然语言处理, 社交媒体, 数据建模 数据概述:...
    packageimg