找到74个数据集

标签: 文本嵌入

过滤结果
  • 基于知识图谱嵌入的作者名消歧数据集_含文本与数值字面量

    2025年12月10日 30 22 19

    数据集概述 本数据集包含两个学术知识图谱,分别来源于OpenCitations提供的《Scientometrics》期刊三元组存储和2018年AMiner作者名消歧(AND)基准数据集。数据按文本字面量、数值字面量分类存储,支持多模态知识图谱嵌入研究,含评估数据集及预处理的嵌入文件。 文件详解 该数据集包含3个文件,具体说明如下: - 文档文件: -...
    packageimg
  • cBioPortal_Chroma_Based_2024_cBioPortal内容向量数据库完整数据

    2025年12月5日 30 12 10

    数据集概述 该数据集包含2024年7月收集的cBioPortal文档、Google Groups及研究文章的向量数据库,用于LangChain大语言模型聊天机器人应用,需配置环境变量和API密钥运行示例脚本。 文件详解 文件名称: cbioportal_chroma_zenodo.zip 文件格式: ZIP(.zip) 内容说明:...
    packageimg
  • 阿拉伯新闻文章单标签文本分类数据集_SANAD

    2025年11月29日 30 185 25

    数据集概述 该数据集是大规模阿拉伯语新闻文章集合,适用于文本分类、词嵌入等阿拉伯语自然语言处理任务。包含来自三个新闻网站的文章,分为七个类别,总数量超十九万篇,并提供一个平衡的子集用于训练和测试。 文件详解 文件名称:...
    packageimg
  • 语义相似度评估模型数据集

    2025年11月5日 30 188 166

    语义相似度评估模型数据集_Semantic_Similarity_Evaluation_Model_Dataset 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 自然语言处理, 深度学习, 模型评估, 文本分析, 预训练模型, 相似度计算 数据概述:...
    packageimg
  • 多语言文本嵌入向量数据集

    2025年11月2日 30 156 81

    多语言文本嵌入向量数据集_Multilingual_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 多语言, 自然语言处理, 语义分析, 向量空间, 预训练模型, 迁移学习, 情感分析 数据概述: 该数据集包含基于distiluse-base-multilingual-...
    packageimg
  • 语义文本嵌入向量数据集

    2025年11月1日 30 15 10

    语义文本嵌入向量数据集_Semantic_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义相似度, 向量化, 自然语言处理, 深度学习, 文本检索, 知识图谱, 数据集 数据概述: 该数据集包含基于多问答场景下,使用DistilBERT模型生成的文本嵌入向量。主要特征如下:...
    packageimg
  • 电影评论情感分析嵌入向量数据集

    2025年10月20日 30 128 34

    电影评论情感分析嵌入向量数据集_Movie_Review_Sentiment_Analysis_Embedding_Vectors 数据来源:互联网公开数据 标签:情感分析, 文本嵌入, 机器学习, 自然语言处理, 深度学习, IMDB数据集, 向量化, 文本分类 数据概述: 该数据集包含了来自IMDB电影评论的情感分析嵌入向量。主要特征如下:...
    packageimg
  • 图像与文本多模态特征嵌入数据集

    2025年10月19日 30 170 61

    图像与文本多模态特征嵌入数据集_Image_and_Text_Multimodal_Feature_Embeddings 数据来源:互联网公开数据 标签:多模态学习, 图像嵌入, 文本嵌入, 特征提取, 深度学习, 计算机视觉, 自然语言处理, 数据集 数据概述:...
    packageimg
  • 文本语义向量嵌入数据集

    2025年10月13日 30 91 79

    文本语义向量嵌入数据集_Text_Semantic_Vector_Embeddings 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 向量数据库, 文本检索, 语义相似度, 机器学习, 自然语言处理, 知识图谱 数据概述: 该数据集包含基于Multi-QA-MPNet-Base-v1模型生成的文本语义向量嵌入。主要特征如下:...
    packageimg
  • 多语言文本嵌入与翻译数据集

    2025年10月3日 30 210 66

    多语言文本嵌入与翻译数据集_Multilingual_Text_Embedding_and_Translation_Dataset 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 机器翻译, 英语, 西班牙语, 语料库, 自然语言处理, 数据集 数据概述:...
    packageimg
  • 社交媒体评论情感分析嵌入数据集

    2025年9月29日 30 176 124

    社交媒体评论情感分析嵌入数据集_Social_Media_Comment_Sentiment_Analysis_Embeddings 数据来源:互联网公开数据 标签:情感分析, 文本嵌入, 社交媒体, 自然语言处理, 情感分类, 评论数据, 机器学习, 语义分析 数据概述:...
    packageimg
  • 多语言文本嵌入特征数据集

    2025年9月26日 30 2 0

    多语言文本嵌入特征数据集_Multilingual_Text_Embedding_Features 数据来源:互联网公开数据 标签:文本嵌入, 多语言, 自然语言处理, 语义分析, 向量表示, 机器翻译, 情感分析, 预训练模型 数据概述: 该数据集包含基于distiluse-base-multilingual-...
    packageimg
  • 文本嵌入BERT模型数据集

    2025年9月8日 30 32 25

    文本嵌入BERT模型数据集_Text_Embedding_BERT_Model_Dataset 数据来源:互联网公开数据 标签:BERT, 文本嵌入, 语义分析, 深度学习, 自然语言处理, 向量表示, 文本相似度, 预训练模型 数据概述:...
    packageimg
  • 文本流畅度评估多模态数据集

    2025年9月6日 30 93 79

    文本流畅度评估多模态数据集_Text_Fluency_Assessment_Multimodal_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言模型, 写作质量, 多模态, 机器学习, 情感分析, 文本嵌入, 深度学习 数据概述: 该数据集包含用于评估文本流畅度的多模态数据,涵盖了文本、预测值以及模型参数等信息。主要特征如下:...
    packageimg
  • 社交媒体文本BERT嵌入向量数据集

    2025年8月23日 30 207 179

    社交媒体文本BERT嵌入向量数据集_Social_Media_Text_BERT_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, BERT, 社交媒体, 语义分析, 相似度计算, 向量空间, 机器学习, 自然语言处理 数据概述:...
    packageimg
  • 文本嵌入训练集

    2025年8月15日 30 134 128

    文本嵌入训练集_Text_Embedding_Training_Data 数据来源:互联网公开数据 标签:文本嵌入, 机器学习, 向量化, 自然语言处理, 文本分析, 训练数据, 数据集, 深度学习 数据概述: 该数据集包含用于训练文本嵌入模型的数据,记录了用于将文本转换为向量表示的训练数据。主要特征如下:...
    packageimg
  • 问答对重复性判断多模型嵌入数据集

    2025年8月15日 30 147 137

    问答对重复性判断多模型嵌入数据集_Question_Pairs_Duplicate_Detection_Multi_Model_Embedding_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本相似度, 问答匹配, 深度学习, 模型融合, 文本嵌入, 知识图谱, 机器学习 数据概述:...
    packageimg
  • 语义相似度模型训练评估结果数据集

    2025年7月28日 30 143 57

    语义相似度模型训练评估结果数据集_Semantic_Similarity_Model_Training_Evaluation_Results 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 模型评估, 深度学习, 文本分析, 自然语言处理, 机器学习, STS-dev 数据概述:...
    packageimg
  • 文本嵌入向量数据集

    2025年7月19日 30 204 137

    文本嵌入向量数据集_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 多语言, 相似度计算, 深度学习, 向量空间, 文本检索, 自然语言处理 数据概述: 该数据集包含基于多语言文本的嵌入向量,记录了文本经过特定模型转换后的数值化表示。主要特征如下:...
    packageimg
  • 文本语义相似度分析祖先节点嵌入向量数据集

    2025年7月12日 30 103 23

    文本语义相似度分析祖先节点嵌入向量数据集_Text_Semantic_Similarity_Ancestor_Node_Embedding_Vectors 数据来源:互联网公开数据 标签:语义分析, 文本嵌入, 向量表示, 相似度计算, 机器学习, 深度学习, 自然语言处理, 知识图谱 数据概述:...
    packageimg