-
数据512维度的嵌入向量数据集Embedding-512-2Dataset-bankit1234
512维度的嵌入向量数据集Embedding-512-2Dataset-bankit1234 数据来源:互联网公开数据 标签:文本嵌入,语义分析,自然语言处理,机器学习,向量表示,深度学习,数据集,特征提取 数据概述: 该数据集包含512维度的文本嵌入向量,用于表示文本的语义信息。主要特征如下:... -
文本情感分析多模型嵌入数据集TextSentimentAnalysisMulti-ModelEmbeddings-orcldsapp129833
文本情感分析多模型嵌入数据集TextSentimentAnalysisMulti-ModelEmbeddings-orcldsapp129833 数据来源:互联网公开数据 标签:情感分析, 文本嵌入, 机器学习, 自然语言处理, 深度学习, 模型评估, 文本向量化, 数据集 数据概述:... -
嵌入式IMDb电影评论数据集EmbeddedIMDbMovieReviewsDataset-abirhosenashik
嵌入式IMDb电影评论数据集EmbeddedIMDbMovieReviewsDataset-abirhosenashik 数据来源:互联网公开数据 标签:自然语言处理,文本嵌入,数据集,情感分析,机器学习,深度学习,电影评论,文本分类 数据概述:... -
社交媒体情绪分析数据集BERTweet嵌入-推特数据2020-2021-arnavjain2710
社交媒体情绪分析数据集BERTweet嵌入-推特数据2020-2021-arnavjain2710 数据来源:互联网公开数据 标签:自然语言处理,情感分析,推特数据,BERT,文本嵌入,机器学习,社交媒体,情绪识别 数据概述: 该数据集包含使用 BERTweet 模型生成的推特文本嵌入,用于情感分析和情绪识别任务。主要特征如下:... -
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222 数据来源:互联网公开数据 标签:文本嵌入, 写作评估, 语义分析, 深度学习, 语言模型, 自然语言处理, 文本相似度, 情感分析 数据概述:... -
文本嵌入特征向量数据集TextEmbeddingFeatureVectors-syhens
文本嵌入特征向量数据集TextEmbeddingFeatureVectors-syhens 数据来源:互联网公开数据 标签:文本嵌入, 特征工程, 深度学习, 向量化, 自然语言处理, 降维, 数据分析, 模型训练 数据概述: 该数据集包含从文本数据中提取的嵌入特征向量,用于表示文本的语义信息。主要特征如下:... -
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25 数据来源:互联网公开数据 标签:文本嵌入, 语义分析, 自然语言处理, 深度学习, 向量空间, 语料库, 数据预处理, 机器翻译 数据概述: 该数据集包含经过处理的文本语料库数据及其对应的嵌入向量表示。主要特征如下:... -
文本语义相似度评估数据集TextSemanticSimilarityEvaluationDataset-marght
文本语义相似度评估数据集TextSemanticSimilarityEvaluationDataset-marght 数据来源:互联网公开数据 标签:文本相似度, 语义理解, 评估数据集, 预训练模型, 自然语言处理, 文本嵌入, 机器学习, 性能分析 数据概述:... -
生物医学BERT模型COVID-19文本嵌入数据集BioBERT-COVIDEmbeddingsDataset-sourojit
生物医学BERT模型COVID-19文本嵌入数据集BioBERT-COVIDEmbeddingsDataset-sourojit 数据来源:互联网公开数据 标签:生物医学,自然语言处理,COVID-19,文本嵌入,深度学习,机器学习,BERT模型,信息检索 数据概述:... -
文本向量嵌入模型构建数据集TextVectorEmbeddingModelBuilding-priyamj27
文本向量嵌入模型构建数据集TextVectorEmbeddingModelBuilding-priyamj27 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 语义分析, 自然语言处理, 机器学习, 向量空间, 文本相似度, 数据集 数据概述: 该数据集包含用于构建文本向量嵌入模型的数据,记录了文本数据及其对应的嵌入向量表示。主要特征如下:... -
多语言文本嵌入模型训练数据集MultilingualTextEmbeddingModelTrainingData-miller90
多语言文本嵌入模型训练数据集MultilingualTextEmbeddingModelTrainingData-miller90 数据来源:互联网公开数据 标签:文本嵌入, 多语言, 语义相似度, 文本表示, 预训练模型, 自然语言处理, 机器学习, 模型训练 数据概述:... -
文本语义BERT嵌入向量数据集TextSemanticBERTEmbeddingVectors-honglyu
文本语义BERT嵌入向量数据集TextSemanticBERTEmbeddingVectors-honglyu 数据来源:互联网公开数据 标签:BERT, 文本嵌入, 语义分析, 向量表示, 深度学习, 自然语言处理, 文本相似度, 降维 数据概述: 该数据集包含基于BERT模型生成的文本嵌入向量,记录了文章的语义信息。主要特征如下:... -
文本语义相似度计算嵌入向量数据集TextSemanticSimilarityEmbeddingVectors-erkhatkalkabay
文本语义相似度计算嵌入向量数据集TextSemanticSimilarityEmbeddingVectors-erkhatkalkabay 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 向量表示, 机器学习, 自然语言处理, 数据分析, 文本分析, 预训练模型 数据概述:... -
医疗健康文本情感分析嵌入数据集MedicalHealthTextSentimentAnalysisEmbeddings-priyamj27
医疗健康文本情感分析嵌入数据集MedicalHealthTextSentimentAnalysisEmbeddings-priyamj27 数据来源:互联网公开数据 标签:医疗健康, 情感分析, 文本嵌入, ERNIE, 自然语言处理, 情感分类, 语义分析, 深度学习 数据概述:... -
商品描述嵌入向量数据集ProductDescriptionEmbeddingVectors-harshalkarangale
商品描述嵌入向量数据集ProductDescriptionEmbeddingVectors-harshalkarangale 数据来源:互联网公开数据 标签:商品推荐, 文本嵌入, 深度学习, 向量化, 商品描述, 相似度计算, 机器学习, 自然语言处理 数据概述:... -
文本主题分析与嵌入数据集TextTopicAnalysisandEmbedding-pragunsrivastava
文本主题分析与嵌入数据集TextTopicAnalysisandEmbedding-pragunsrivastava 数据来源:互联网公开数据 标签:文本分析, 主题建模, 文本嵌入, 自然语言处理, 机器学习, 词向量, 数据挖掘, 语义分析 数据概述:... -
大规模语言模型嵌入与重排序研究代码数据集LargeLanguageModelEmbeddingandRerankingResearchCode-djc020623nzh
大规模语言模型嵌入与重排序研究代码数据集LargeLanguageModelEmbeddingandRerankingResearchCode-djc020623nzh 数据来源:互联网公开数据 标签:自然语言处理, 机器学习, 深度学习, 文本嵌入, 重排序, 模型训练, 代码, 预训练模型, 大语言模型 数据概述:... -
问答对及文本嵌入数据集QuestionAnsweringandTextEmbeddingDataset-nahushlele
问答对及文本嵌入数据集QuestionAnsweringandTextEmbeddingDataset-nahushlele 数据来源:互联网公开数据 标签:问答系统, 文本嵌入, 知识检索, 自然语言处理, 语义理解, 信息抽取, 数据集构建, 机器学习 数据概述: 该数据集包含来自nahushlele-... -
推特名人推文嵌入数据集
推特名人推文嵌入数据集 数据来源:互联网公开数据 标签:推特,名人,自然语言处理,文本嵌入,社交媒体分析,机器学习,数据科学 数据概述: 本数据集包含了推特平台上排名前1000位知名名人账户的推文及其对应的文本嵌入向量。数据集共包含915位名人用户的推文,推文内容通过tweepy(Python语言的Twitter... -
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...