数据集 - 海数据

电影元数据及嵌入特征数据集MovieMetadataandEmbeddingFeaturesDataset-philippbaer

2025年5月31日

电影元数据及嵌入特征数据集MovieMetadataandEmbeddingFeaturesDataset-philippbaer 数据来源：互联网公开数据标签：电影, 推荐系统, 元数据, 文本嵌入, 电影分析, 自然语言处理, 机器学习, 电影推荐数据概述：...

ZIP

越南语文本语义分析数据集VietnameseTextSemanticAnalysis-trnginhnht

2025年5月31日

越南语文本语义分析数据集VietnameseTextSemanticAnalysis-trnginhnht 数据来源：互联网公开数据标签：越南语, 文本分析, 语义理解, 文本嵌入, 词向量, 自然语言处理, 文本分类, 语料库数据概述：该数据集包含来自越南语文本的数据，记录了越南语文本片段及其对应的标识符。主要特征如下：...

ZIP

伊朗地区社交媒体推文分析数据集IranSocialMediaTweetsAnalysis2019-shivanigupta2011

2025年5月30日

伊朗地区社交媒体推文分析数据集IranSocialMediaTweetsAnalysis2019-shivanigupta2011 数据来源：互联网公开数据标签：社交媒体, 推文分析, 自然语言处理, 文本情感分析, 伊朗, 2019年, 文本嵌入, 舆情分析数据概述：...

ZIP

语义向量嵌入多轮问答数据集SemanticVectorEmbeddingMulti-turnQuestionAnsweringDataset-erkhatkalkabay

2025年5月30日

语义向量嵌入多轮问答数据集SemanticVectorEmbeddingMulti-turnQuestionAnsweringDataset-erkhatkalkabay 数据来源：互联网公开数据标签：语义向量, 问答系统, 文本嵌入, 自然语言处理, 机器学习, 知识检索, 语义相似度, 多轮对话数据概述：...

ZIP

问答系统上下文语料嵌入数据集ContextualCorpusEmbeddingforQuestionAnsweringSystems-jiviteshjain

2025年5月30日

问答系统上下文语料嵌入数据集ContextualCorpusEmbeddingforQuestionAnsweringSystems-jiviteshjain 数据来源：互联网公开数据标签：问答系统, 语料库, 文本嵌入, 语义搜索, 机器学习, 自然语言处理, 知识检索, 向量数据库数据概述：...

ZIP

图像文本多模态嵌入数据集Image-TextMultimodalEmbeddingDataset-ishaaaaan

2025年5月30日

图像文本多模态嵌入数据集Image-TextMultimodalEmbeddingDataset-ishaaaaan 数据来源：互联网公开数据标签：多模态, 图像嵌入, 文本嵌入, 深度学习, 机器学习, 数据集, 计算机视觉, 自然语言处理数据概述：...

ZIP

职业分类与嵌入向量分析数据集OccupationalClassificationandEmbeddingVectorAnalysisDataset-sudhirrd007

2025年5月30日

职业分类与嵌入向量分析数据集OccupationalClassificationandEmbeddingVectorAnalysisDataset-sudhirrd007 数据来源：互联网公开数据标签：职业分类, 文本嵌入, 向量分析, 职业编码, 数据挖掘, 自然语言处理, 劳动力市场, 行业研究数据概述：...

ZIP

Facebook社交网络文本嵌入数据集FacebookSocialNetworkTextEmbeddingsDataset-harshalkarangale

2025年5月30日

Facebook社交网络文本嵌入数据集FacebookSocialNetworkTextEmbeddingsDataset-harshalkarangale 数据来源：互联网公开数据标签：社交网络，文本嵌入，数据集，自然语言处理，机器学习，情感分析，用户行为，文本分析数据概述：...

ZIP

基于BERT的论文嵌入数据集BERTEmbeddingsforEssayDataset-byrdofafeather

2025年5月30日

基于BERT的论文嵌入数据集BERTEmbeddingsforEssayDataset-byrdofafeather 数据来源：互联网公开数据标签：自然语言处理，文本分析，论文写作，深度学习，BERT，数据集，文本嵌入，学术研究数据概述：该数据集包含了使用BERT模型生成的论文嵌入向量，旨在为论文写作、文本分析等任务提供支持。主要特征如下：...

ZIP

仇恨言论检测音视频多模态特征数据集HateSpeechDetectionAudio-VideoMultimodalFeatureDataset-carloscc10

2025年5月30日

仇恨言论检测音视频多模态特征数据集HateSpeechDetectionAudio-VideoMultimodalFeatureDataset-carloscc10 数据来源：互联网公开数据标签：仇恨言论, 多模态, 音频特征, 视频特征, 机器学习, 深度学习, MFCC, 文本嵌入数据概述：...

ZIP

句子嵌入模型数据集SBERTModelDataset-piyu2397

2025年5月30日

句子嵌入模型数据集SBERTModelDataset-piyu2397 数据来源：互联网公开数据标签：自然语言处理，文本分析，数据集，机器学习，语义相似度，深度学习，文本嵌入，语义理解数据概述：该数据集包含用于训练和评估句子嵌入模型（SBERT, 句子-BERT）的数据，记录了文本句子的嵌入向量及其相关属性。主要特征如下：...

ZIP

CommonLit阅读理解嵌入数据集-ayushs9020

2025年5月29日

CommonLit阅读理解嵌入数据集-ayushs9020 数据来源：互联网公开数据标签：阅读理解，自然语言处理，数据集，文本分析，机器学习，情感分析，教育，文本嵌入数据概述：该数据集包含来自 CommonLit 竞赛的文本和相关信息，旨在促进阅读理解和文本分析的研究。主要特征如下：时间跨度：数据没有明确的时间跨度，但反映了 CommonLit...

ZIP

BERT嵌入测试数据集-khushigupta1605

2025年5月29日

BERT嵌入测试数据集-khushigupta1605 数据来源：互联网公开数据标签：自然语言处理，文本嵌入，数据集，BERT，语义分析，机器学习，文本分类，情感分析数据概述：该数据集包含用于测试BERT模型生成的文本嵌入的数据，旨在评估BERT模型在不同文本任务中的表现。主要特征如下：...

ZIP

维基文本嵌入数据集WikitextTextEmbeddingsDataset-hozaifazaki99

2025年5月29日

维基文本嵌入数据集WikitextTextEmbeddingsDataset-hozaifazaki99 数据来源：互联网公开数据标签：文本嵌入，自然语言处理，数据集，机器学习，词向量，文本分析，语言模型，维基百科数据概述：...

ZIP

文本嵌入与标签数据集TextEmbeddingswithLabelsDataset-ishaaaaan

2025年5月29日

文本嵌入与标签数据集TextEmbeddingswithLabelsDataset-ishaaaaan 数据来源：互联网公开数据标签：文本嵌入，自然语言处理，数据集，机器学习，深度学习，标签分类，文本分析，人工智能数据概述：该数据集包含来自多个来源的文本数据及其对应标签，记录了文本的嵌入特征和分类标签。主要特征如下：...

ZIP

图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj

2025年5月29日

图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj 数据来源：互联网公开数据标签：图像描述, 文本嵌入, 计算机视觉, 自然语言处理, 图像检索, 语义分析, 深度学习, 多模态数据概述：...

ZIP

文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan

2025年5月29日

文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan 数据来源：互联网公开数据标签：文本嵌入，深度学习，自然语言处理，数据集，机器学习，人工智能，文本分析，语言模型数据概述：该数据集包含来自CLIP（Contrastive Language-Image Pre-...

ZIP

土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19

2025年5月29日

土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19 数据来源：互联网公开数据标签：文本分类, 土耳其语, 语料库, 自然语言处理, 机器学习, 文本嵌入, 语言模型, 类别标注数据概述：该数据集包含来自不同来源的土耳其语文本，记录了用于文本分类任务的句子及对应的类别信息。主要特征如下：...