-
商品查询与产品分类数据集
2025年9月11日 30 151 121
商品查询与产品分类数据集_Product_Query_and_Product_Classification_Dataset 数据来源:互联网公开数据 标签:商品分类, 文本匹配, 电商搜索, 多分类, 语义分析, 推荐系统, 自然语言处理, 产品描述 数据概述:... -
文本嵌入BERT模型数据集
2025年9月8日 30 125 100
文本嵌入BERT模型数据集_Text_Embedding_BERT_Model_Dataset 数据来源:互联网公开数据 标签:BERT, 文本嵌入, 语义分析, 深度学习, 自然语言处理, 向量表示, 文本相似度, 预训练模型 数据概述:... -
社交媒体文本BERT嵌入向量数据集
2025年8月23日 30 17 8
社交媒体文本BERT嵌入向量数据集_Social_Media_Text_BERT_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, BERT, 社交媒体, 语义分析, 相似度计算, 向量空间, 机器学习, 自然语言处理 数据概述:... -
知识图谱实体关系数据集
2025年8月13日 30 15 13
知识图谱实体关系数据集_Knowledge_Graph_Entity_Relation_Dataset 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 关系抽取, 语义分析, 数据挖掘, 自然语言处理, 维基百科, 知识表示 数据概述: 该数据集包含从维基百科提取的知识图谱相关数据,记录了实体、属性、关系等信息。主要特征如下:... -
巴西银行监管文本分析数据集
2025年8月12日 30 96 86
巴西银行监管文本分析数据集_Brazilian_Banking_Regulation_Corpora 数据来源:互联网公开数据 标签:银行业务, 监管法规, 文本分析, 语料库, 自然语言处理, 金融科技, 文本挖掘, 语义分析 数据概述: 该数据集包含来自巴西银行监管机构的文本数据,记录了与巴西银行业务相关的法规、政策文件及相关信息。主要特征如下:... -
新冠疫情医学论文分析数据集
2025年7月28日 30 94 44
新冠疫情医学论文分析数据集_COVID_19_Medical_Paper_Analysis 数据来源:互联网公开数据 标签:新冠疫情, 医学论文, 文本挖掘, 语义分析, 疫情研究, 学术论文, 数据分析, 疫情传播 数据概述: 该数据集包含来自学术数据库的关于新冠疫情的医学论文,记录了与新冠病毒相关的研究成果。主要特征如下:... -
文本语义相似度评估数据集
2025年7月17日 30 53 39
文本语义相似度评估数据集_Text_Semantic_Similarity_Evaluation 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 信息检索, 模型评估, 深度学习, 自然语言处理, 评估指标, 对比分析 数据概述: 该数据集包含用于评估文本语义相似度模型的训练与评估数据,主要聚焦于信息检索场景下的模型性能分析。主要特征如下:... -
学术论文引用关系与文本分析数据集
2025年7月12日 30 54 14
学术论文引用关系与文本分析数据集_Academic_Paper_Citation_and_Text_Analysis_Dataset 数据来源:互联网公开数据 标签:学术论文, 引用分析, 文本挖掘, 自然语言处理, 论文摘要, 语义分析, 机器学习, 知识图谱 数据概述:... -
文本语义相似度分析祖先节点嵌入向量数据集
2025年7月12日 30 14 4
文本语义相似度分析祖先节点嵌入向量数据集_Text_Semantic_Similarity_Ancestor_Node_Embedding_Vectors 数据来源:互联网公开数据 标签:语义分析, 文本嵌入, 向量表示, 相似度计算, 机器学习, 深度学习, 自然语言处理, 知识图谱 数据概述:... -
Unsplash图片描述与索引数据集_Unsplash_Image_Description_and_Index
2025年6月28日 30 173 69
Unsplash图片描述与索引数据集_Unsplash_Image_Description_and_Index 数据来源:互联网公开数据 标签:图像描述, 图像识别, 计算机视觉, 图像检索, 数据集, 文本-图像, 语义分析, 图像标注 数据概述: 该数据集包含来自Unsplash平台的图片数据,记录了图片描述信息与对应的图片文件。主要特征如下:... -
文本质量评估多维度分析数据集_Text_Quality_Evaluation_Multi_dimensional_Analysis_Dataset
2025年6月28日 30 89 65
文本质量评估多维度分析数据集_Text_Quality_Evaluation_Multi_dimensional_Analysis_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言评估, 机器学习, 自然语言处理, 文本质量, 语义分析, 写作质量, 多模态数据 数据概述:... -
维基百科主题与类别数据集
2025年6月1日 30 181 48
维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political... -
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集
2025年6月1日 30 23 20
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集 数据来源:互联网公开数据 标签:句子嵌入,多语言,自然语言处理,NLP,机器学习,文本相似度,语义分析,UKPLab 数据概述: 本数据集包含多语言句子嵌入模型DistilUSE-base-multilingual-... -
Unsplash图像数据集及元数据-2023
2025年5月31日 30 27 0
Unsplash图像数据集及元数据-2023 数据来源:互联网公开数据 标签:Unsplash,图像,元数据,关键词,视觉搜索,图像质量,相机,镜头,语义分析,教育,研究 数据概述:... -
教育内容主题与内容相关性分析数据集EducationalContentTopic-ContentRelevanceAnalysis-pingpingniu
2025年5月31日 30 35 20
教育内容主题与内容相关性分析数据集EducationalContentTopic-ContentRelevanceAnalysis-pingpingniu 数据来源:互联网公开数据 标签:教育, 文本匹配, 内容相关性, 机器学习, 知识图谱, 语义分析, 学习资源, 数据标注 数据概述:... -
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109
2025年5月31日 30 134 76
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109 数据来源:互联网公开数据 标签:搜索推荐, 文本匹配, 电商数据, 语义分析, 多语言, 机器学习, 商品搜索, 用户行为 数据概述: 该数据集包含来自电商平台的用户搜索查询与商品信息,记录了用户搜索行为与商品之间的关联性。主要特征如下:... -
人类表型本体HPO相关疾病与基因数据集HumanPhenotypeOntologyHPORelatedDiseaseandGeneDataset-mcasshy
2025年5月31日 30 38 16
人类表型本体HPO相关疾病与基因数据集HumanPhenotypeOntologyHPORelatedDiseaseandGeneDataset-mcasshy 数据来源:互联网公开数据 标签:人类表型本体, HPO, 疾病, 基因, 生物医学, 医疗健康, 语义分析, 数据挖掘 数据概述:... -
学习主题内容关联分析数据集LearningTopicContentAssociationDataset-denissatsuk
2025年5月31日 30 14 10
学习主题内容关联分析数据集LearningTopicContentAssociationDataset-denissatsuk 数据来源:互联网公开数据 标签:教育, 学习, 知识图谱, 文本分析, 内容关联, 自然语言处理, 语义分析, 课程内容 数据概述:... -
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka
2025年5月31日 30 1 0
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 书籍标题, 自然语言处理, 语义分析, 数据降维, 机器学习, 语料库 数据概述: 该数据集包含书籍标题的文本数据及其对应的向量表示,旨在用于文本分析、语义理解和信息检索等任务。主要特征如下:... -
问答事实判断数据集QuestionAnsweringFactVerificationDataset-emam2002
2025年5月30日 30 23 3
问答事实判断数据集QuestionAnsweringFactVerificationDataset-emam2002 数据来源:互联网公开数据 标签:问答系统, 事实核查, 自然语言处理, 文本理解, 机器学习, 语义分析, 语料库, 知识推理 数据概述:...