-
德国联邦宪法法院平衡语言使用分析附录与复现数据集
2025年12月23日 30 100 25
数据集概述 本数据集包含论文《平衡是否为司法能动主义的手段?德国联邦宪法法院平衡语言使用分析》的在线附录与复现数据,采用文本数据方法(如词嵌入)分析司法推理,验证平衡语言与司法能动主义的关联,为相关法律研究提供实证支持。 文件详解 文件名称: replication.zip 文件格式: ZIP压缩包 内容说明:...
-
Stanford_GloVe_6B_Based_多维度词向量预训练完整数据
2025年12月21日 30 76 21
数据集概述 本数据集为GloVe 6B词向量,基于维基百科2014和Gigaword 5语料(共60亿个词元)训练生成,包含40万个词汇,提供50维、100维、200维、300维四种维度的词向量,已转换为gensim二进制格式并压缩为ZIP文件。 文件详解...
-
西班牙语历时词用法图数据集DWUG_ES
2025年12月5日 30 111 27
数据集概述 该数据集包含西班牙语的历时词用法图(WUGs),提供词用法随时间变化的结构化数据,支持语义变化研究。版本为4.0.2,含修正后的词上下文、索引及匿名化标注,通过压缩包形式存储。 文件详解 文件名称:dwug_es.zip 文件格式:ZIP压缩包...
-
词向量语义分析数据集
2025年10月20日 30 32 28
词向量语义分析数据集_Word_Vector_Semantic_Analysis_Dataset 数据来源:互联网公开数据 标签:词向量, 语义分析, 自然语言处理, 文本挖掘, 机器学习, 词嵌入, 语言模型, 情感分析 数据概述: 该数据集包含预训练的词向量数据,记录了词汇的语义表示,适用于各种自然语言处理任务。主要特征如下:...
-
深度学习文本数据训练数据集
2025年8月10日 30 131 43
深度学习文本数据训练数据集_Deep_Learning_Text_Data_Training_Dataset 数据来源:互联网公开数据 标签:文本分类, 深度学习, 词嵌入, 数据预处理, 训练集, 验证集, 测试集, 自然语言处理 数据概述: 该数据集包含用于深度学习模型训练和评估的文本数据。主要特征如下:...
-
社交媒体用户文本语义相似度分析数据集
2025年8月10日 30 139 18
社交媒体用户文本语义相似度分析数据集_Social_Media_User_Text_Semantic_Similarity_Analysis 数据来源:互联网公开数据 标签:文本分析, 语义相似度, 词嵌入, 自然语言处理, 社交媒体, 数据挖掘, 机器学习, 向量空间模型 数据概述:...
-
文本向量化词嵌入矩阵数据集_Text_Vectorization_Word_Embedding_Matrix
2025年6月28日 30 4 1
文本向量化词嵌入矩阵数据集_Text_Vectorization_Word_Embedding_Matrix 数据来源:互联网公开数据 标签:词嵌入, 文本向量化, 自然语言处理, 深度学习, 机器翻译, 文本分析, 词汇表, 嵌入矩阵 数据概述: 该数据集包含用于自然语言处理任务的词嵌入矩阵和词汇索引信息。主要特征如下:...
-
Reddit评论得分预测数据集-2021-ehallmar
2025年6月4日 30 164 5
Reddit评论得分预测数据集-2021-ehallmar 数据来源:互联网公开数据 标签:Reddit,评论,预测,机器学习,神经网络,BOW,词嵌入,LSTM,数据集,高赞评论,低赞评论 数据概述:...
-
慕课视频讲座嵌入向量与主题分布数据集-200门课程-saurabhshahane
2025年5月31日 30 74 44
慕课视频讲座嵌入向量与主题分布数据集-200门课程-saurabhshahane 数据来源:互联网公开数据 标签:MOOC,慕课,视频讲座,自然语言处理,Word2Vec,LDA,Gensim,词嵌入,主题分布,教育,在线学习 数据概述:...
-
蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr
2025年5月31日 30 199 175
蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr 数据来源:互联网公开数据 标签:蛋白质,功能分析,TF-IDF,词嵌入,词汇表,科学数据 数据概述: 本数据集名为“Abstract_embeds_final”,收录了蛋白质功能分析相关的研究抽象文本嵌入及词汇表信息。数据集中包含了蛋白质ID和对应的Go词汇表术语,用于构建TF-...
-
土耳其新闻摘要句子数据集-serdarcaglar
2025年5月31日 30 55 4
土耳其新闻摘要句子数据集-serdarcaglar 数据来源:互联网公开数据 标签:土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取 数据概述:...
-
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka
2025年5月31日 30 103 30
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 书籍标题, 自然语言处理, 语义分析, 数据降维, 机器学习, 语料库 数据概述: 该数据集包含书籍标题的文本数据及其对应的向量表示,旨在用于文本分析、语义理解和信息检索等任务。主要特征如下:...
-
词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72
2025年5月30日 30 198 90
词向量共现关系分析数据集WordVectorCo-occurrenceRelationshipAnalysis-qsnlxy72 数据来源:互联网公开数据 标签:词向量, 自然语言处理, 文本分析, 共现矩阵, 词嵌入, 语义关系, 机器学习, 数据挖掘 数据概述: 该数据集包含用于词向量分析的文本数据,记录了词语之间的共现关系。主要特征如下:...
-
越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong
2025年5月30日 30 200 144
越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong 数据来源:互联网公开数据 标签:越南语, 文本语料库, 文本分析, 自然语言处理, 语料库构建, 文本摘要, 词嵌入, 语言模型 数据概述:...
-
梅西与罗纳尔多推特情感分析与词嵌入数据集-2021-ibrahimserouis99
2025年5月7日 30 206 92
梅西与罗纳尔多推特情感分析与词嵌入数据集-2021-ibrahimserouis99 数据来源:互联网公开数据 标签:推特,情感分析,词嵌入,GloVe,Sentiment140,梅西,罗纳尔多,社交媒体,数据分析 数据概述:...
-
斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261
2025年5月30日 30 98 89
斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,斯坦福大学,文本分析,机器学习,深度学习,语义分析 数据概述:...
-
机器翻译模型输入数据预处理数据集MachineTranslationModelInputDataPreprocessing-linshokaku
2025年5月30日 30 94 29
机器翻译模型输入数据预处理数据集MachineTranslationModelInputDataPreprocessing-linshokaku 数据来源:互联网公开数据 标签:机器翻译, 文本数据, 数据预处理, 词嵌入, 自然语言处理, 深度学习, 模型训练, 数据集构建 数据概述:...
-
文本向量化文档数据集TextVectorizationDocumentDataset-ayushsingh488
2025年5月29日 30 132 9
文本向量化文档数据集TextVectorizationDocumentDataset-ayushsingh488 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, FastText, 语义分析, 文本挖掘, 机器学习, 自然语言处理, 向量空间 数据概述: 该数据集包含经过FastText模型处理的文本向量,记录了文档的向量化表示。主要特征如下:...
-
词嵌入情感分析数据集D2VSentimentDataset-magomago
2025年5月29日 30 15 3
词嵌入情感分析数据集D2VSentimentDataset-magomago 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,词嵌入,深度学习,文本分类,机器学习,情感词典 数据概述: 该数据集包含用于情感分析任务的文本数据,结合了分布式词向量(Doc2Vec)技术,旨在研究和评估文本情感的表达和识别。主要特征如下: 时间跨度:...
-
情感分析模型训练与评估数据集SentimentAnalysisModelTrainingandEvaluationDataset-mafazachabane
2025年5月29日 30 131 115
情感分析模型训练与评估数据集SentimentAnalysisModelTrainingandEvaluationDataset-mafazachabane 数据来源:互联网公开数据 标签:情感分析, 文本分类, 深度学习, 情感标签, 模型训练, 词嵌入, 自然语言处理, 数据集 数据概述:...



