-
中国共产党建国前后舆情分析数据集CCPFoundingEraPublicOpinionAnalysis-roxanneylin
中国共产党建国前后舆情分析数据集CCPFoundingEraPublicOpinionAnalysis-roxanneylin 数据来源:互联网公开数据 标签:舆情分析, 历史事件, 政治评论, 文本挖掘, 情感分析, 新闻报道, 数据集, 语义分析 数据概述:... -
俄语文本情感分析与语义理解数据集RussianTextSentimentAnalysisandSemanticUnderstandingDataset-yaustal
俄语文本情感分析与语义理解数据集RussianTextSentimentAnalysisandSemanticUnderstandingDataset-yaustal 数据来源:互联网公开数据 标签:俄语, 文本情感分析, 语义分析, 自然语言处理, 文本语料库, 情感标注, 词性标注, 文本挖掘 数据概述:... -
电影对白关系数据集FLMPairsDataset-himanshunayal
电影对白关系数据集FLMPairsDataset-himanshunayal 数据来源:互联网公开数据 标签:电影,对白,关系,自然语言处理,文本分析,数据集,语义分析,机器学习 数据概述: 该数据集包含了电影对白配对数据,旨在研究电影对白之间的关系。主要特征如下: 时间跨度:数据涵盖了不同年份上映的电影。 地理范围:数据来源于全球电影作品。... -
文本向量化文档数据集TextVectorizationDocumentDataset-ayushsingh488
文本向量化文档数据集TextVectorizationDocumentDataset-ayushsingh488 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, FastText, 语义分析, 文本挖掘, 机器学习, 自然语言处理, 向量空间 数据概述: 该数据集包含经过FastText模型处理的文本向量,记录了文档的向量化表示。主要特征如下:... -
公司高管薪酬与企业社会责任文本分析数据集CorporateExecutiveCompensationandCSRTextAnalysis-jiujiu99999
公司高管薪酬与企业社会责任文本分析数据集CorporateExecutiveCompensationandCSRTextAnalysis-jiujiu99999 数据来源:互联网公开数据 标签:高管薪酬, 企业社会责任, 文本分析, 财务分析, 风险管理, 合规性, 机器学习, 语义分析 数据概述:... -
Quora问答社区词向量处理数据集QuoraWord2VecProcessedDataDataset-siddhantsoam
Quora问答社区词向量处理数据集QuoraWord2VecProcessedDataDataset-siddhantsoam 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,语义分析,机器学习,Quora,知识图谱 数据概述: 该数据集包含了Quora问答社区中经过处理的文本数据,旨在用于词向量模型的训练和应用。主要特征如下:... -
BERT嵌入测试数据集-khushigupta1605
BERT嵌入测试数据集-khushigupta1605 数据来源:互联网公开数据 标签:自然语言处理,文本嵌入,数据集,BERT,语义分析,机器学习,文本分类,情感分析 数据概述: 该数据集包含用于测试BERT模型生成的文本嵌入的数据,旨在评估BERT模型在不同文本任务中的表现。主要特征如下:... -
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 数据标注, 机器学习, 对比分析, 语料库 数据概述:... -
教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau
教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau 数据来源:互联网公开数据 标签:写作评估, 文本分析, 教育, 论文分析, 语义分析, 关键词提取, 自然语言处理, 机器学习 数据概述:... -
词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju
词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,语义分析,向量空间,NLP 数据概述: 该数据集包含了使用Word2Vec模型训练得到的词向量结果,主要记录了词汇与其对应的向量表示。主要特征如下:... -
问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar
问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 问答系统, 语义分析, 文本分类, 机器学习, 深度学习, 数据标注 数据概述:... -
图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj
图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj 数据来源:互联网公开数据 标签:图像描述, 文本嵌入, 计算机视觉, 自然语言处理, 图像检索, 语义分析, 深度学习, 多模态 数据概述:... -
英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg
英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,数据集,语言模型,文本生成,语义分析,人工智能 数据概述:... -
新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik
新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 语料库, 新闻文章, 语义分析 数据概述: 该数据集包含来自 GigaWord... -
阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal
阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal 数据来源:互联网公开数据 标签:阿拉伯语, 文本分析, 文本对比, 自然语言处理, 语言学, 语料库, 文本挖掘, 语义分析 数据概述: 该数据集包含来自不同来源的阿拉伯语文本,记录了用于文本对比分析的语料。主要特征如下:... -
维基百科内容数据集WikiDataset-selcukcan
维基百科内容数据集WikiDataset-selcukcan 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,知识图谱,语义分析 数据概述: 该数据集包含来自维基百科的文本内容,记录了维基百科上的文章、条目及相关信息。主要特征如下: 时间跨度:数据记录的时间范围从维基百科创建至今(动态更新)。... -
问答文本语义相似度判别数据集QuestionAnsweringTextSemanticSimilarity-phamhaithang
问答文本语义相似度判别数据集QuestionAnsweringTextSemanticSimilarity-phamhaithang 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 问答系统, 语义分析, 机器学习, 文本分类, 数据标注, 语料库 数据概述:... -
文本相似度匹配数据集TextSimilarityMatchingDataset-pupilshuo
文本相似度匹配数据集TextSimilarityMatchingDataset-pupilshuo 数据来源:互联网公开数据 标签:文本匹配, 自然语言处理, 语义分析, 相似度计算, 文本对, 数据标注, 机器学习, 对比分析 数据概述: 该数据集包含来自互联网公开数据,记录了用于训练和评估文本相似度匹配模型的文本对。主要特征如下:... -
文本相似度判断数据集TextSimilarityJudgmentDataset-shaffaka
文本相似度判断数据集TextSimilarityJudgmentDataset-shaffaka 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 二分类, 语义分析, 数据集, 机器学习, 语料库 数据概述: 该数据集包含从多个来源收集的文本对,记录了用于判断文本对之间相似度的结构化示例。主要特征如下:... -
数据512维度的嵌入向量数据集Embedding-512-2Dataset-bankit1234
512维度的嵌入向量数据集Embedding-512-2Dataset-bankit1234 数据来源:互联网公开数据 标签:文本嵌入,语义分析,自然语言处理,机器学习,向量表示,深度学习,数据集,特征提取 数据概述: 该数据集包含512维度的文本嵌入向量,用于表示文本的语义信息。主要特征如下:...