-
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:... -
IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl
IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,数据集,论点识别,机器学习,语义分析,学术研究,文本分类 数据概述: 该数据集来源于IBM Debater项目,专注于从文本中提取和识别论点句子。主要特征如下:... -
文本相似度判断数据集TextSimilarityJudgmentDataset-srinu513
文本相似度判断数据集TextSimilarityJudgmentDataset-srinu513 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 句子对, 语义分析, 机器学习, 数据标注, 文本匹配, 深度学习 数据概述: 该数据集包含用于评估文本相似度的句子对,记录了两个句子之间的语义相似程度。主要特征如下:... -
文本转录及大纲数据集TranscriptswithOutlinesDataset-sriyakalyan
文本转录及大纲数据集TranscriptswithOutlinesDataset-sriyakalyan 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,转录,大纲,内容摘要,语义分析,机器学习 数据概述: 该数据集包含文本转录及其对应的大纲信息,旨在促进文本分析和自然语言处理领域的研究。主要特征如下:... -
生物医学文本语义相似度评估数据集BiomedicalTextSemanticSimilarityEvaluationDataset-marght
生物医学文本语义相似度评估数据集BiomedicalTextSemanticSimilarityEvaluationDataset-marght 数据来源:互联网公开数据 标签:生物医学, 文本相似度, 语义分析, 预训练模型, 评估, 机器学习, BERT, 性能评估 数据概述:... -
维基百科百科全书数据集WikipediaEncyclopediaDataset-jayaprakashpondy
维基百科百科全书数据集WikipediaEncyclopediaDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:百科全书,数据集,文本分析,知识图谱,自然语言处理,机器学习,信息检索,语义分析 数据概述: 该数据集包含来自维基百科的百科全书数据,记录了维基百科收录的各类知识条目及其详细信息。主要特征如下:... -
维基百科表格问题数据集WikiTableQuestionsDataset-kegiazabal001
维基百科表格问题数据集WikiTableQuestionsDataset-kegiazabal001 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,表格理解,语义分析,知识图谱,机器学习,文本挖掘 数据概述: 该数据集包含来自维基百科的表格和基于这些表格提出的问题,旨在用于训练和评估问答系统在结构化数据上的表现。主要特征如下:... -
问答匹配越南语数据集QuestionAnsweringVietnameseDataset-ictworld
问答匹配越南语数据集QuestionAnsweringVietnameseDataset-ictworld 数据来源:互联网公开数据 标签:问答匹配, 文本相似度, 越南语, 自然语言处理, 对话理解, 语义分析, 机器学习, 文本分类 数据概述: 该数据集包含用于训练和评估越南语问答匹配模型的文本数据,主要记录了问题、上下文和标签。主要特征如下:... -
自然语言处理与话题建模数据集NLPTopicModellingDataset-hj5992
自然语言处理与话题建模数据集NLPTopicModellingDataset-hj5992 数据来源:互联网公开数据 标签:自然语言处理,话题建模,数据集,文本分析,机器学习,文本挖掘,语义分析,信息提取 数据概述: 该数据集包含自然语言处理领域的话题建模数据,记录了文本内容及其对应的话题标签。主要特征如下:... -
亚马逊商品评论情感分析增强数据集AmazonReviewPolaritySentimentAnalysisEnhancedDataset-deepkumarprasad
亚马逊商品评论情感分析增强数据集AmazonReviewPolaritySentimentAnalysisEnhancedDataset-deepkumarprasad 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 评论分析, 语义分析, 情感极性, 机器学习, 自然语言处理, 数据增强 数据概述:... -
农民查询分析数据集KisanQueryAnalysisDataset-anirudhvadakedath
农民查询分析数据集KisanQueryAnalysisDataset-anirudhvadakedath 数据来源:互联网公开数据 标签:农业,数据集,查询分析,自然语言处理,数据挖掘,语义分析,农民服务,信息检索 数据概述: 该数据集包含来自Kisan平台的用户查询数据,记录了农民在平台上提出的各种问题。主要特征如下:... -
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器翻译,语言模型,多语言数据集,机器学习,语义分析,人工智能 数据概述: 该数据集包含来自波斯语领域的文本改写数据,记录了波斯语文本的改写和翻译对。主要特征如下:... -
TinyBERT文本相似度计算数据集-ktgiahieu
TinyBERT文本相似度计算数据集-ktgiahieu 数据来源:互联网公开数据 标签:文本相似度,自然语言处理,数据集,语义分析,机器翻译,深度学习,文本分析,语言模型 数据概述: 该数据集是用于训练和评估基于TinyBERT模型的文本相似度计算任务的数据集。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本数据。... -
图像识别标注阿拉伯语数据集ImageRecognitionAnnotatedArabicDataset-logainsaleem
图像识别标注阿拉伯语数据集ImageRecognitionAnnotatedArabicDataset-logainsaleem 数据来源:互联网公开数据 标签:图像识别, 阿拉伯语, 文本标注, 计算机视觉, 语义分析, 数据集, 机器学习, 自然语言处理 数据概述:... -
医学文本嵌入数据集-kwyrob
医学文本嵌入数据集-kwyrob 数据来源:互联网公开数据 标签:医学,文本,嵌入,自然语言处理,深度学习,医学信息学,生物医学,语义分析 数据概述: 该数据集包含用于医学文本嵌入的数据,旨在为医学领域的自然语言处理任务提供支持。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了医学文献、病例报告、临床试验摘要等多种来源。... -
文本向量化嵌入数据集TextVectorizationEmbeddingDataset-louvalita
文本向量化嵌入数据集TextVectorizationEmbeddingDataset-louvalita 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 语义分析, 自然语言处理, 机器学习, 文本挖掘, 向量空间模型, 语料库 数据概述:... -
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing 数据来源:互联网公开数据 标签:古文阅读, 文本理解, 语言模型, 中文NLP, 考试测评, 语义分析, 机器阅读理解, 知识问答 数据概述:... -
文本嵌入数据集TextEmbeddingDataset-krishnanpalanisami
文本嵌入数据集TextEmbeddingDataset-krishnanpalanisami 数据来源:互联网公开数据 标签:文本数据,嵌入,自然语言处理,机器学习,语义分析,向量化,文本挖掘,深度学习 数据概述: 该数据集包含文本及其对应的嵌入向量,旨在为自然语言处理任务提供基础数据。主要特征如下:... -
语言工具-6数据集LanguageTool-6Dataset-tsobolev
语言工具-6数据集LanguageTool-6Dataset-tsobolev 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,语法检查,机器学习,语义分析,文本纠错 数据概述: 该数据集由语言工具-6项目提供,主要包含用于语言处理的文本数据,适用于文本分析、语法检查等任务。主要特征如下:... -
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,文本分类,语义分析,中文处理,信息提取 数据概述: 该数据集包含来自维基百科中文版的数据,经过处理和清洗,记录了维基百科中的大量中文文本内容。主要特征如下: 时间跨度:...