-
亚马逊商品评论情感分析增强数据集AmazonReviewPolaritySentimentAnalysisEnhancedDataset-deepkumarprasad
亚马逊商品评论情感分析增强数据集AmazonReviewPolaritySentimentAnalysisEnhancedDataset-deepkumarprasad 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 评论分析, 语义分析, 情感极性, 机器学习, 自然语言处理, 数据增强 数据概述:... -
农民查询分析数据集KisanQueryAnalysisDataset-anirudhvadakedath
农民查询分析数据集KisanQueryAnalysisDataset-anirudhvadakedath 数据来源:互联网公开数据 标签:农业,数据集,查询分析,自然语言处理,数据挖掘,语义分析,农民服务,信息检索 数据概述: 该数据集包含来自Kisan平台的用户查询数据,记录了农民在平台上提出的各种问题。主要特征如下:... -
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器翻译,语言模型,多语言数据集,机器学习,语义分析,人工智能 数据概述: 该数据集包含来自波斯语领域的文本改写数据,记录了波斯语文本的改写和翻译对。主要特征如下:... -
TinyBERT文本相似度计算数据集-ktgiahieu
TinyBERT文本相似度计算数据集-ktgiahieu 数据来源:互联网公开数据 标签:文本相似度,自然语言处理,数据集,语义分析,机器翻译,深度学习,文本分析,语言模型 数据概述: 该数据集是用于训练和评估基于TinyBERT模型的文本相似度计算任务的数据集。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本数据。... -
图像识别标注阿拉伯语数据集ImageRecognitionAnnotatedArabicDataset-logainsaleem
图像识别标注阿拉伯语数据集ImageRecognitionAnnotatedArabicDataset-logainsaleem 数据来源:互联网公开数据 标签:图像识别, 阿拉伯语, 文本标注, 计算机视觉, 语义分析, 数据集, 机器学习, 自然语言处理 数据概述:... -
医学文本嵌入数据集-kwyrob
医学文本嵌入数据集-kwyrob 数据来源:互联网公开数据 标签:医学,文本,嵌入,自然语言处理,深度学习,医学信息学,生物医学,语义分析 数据概述: 该数据集包含用于医学文本嵌入的数据,旨在为医学领域的自然语言处理任务提供支持。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了医学文献、病例报告、临床试验摘要等多种来源。... -
文本向量化嵌入数据集TextVectorizationEmbeddingDataset-louvalita
文本向量化嵌入数据集TextVectorizationEmbeddingDataset-louvalita 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 语义分析, 自然语言处理, 机器学习, 文本挖掘, 向量空间模型, 语料库 数据概述:... -
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing 数据来源:互联网公开数据 标签:古文阅读, 文本理解, 语言模型, 中文NLP, 考试测评, 语义分析, 机器阅读理解, 知识问答 数据概述:... -
文本嵌入数据集TextEmbeddingDataset-krishnanpalanisami
文本嵌入数据集TextEmbeddingDataset-krishnanpalanisami 数据来源:互联网公开数据 标签:文本数据,嵌入,自然语言处理,机器学习,语义分析,向量化,文本挖掘,深度学习 数据概述: 该数据集包含文本及其对应的嵌入向量,旨在为自然语言处理任务提供基础数据。主要特征如下:... -
语言工具-6数据集LanguageTool-6Dataset-tsobolev
语言工具-6数据集LanguageTool-6Dataset-tsobolev 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,语法检查,机器学习,语义分析,文本纠错 数据概述: 该数据集由语言工具-6项目提供,主要包含用于语言处理的文本数据,适用于文本分析、语法检查等任务。主要特征如下:... -
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99
维基百科中文版处理数据集ProcessedWikihowChineseDataset-akumar99 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,文本分类,语义分析,中文处理,信息提取 数据概述: 该数据集包含来自维基百科中文版的数据,经过处理和清洗,记录了维基百科中的大量中文文本内容。主要特征如下: 时间跨度:... -
问答社区问题文本真伪识别数据集QuestionTextSincere-InsincereClassification-gayatrisrinivasan
问答社区问题文本真伪识别数据集QuestionTextSincere-InsincereClassification-gayatrisrinivasan 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 问答社区, 情感分析, 垃圾信息检测, 机器学习, 数据标注, 语义分析 数据概述:... -
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222 数据来源:互联网公开数据 标签:文本嵌入, 写作评估, 语义分析, 深度学习, 语言模型, 自然语言处理, 文本相似度, 情感分析 数据概述:... -
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25 数据来源:互联网公开数据 标签:文本嵌入, 语义分析, 自然语言处理, 深度学习, 向量空间, 语料库, 数据预处理, 机器翻译 数据概述: 该数据集包含经过处理的文本语料库数据及其对应的嵌入向量表示。主要特征如下:... -
文本相似度判断训练数据集TextSimilarityJudgementTrainingDataset-gloriara2
文本相似度判断训练数据集TextSimilarityJudgementTrainingDataset-gloriara2 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 机器学习, 数据集, 文本对, 二分类 数据概述: 该数据集包含从互联网收集的文本对,用于训练和评估文本相似度判断模型。主要特征如下:... -
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234
跨编码器分段数据集Cross-EncoderDatasetSegmented-epsilon1234 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,深度学习,语义分析,信息检索,文本挖掘 数据概述: 该数据集包含用于跨编码器模型的分段文本数据,记录了经过处理的文本片段及其对应的分类标签或语义关系。主要特征如下:... -
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj 数据来源:互联网公开数据 标签:文本转换, 问答系统, 文本摘要, 语义分析, 文本生成, 自然语言处理, 数据清洗, 机器翻译 数据概述:... -
专利文本相似度分析数据集PatentTextSimilarityAnalysis-aleron751
专利文本相似度分析数据集PatentTextSimilarityAnalysis-aleron751 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义分析, 机器学习, 文本匹配, 专利检索, 数据集 数据概述: 该数据集包含来自专利文献的文本数据,用于评估专利文本之间的相似度。主要特征如下:... -
写作评估与生成文本分析数据集WritingAssessment-GeneratedTextAnalysisDataset-aryansingh0301
写作评估与生成文本分析数据集WritingAssessment-GeneratedTextAnalysisDataset-aryansingh0301 数据来源:互联网公开数据 标签:写作评估, 文本生成, 自然语言处理, 机器写作, 写作质量, 语义分析, 教育, 文本对比 数据概述:... -
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen 数据来源:互联网公开数据 标签:问题相似度, 文本预处理, 自然语言处理, 问答系统, 文本分类, 语义分析, 数据清洗, 机器学习 数据概述:...