-
PubMed医学文献数据集PubMedMedicalLiteratureDataset-pjmathematician
PubMed医学文献数据集PubMedMedicalLiteratureDataset-pjmathematician 数据来源:互联网公开数据 标签:医学研究,文献分析,数据集,生物医学,自然语言处理,机器学习,文献挖掘,学术资源... -
人工智能文本检测训练集数据集DetectAITextProcessedTrainEssaysDataset-uraychen
人工智能文本检测训练集数据集DetectAITextProcessedTrainEssaysDataset-uraychen 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,人工智能,文本分析,深度学习,学术研究 数据概述:... -
手语翻译数据集GLOFE-How2Sign-lmnggia
手语翻译数据集GLOFE-How2Sign-lmnggia 数据来源:互联网公开数据 标签:手语,翻译,数据集,计算机视觉,自然语言处理,多模态,机器学习,人工智能 数据概述: 该数据集包含来自GLOFE-How2Sign项目的手语视频和对应的文本翻译数据,用于手语翻译和相关研究。主要特征如下:... -
文本处理后Quora问题真伪分类数据集TextProcessedQuoraQuestionPairClassification-ouattaraaboubacar
文本处理后Quora问题真伪分类数据集TextProcessedQuoraQuestionPairClassification-ouattaraaboubacar 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 问答系统, 情感分析, 文本预处理, 机器学习, 数据集, Quora 数据概述:... -
抖音应用评论数据集TikTokAppReviewsDataset-wadedy
抖音应用评论数据集TikTokAppReviewsDataset-wadedy 数据来源:互联网公开数据 标签:社交媒体,应用评论,数据集,情感分析,用户反馈,机器学习,自然语言处理,大数据 数据概述: 该数据集包含来自抖音应用商店的用户评论数据,记录了用户对抖音应用的反馈和评价。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
法律文件检索BKAI数据集2022年法律文本数据集-dintrn
法律文件检索BKAI数据集2022年法律文本数据集-dintrn 数据来源:互联网公开数据 标签:法律文件,检索,BKAI,数据集,文本分析,自然语言处理,法律研究,人工智能 数据概述:该数据集包含来自BKAI(百度知识智能)的法律文档数据,记录了大量法律文件的详细信息,适用于法律文件检索、文本分析等任务。主要特征如下:... -
鸟类声音识别与分类数据集BirdSoundRecognitionandClassificationDataset-gary0526
鸟类声音识别与分类数据集BirdSoundRecognitionandClassificationDataset-gary0526 数据来源:互联网公开数据 标签:鸟类, 声音识别, 生物多样性, 音频分析, 机器学习, 声音分类, 自然语言处理, 数据标注 数据概述:... -
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie 数据来源:互联网公开数据 标签:语言校对, 文本处理, 词汇纠错, 语法检查, 自然语言处理, 语言模型, 词典, 数据集 数据概述:... -
巴基斯坦新闻摘要生成文本数据集PakistanNewsSummaryGenerationTextDataset-nguyenvuthanhtung
巴基斯坦新闻摘要生成文本数据集PakistanNewsSummaryGenerationTextDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:新闻摘要, 文本生成, 自然语言处理, 新闻事件, 文本分析, 摘要生成, 深度学习, 数据集 数据概述:... -
千言实体链接预处理数据集-kejiewang
千言实体链接预处理数据集-kejiewang 数据来源:互联网公开数据 标签:自然语言处理,实体链接,数据集,中文,文本处理,信息抽取,知识图谱,预处理 数据概述: 该数据集包含经过预处理的中文文本数据,旨在用于实体链接任务。数据的主要特征如下: 时间跨度:数据未明确标注时间范围,主要聚焦于文本内容本身。... -
金融新闻情感分析测试数据集FinancialNewsSentimentAnalysisTestDataset-danruan
金融新闻情感分析测试数据集FinancialNewsSentimentAnalysisTestDataset-danruan 数据来源:互联网公开数据 标签:情感分析, 金融新闻, 文本分类, 自然语言处理, 机器学习, 情感标注, 金融科技, 语料库 数据概述:... -
俄语新闻文本情感分析数据集RussianNewsTextSentimentAnalysis-verabuylova
俄语新闻文本情感分析数据集RussianNewsTextSentimentAnalysis-verabuylova 数据来源:互联网公开数据 标签:情感分析, 俄语, 新闻文本, 文本分类, 自然语言处理, 舆情分析, 机器学习, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语新闻文本,记录了不同新闻报道的内容。主要特征如下:... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-hashrin
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-hashrin 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 自然语言处理, 情感分类, 数据标注, 观点挖掘, 机器学习 数据概述: 该数据集包含来自社交媒体平台的用户文本数据,记录了用户发布的内容及其对应的情感极性。主要特征如下:... -
语音识别训练数据集SpeechRecognitionTrainingDataset-ashmitsatpute
语音识别训练数据集SpeechRecognitionTrainingDataset-ashmitsatpute 数据来源:互联网公开数据 标签:语音识别, 语音数据, 自然语言处理, 声学模型, 文本转录, 数据清洗, 多语言, 情感分析 数据概述: 该数据集包含来自 Mozilla Common Voice... -
问答文本相似度分析嵌入数据集QuestionSimilarityAnalysisEmbeddingDataset-parthmshah1302
问答文本相似度分析嵌入数据集QuestionSimilarityAnalysisEmbeddingDataset-parthmshah1302 数据来源:互联网公开数据 标签:文本相似度, 问答匹配, 自然语言处理, 嵌入向量, 文本特征, 机器学习, 数据挖掘, 文本分类 数据概述:... -
越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree
越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 语料库, 信息检索, 语言模型, 数据集 数据概述: 该数据集包含来自越南语问答系统的数据,记录了越南语问题及其对应的标识符。主要特征如下:... -
新闻文本多主题分类数据集NewsTextMulti-topicClassification-biekongxiang
新闻文本多主题分类数据集NewsTextMulti-topicClassification-biekongxiang 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 多分类, 自然语言处理, 机器学习, 情感分析, 深度学习, 语料库 数据概述: 该数据集包含来自互联网的新闻文章文本,记录了不同主题的新闻内容,用于文本分类任务。主要特征如下:... -
科技论文摘要生成数据集ScientificPaperAbstractGeneration-mridul3301
科技论文摘要生成数据集ScientificPaperAbstractGeneration-mridul3301 数据来源:互联网公开数据 标签:文本生成, 摘要, 自然语言处理, 机器翻译, 论文写作, 深度学习, 语料库, 学术研究 数据概述: 该数据集包含来自学术论文的数据,记录了论文原文与对应的摘要。主要特征如下:... -
计算机视觉与语言处理集成模型CLIP数据集CLIPDataset-junchonghuang
计算机视觉与语言处理集成模型CLIP数据集CLIPDataset-junchonghuang 数据来源:互联网公开数据 标签:计算机视觉,自然语言处理,数据集,深度学习,图像文本匹配,多模态学习,人工智能,数据挖掘 数据概述: 该数据集由OpenAI的CLIP(Computer Vision and Language Processing... -
文本可读性评估训练数据集TextReadabilityAssessmentTrainingDataset-siminrao
文本可读性评估训练数据集TextReadabilityAssessmentTrainingDataset-siminrao 数据来源:互联网公开数据 标签:文本可读性, 自然语言处理, 文本分析, 机器学习, 文本难度, 语言模型, 数据集, 训练数据 数据概述:...