找到18,248个数据集

标签: JSON

过滤结果
  • 跨编码器数据集Cross-EncoderDataset-epsilon12345

    2025年5月28日   

    跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:...
    packageimg
  • NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview

    2025年5月28日   

    NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:...
    packageimg
  • IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl

    2025年5月28日   

    IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,数据集,论点识别,机器学习,语义分析,学术研究,文本分类 数据概述: 该数据集来源于IBM Debater项目,专注于从文本中提取和识别论点句子。主要特征如下:...
    packageimg
  • 人机对话大型语言模型数据集NewHuman-LLMDataset-hozaifazaki99

    2025年5月28日   

    人机对话大型语言模型数据集NewHuman-LLMDataset-hozaifazaki99 数据来源:互联网公开数据 标签:人机对话,大型语言模型,数据集,自然语言处理,对话生成,情感分析,文本理解,人工智能 数据概述: 该数据集包含人与大型语言模型(LLM)之间的对话记录,旨在促进对LLM在各种对话场景下的性能评估和改进。主要特征如下:...
    packageimg
  • 恶意软件检测数据集-smmurshedmanik

    2025年5月28日   

    恶意软件检测数据集-smmurshedmanik 数据来源:互联网公开数据 标签:恶意软件,数据集,恶意代码分析,机器学习,网络安全,威胁情报,行为分析,安全研究 数据概述: 该数据集包含恶意软件样本的详细信息,用于恶意软件检测和分析研究。主要特征如下: 时间跨度: 数据记录的时间范围,从过去几年至今。 地理范围: 数据覆盖全球范围内的恶意软件样本。...
    packageimg
  • SquadV2增强比例检查数据集SquadV2AugmentedProportionCheckDataset-lachonman2

    2025年5月28日   

    SquadV2增强比例检查数据集SquadV2AugmentedProportionCheckDataset-lachonman2 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,文本增强,机器学习,数据质量,自动化评估,深度学习 数据概述: 该数据集基于Squad...
    packageimg
  • Music4all音乐数据集无音频和歌词-revhari

    2025年5月28日   

    Music4all音乐数据集无音频和歌词-revhari 数据来源:互联网公开数据 标签:音乐,数据集,音乐信息检索,推荐系统,机器学习,音乐特征,音频分析,数据分析 数据概述: 该数据集包含来自Music4all项目的音乐信息数据,记录了大量音乐作品的元数据和特征信息,但不包含音频文件和歌词。主要特征如下:...
    packageimg
  • DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99

    2025年5月28日   

    DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation...
    packageimg
  • 时空图卷积网络ASTGCNPyTorch实现数据集ASTGCNPyTorchDataset-hungtran41148

    2025年5月28日   

    时空图卷积网络ASTGCNPyTorch实现数据集ASTGCNPyTorchDataset-hungtran41148 数据来源:互联网公开数据 标签:时空图卷积网络, 数据集, 交通预测, 深度学习, 网络结构, 人工智能, 交通工程, 时空分析 数据概述:...
    packageimg
  • 强研实体链接数据集QiangyanEntityLinkingDataset-kejiewang

    2025年5月28日   

    强研实体链接数据集QiangyanEntityLinkingDataset-kejiewang 数据来源:互联网公开数据 标签:实体链接,自然语言处理,数据集,知识图谱,机器学习,语义理解,信息检索,数据挖掘 数据概述: 该数据集由强研项目提供,专注于实体链接任务,记录了文本中的实体与知识图谱中实体的对应关系。主要特征如下:...
    packageimg
  • 数据提取竞赛数据集DataExtractionCompetitionDataset-shirshaka

    2025年5月28日   

    数据提取竞赛数据集DataExtractionCompetitionDataset-shirshaka 数据来源:互联网公开数据 标签:数据提取,竞赛数据,数据集,信息提取,机器学习,自然语言处理,数据挖掘,人工智能 数据概述: 该数据集来源于一次数据提取竞赛,专注于从文本、表格或其他非结构化数据中提取结构化信息。主要特征如下:...
    packageimg
  • 越南语句情感分析数据集-taitruong256

    2025年5月28日   

    越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。...
    packageimg
  • 人工智能生成文本对比人类文本清洗数据集-dillonwongso

    2025年5月28日   

    人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源:互联网公开数据 标签:人工智能,文本生成,文本清洗,数据集,自然语言处理,机器学习,文本分析,对比研究 数据概述: 该数据集包含来自不同来源的人工智能生成文本和人类编写的文本,并经过清洗处理,旨在用于比较分析。主要特征如下:...
    packageimg
  • 大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan

    2025年5月28日   

    大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:...
    packageimg
  • 标题:博物馆藏品信息整合数据集(Museum Consolidated Dataset)

    2025年5月28日   

    标题:博物馆藏品信息整合数据集(Museum Consolidated Dataset) 数据来源:互联网公开数据 标签:博物馆,藏品,数据集,文化遗产,文物,艺术品,历史,数据库 数据概述: 该数据集整合了来自多个博物馆的藏品信息,旨在提供一个全面的博物馆藏品数据库。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了从古代至今的藏品。 地理范围:...
    packageimg
  • 多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha

    2025年5月28日   

    多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 多语言, 语音翻译, 机器学习, 语料库, 印度语言, 声学模型 数据概述:...
    packageimg
  • 深度学习对抗样本生成数据集DeepLearningAdversarialSampleGenerationDataset-franksalazar

    2025年5月28日   

    深度学习对抗样本生成数据集DeepLearningAdversarialSampleGenerationDataset-franksalazar 数据来源:互联网公开数据 标签:对抗样本, 深度学习, 图像识别, 模型攻击, 模型防御, 机器学习, 数据集, 计算机视觉 数据概述:...
    packageimg
  • 临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda

    2025年5月28日   

    临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda 数据来源:互联网公开数据 标签:医疗健康,电子病历,三元组,深度学习,自然语言处理,文本挖掘,医学研究,知识图谱 数据概述: 该数据集包含用于训练临床电子病历(Electronic Health Record,...
    packageimg
  • 虚假与真实新闻数据集-noyeemhossain135

    2025年5月28日   

    虚假与真实新闻数据集-noyeemhossain135 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,数据挖掘 数据概述:该数据集包含来自互联网上的新闻文章,记录了虚假新闻和真实新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了新闻文章的发布时间。...
    packageimg
  • 自行车骑行数据数据集CycleDataSets-roryhargaden

    2025年5月28日   

    自行车骑行数据数据集CycleDataSets-roryhargaden 数据来源:互联网公开数据 标签:骑行数据,运动健康,数据集,时间序列,运动分析,物联网,健身追踪,数据分析 数据概述: 该数据集包含来自多个骑行活动或健身追踪设备的数据,记录了自行车骑行的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg