找到75个数据集

标签: 文本

过滤结果
  • 人口动态与人口迁移数据集

    2025年12月23日 30 47 8

    数据集概述 本数据集围绕人口动态与人口迁移展开,涵盖人口动态的类型、影响因素,人口迁移的分类(国际与国内)、驱动因素(推拉因素)、主要趋势,以及迁移对人口健康的正负向影响,同时包含全球迁移规模、性别分布、汇款数据等统计信息,为相关研究提供基础内容支持。 文件详解 文件名称: Population dynamics and Population...
    packageimg
  • 泰米尔语表情包恶意内容分类数据集

    2025年12月20日 30 45 11

    数据集概述 本数据集是针对泰米尔语表情包的恶意内容分类资源,包含标注为“恶意”和“非恶意”的表情包图像,以及对应的拉丁转写文本,旨在支持印度语言表情包恶意内容的计算建模研究。 文件详解 文件名称: Tamil_troll_memes-dataset.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 果蝇黑腹果蝇萨塞克斯LHM种群基因组学数据集

    2025年12月20日 30 82 67

    数据集概述 本数据集包含果蝇黑腹果蝇萨塞克斯LHM样本种群遗传学研究的输入数据、代码、输出数据、汇总图表及运行日志,覆盖等位基因频率分布、连锁不平衡、遗传分组等核心分析结果,为种群遗传结构研究提供支持。 文件详解 输入数据文件(PLINK二进制格式):...
    packageimg
  • vcferr_SNP基因分型错误模拟框架复现文档与代码

    2025年12月19日 30 12 5

    数据集概述 本数据集包含用于复现"vcferr: SNP基因分型错误模拟框架的开发、验证与应用"研究分析的文档与代码文件,提供了从模拟框架构建到结果验证的完整复现资源。 文件详解 文档文件: README.pdf:PDF格式,提供复现研究分析的分步说明 代码与配置文件: Snakefile:无扩展名,可能为工作流管理文件...
    packageimg
  • Urban_PLUMBER项目20个城市通量塔站点协调补全数据集

    2025年12月11日 30 53 31

    数据集概述 本数据集为Urban-PLUMBER项目的协调补全数据集,包含20个城市通量塔站点的观测数据、模型初始化数据及站点特征数据,覆盖澳大利亚、加拿大、芬兰等多国城市,为城市能量与碳通量研究提供标准化数据支持。 文件详解 完整数据集(Full...
    packageimg
  • CVL_Ruling_Database_Based_基于ICDAR2013手写分割ruling数据集

    2025年12月9日 30 17 9

    数据集概述 该数据集为合成生成的CVL ruling数据集,用于比较不同的ruling去除方法。基于ICDAR 2013手写分割数据库,通过添加四种不同ruling图像生成六百张测试图像,包含背景、ruling、文本及重叠区域的像素值定义。 文件详解 文件名称: cvl-ruling-database.zip 文件格式: ZIP (.zip)...
    packageimg
  • ARASAAC黑白象形图数据集第七部分

    2025年12月8日 30 127 11

    数据集概述 该数据集为ARASAAC黑白象形图系列的第七部分,包含一千张由Sergio Palao创建的黑白PNG格式象形图,覆盖生物学、医学、图像视觉等多领域语义主题,无目录层级与数据划分。 文件详解 核心文件: 共一千个PNG格式文件,均为黑白象形图,无目录结构 文件示例:...
    packageimg
  • 红藻Ceramieae族系统发育分析样本信息与GenBank登录号附录

    2025年12月7日 30 49 9

    数据集概述 本数据集为红藻Ceramieae族系统发育分析研究的附录文件,包含样本信息与GenBank登录号。记录了多种红藻(如Campylaephora、Carpoblepharis、Centroceras等属)的采集地点、日期、采集者及对应基因序列(rbcL、Partial LSU、COI-5P)的GenBank编号,为系统发育分析提供基础数据。...
    packageimg
  • 德国巴伐利亚州Hunas地区鼬科动物遗骸目录数据集

    2025年12月6日 30 130 65

    数据集概述 该数据集为德国巴伐利亚州Hunas地区鼬科动物遗骸的分类目录,记录了多种鼬科物种(如狼獾、獾、水獭、松貂、紫貂、伶鼬等)的骨骼遗骸信息,包括遗骸类型、标本编号、性别、地层及历史鉴定结果。 文件详解 文件名称:德国巴伐利亚州Hunas地区鼬科动物遗骸目录 文件格式:文本 核心字段: Material:遗骸类型(如骨骼部位) Coll....
    packageimg
  • 泰米尔语_英语语音翻译数据集

    2025年9月26日 30 37 18

    泰米尔语_英语语音翻译数据集_Tamil_English_Speech_Translation_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音翻译, 泰米尔语, 英语, 多语言, 语音, 文本, 机器学习 数据概述: 该数据集包含泰米尔语和英语的语音数据及对应的文本转录和翻译,旨在促进泰米尔语与英语之间的语音翻译研究。主要特征如下:...
    packageimg
  • 堤坝巡查文本数据集

    2025年9月20日 30 160 94

    堤坝巡查文本数据集_Levee_Patrol_Text_Dataset 数据来源:互联网公开数据 标签:堤坝, 巡查, 文本, 越南语, 自然语言处理, 灾害管理, 水利工程, 文本分析 数据概述: 该数据集包含来自越南相关法律法规及管理文件的文本数据,记录了关于堤坝巡查、维护和防洪的相关内容。主要特征如下:...
    packageimg
  • 自然语言处理多领域对话数据集UltraChat-200K-thedevastator

    2025年6月4日 30 104 44

    自然语言处理多领域对话数据集UltraChat-200K-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,对话,生成,训练,文本,语言模型,NLG,语料库 数据概述:...
    packageimg
  • Jigsaw竞赛英语翻译文本数据集

    2025年6月1日 30 109 56

    Jigsaw竞赛英语翻译文本数据集 数据来源:互联网公开数据 标签:Jigsaw, 翻译, 文本, 英语, 自然语言处理, 文本分析, 机器学习, 竞赛, 负面评论, 错误标识 数据概述:...
    packageimg
  • 古腾堡诗歌项目诗歌文本数据集-terminate9298

    2025年6月1日 30 64 60

    古腾堡诗歌项目诗歌文本数据集-terminate9298 数据来源:互联网公开数据 标签:诗歌,文学,文本,古腾堡项目,语料库,自然语言处理,文本分析,诗歌创作,情感分析 数据概述: 本数据集收录了来自古腾堡项目(Gutenberg Project)的诗歌文本,包含2703086行句子。数据集由Allison...
    packageimg
  • 乌尔都语印刷文本图像识别扩展数据集-MMU-Extension-22-tayyabnasir22

    2025年6月1日 30 76 33

    乌尔都语印刷文本图像识别扩展数据集-MMU-Extension-22-tayyabnasir22 数据来源:互联网公开数据 标签:乌尔都语,OCR,文本识别,印刷文本,深度学习,机器学习,图像,文本,语言学,计算机视觉 数据概述: 本数据集是MMU-OCR-21数据集的扩展,旨在为印刷乌尔都语光学字符识别(OCR)任务提供一个公开可用的数据集。MMU-...
    packageimg
  • 巴西新闻文章文本数据集-新闻内容分析-2024

    2025年5月31日 30 209 141

    巴西新闻文章文本数据集-新闻内容分析-2024 数据来源:互联网公开数据 标签:巴西,新闻,文本,自然语言处理,NLP,金融,信息提取,时事,政治,经济,社会 数据概述: 本数据集包含来自巴西联邦数字图书馆的新闻文章文本,旨在为自然语言处理(NLP)模型构建提供可靠且一致的数据源。数据集涵盖了各种主题的新闻报道,为研究人员提供了丰富的文本数据。...
    packageimg
  • 孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan

    2025年5月31日 30 10 4

    孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源:互联网公开数据 标签:孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库 数据概述: 本数据集包含了从2017年12月13日至2020年9月9日期间,孟加拉国日报(BD-...
    packageimg
  • 老挝语-越南语机器翻译语料库越南语文本数据集-zuydang

    2025年5月31日 30 25 8

    老挝语-越南语机器翻译语料库越南语文本数据集-zuydang 数据来源:互联网公开数据 标签:机器翻译,语料库,老挝语,越南语,文本,语言学,自然语言处理,ALT 数据概述: 本数据集是从ALT(亚洲语言技术)项目中提取的老挝语-...
    packageimg
  • 多模态文本图像生成数据集-2023-alenic

    2025年5月31日 30 186 183

    多模态文本图像生成数据集-2023-alenic 数据来源:互联网公开数据 标签:多模态,文本,图像,生成,数据集,分类,预测,模态分析,目标识别 数据概述:...
    packageimg
  • 视觉问答图像理解数据集-图像与自然语言结合-通用

    2025年5月30日 30 52 40

    视觉问答图像理解数据集-图像与自然语言结合-通用 数据来源:互联网公开数据 标签:视觉问答,图像理解,自然语言处理,计算机视觉,人工智能,图像,文本,问答,多模态,场景理解 数据概述: 本数据集是用于视觉问答(VQA,Visual Question Answering)任务的通用数据集。VQA...
    packageimg