-
TikTok_Pregnancy_Vape_社交平台内容筛查数据采集脚本集
2026年1月21日 30 17 9
数据集概述 本数据集存储了用于从TikTok平台采集数据的脚本集合,包含视频、元数据及视觉洞察的采集流程。数据采集分为元数据提取、去重、视频下载、转录生成、目标与文本检测五个步骤,需按顺序运行对应脚本,同时需配置Python环境、相关库及Oracle Cloud Vision API等第三方服务。 文件详解 文件名称:GPT-Vape-and-...
-
AUGUSTA语音转文本语言模型训练数据集
2025年12月22日 30 201 185
数据集概述 该数据集包含用于微调AUGUSTA语音转文本模型的元数据和精选数据集,AUGUSTA是基于OpenAI Whisper定制的模型,可将南蒂罗尔方言语音转录为标准德语。 文件详解 文件名称: augusta_data-main.zip 文件格式: ZIP压缩包 文件内容:...



