-
Zenodo_Mining_User_Forums_环境软件使用质量评估论坛数据
2026年1月19日 30 102 12
数据集概述 本数据集包含与环境软件(反应迁移建模)用户论坛网络爬取相关的代码、数据文件和图表,用于评估环境软件的使用质量。数据集以压缩包形式提供,无目录结构,总计包含一个文件。 文件详解 文件名称:mining_user_forums_zenodo.zip 文件格式:ZIP...
-
突尼斯阿拉伯语拉丁转写语料库2017_2021
2025年12月21日 30 65 20
数据集概述 该数据集是2017-2021年构建的突尼斯阿拉伯语(ISO 693-3: aeb)拉丁转写(Arabizi)文本资源,通过网络爬取Facebook公开页面消息,经人工筛选保留纯突尼斯阿拉伯语拉丁转写内容,无标注或调整,用于解决突尼斯阿拉伯语拉丁转写NLP数据库缺失问题。 文件详解 文本文件(.txt格式,共13个):...
-
加泰罗尼亚通用网络爬取语料库2020
2025年12月4日 30 162 158
数据集概述 该数据集是加泰罗尼亚语文本语料库的子库,通过爬取2020年7月最受欢迎的500个.cat和.ad域名获取,包含约四亿三千五百万个词、一千九百四十五万余句和一百零一万六千余篇文档,文档以单行新行分隔,用于语言学或自然语言处理研究。 文件详解 文件名称: catalan_general_crawling.zip 文件格式: ZIP(.zip)...
-
网络爬取图像及描述数据集
2025年5月31日 30 3 0
网络爬取图像及描述数据集 数据来源:互联网公开数据 标签:图像描述,网络爬取,计算机视觉,自然语言处理,多模态学习,图像理解,视觉分析,文本生成,数据清洗,数据增强 数据概述: 本数据集是一个从互联网公开数据中收集的大型图像-...
-
西班牙经济学家报经济新闻情感分析数据集-abrahammontoya
2025年4月23日 30 104 43
西班牙经济学家报经济新闻情感分析数据集-abrahammontoya 数据来源:互联网公开数据 标签:经济新闻,西班牙,情感分析,文本数据,新闻数据,网络爬取,自然语言处理,财经,新闻 数据概述: 本数据集包含了西班牙报纸《经济学家报》(El Economista)经济版块的新闻数据。 数据集涵盖了新闻的标题、作者、正文内容、发布日期和新闻URL。...
-
西班牙InfoJobs招聘信息网络爬取数据集-2024年1月17日至21日
2025年4月14日 30 152 116
西班牙InfoJobs招聘信息网络爬取数据集-2024年1月17日至21日 数据来源:互联网公开数据 标签:招聘信息,西班牙,InfoJobs,网络爬取,Python,Selenium,就业市场,职位信息,薪资数据 数据概述:...



