-
UCS_Dataset_Based_乌尔都语犯罪新闻摘要语料库
2026年1月29日 30 95 71
数据集概述 本数据集包含1500篇乌尔都语犯罪新闻文章的摘要内容,主要用于训练抽象式文本摘要模型。数据集仅含一个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集,便于集中使用。 文件详解 文件名称:UCS-Dataset.xlsx 文件格式:XLSX...
-
加泰罗尼亚政府网页爬取语料库2020
2025年12月13日 30 120 97
数据集概述 该数据集是2020年9月至10月从加泰罗尼亚政府.gencat域名及子域名爬取的加泰罗尼亚语网页语料库,含三千九百一十一万七千九百零九个词元、一百五十六万五千四百三十三个句子和七万一千零四十三篇文档,是加泰罗尼亚语文本语料库的子语料库。 文件详解 文件名称: catalan_government_crawling.zip 文件格式: ZIP...
-
学术论文写作结构分析数据集AcademicEssayStructureAnalysis-evanhuu
2025年5月29日 30 16 8
学术论文写作结构分析数据集AcademicEssayStructureAnalysis-evanhuu 数据来源:互联网公开数据 标签:论文写作, 文本分析, 自然语言处理, 语篇结构, 论证结构, 文本标注, 机器学习, 教育 数据概述: 该数据集包含用于分析学术论文写作结构的数据,记录了论文中不同论述单元的文本内容及其类型。主要特征如下:...
-
英语议论文写作文本分析数据集EnglishEssayWritingTextAnalysisDataset-nevedhaayyanar
2025年5月1日 30 198 14
英语议论文写作文本分析数据集EnglishEssayWritingTextAnalysisDataset-nevedhaayyanar 数据来源:互联网公开数据 标签:议论文写作, 文本分析, 自然语言处理, 语篇结构, 写作技巧, 文本分类, 机器学习, 教育 数据概述:...



