数据集 - 海数据

FASTTypescript_Based_TypeScript示例代码AST表示数据集

2026年1月14日 30 110 81

数据集概述本数据集包含通过Pharo中的新项目FASTTypescript解析并表示为抽象语法树（AST）的Typescript示例代码。示例涵盖来自开源项目的小型、基础、复杂及超长代码，可用于研究Typescript代码结构及AST表示。文件详解文件名称：Typescript examples.xlsx 文件格式：XLSX...

ZIP

对外俄语教学创新技术_语言与方法论研究

2025年12月24日 30 96 86

数据集概述本数据集为单篇PDF文档，聚焦对外俄语教学领域的创新技术，从语言学与方法论视角展开研究，探讨相关教学实践的理论与应用路径。文件详解数据集包含一个PDF格式的文档文件，具体如下： - 文件名称: Yuldasheva Saodat Turakulovna.pdf - 文件格式: PDF (.pdf) - 文件内容:...

ZIP

语言在钓鱼攻击中的作用分析_语言技术如何操纵受害者

2025年12月18日 30 10 7

数据集概述本数据集聚焦语言在钓鱼攻击中的作用，分析语言技术如何操纵受害者。包含1份PDF文档，围绕钓鱼攻击中的语言策略展开研究，为理解钓鱼攻击的语言操纵机制提供资料支持。文件详解文件名称: Toshpulatova Umidaxon G’ayrat qizi.pdf 文件格式: PDF (.pdf) 文件内容:...

ZIP

突厥语域机器翻译研究描述

2025年12月14日 30 25 9

数据集概述本数据集包含一份关于突厥语域机器翻译研究的文档，聚焦于该领域的研究内容与进展，为了解突厥语机器翻译的研究现状提供资料支持。文件详解文件名称: Hulkar Izzatillayevna Zokirova.pdf 文件格式: PDF 内容说明: 该文档为关于突厥语域机器翻译研究的描述性资料，具体内容需通过阅读PDF文件获取。适用场景...

ZIP

乌兹别克语教学中与学生文本处理技术相关文档

2025年12月12日 30 113 96

数据集概述该数据集包含一份关于乌兹别克语教学中与学生文本处理技术相关的文档，聚焦于教学场景下的文本处理技术应用内容。文件详解文件名称: Namazova Gulbahor Murapparovna.pdf 文件格式: PDF (.pdf) 文件内容: 未提供具体字段或内容详情，为单份PDF文档适用场景乌兹别克语教育技术研究...

ZIP

孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni

2025年5月30日 30 172 33

孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，机器学习，语言技术，孟加拉语，文本分析，信息提取数据概述：该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要，适用于文本摘要生成和自然语言处理研究。主要特征如下：...

ZIP

英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar

2025年5月30日 30 19 9

英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar 数据来源：互联网公开数据标签：机器翻译，自然语言处理，数据集，英语，德语，文本翻译，深度学习，语言技术数据概述：该数据集来源于WMT（Workshop on Machine...

ZIP

文本分词数据集RdrSegmenterZalo数据集-thimkth

2025年5月30日 30 99 36

文本分词数据集RdrSegmenterZalo数据集-thimkth 数据来源：互联网公开数据标签：文本分词，数据集，自然语言处理，机器学习，深度学习，语言技术，人工智能数据概述：该数据集由Zalo团队提供，主要用于训练和评估文本分词模型。主要特征如下：时间跨度：数据记录的时间范围从2018年到2020年。...

ZIP

情感分析数据集SentimentalAnalysisDataset-chandreshsingham

2025年5月30日 30 60 5

情感分析数据集SentimentalAnalysisDataset-chandreshsingham 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，文本挖掘，机器学习，情感识别，数据科学，语言技术数据概述：该数据集包含来自互联网公开来源的文本数据，记录了用户对产品、服务或内容的情感表达。主要特征如下：...

ZIP

阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002

2025年5月29日 30 110 39

阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002 数据来源：互联网公开数据标签：阿拉伯语，数据集，机器学习，自然语言处理，文本分类，语言技术，翻译研究，人工智能数据概述：该数据集包含阿拉伯语的推广文本数据，记录了不同类型的推广内容及其相关信息。主要特征如下：时间跨度：数据记录的时间范围未明确，推测为近年数据。...

ZIP

乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa

2025年5月29日 30 61 60

乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa 数据来源：互联网公开数据标签：新闻文章，数据集，文本分析，自然语言处理，机器学习，内容挖掘，新闻研究，语言技术数据概述：该数据集包含来自乌克兰的新闻文章数据，记录了乌克兰新闻媒体发布的各类新闻内容。主要特征如下：...

ZIP

文本自动纠错数据集CleanedAutoCorrectDataset-oyounis

2025年5月28日 30 174 121

文本自动纠错数据集CleanedAutoCorrectDataset-oyounis 数据来源：互联网公开数据标签：文本纠错，数据集，自然语言处理，机器学习，文本分析，文本处理，语言技术，人工智能数据概述：该数据集包含经过清洗和自动纠错处理的文本数据，适用于文本纠错和自然语言处理任务。主要特征如下：...

ZIP

孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath

2025年5月28日 30 169 65

孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath 数据来源：互联网公开数据标签：孟加拉语，自然语言处理，数据集，文本分析，机器学习，语言学，文本挖掘，语言技术数据概述：该数据集包含来自公开来源的孟加拉语段落数据，适用于自然语言处理和机器学习任务。主要特征如下：...

ZIP

大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu

2025年5月28日 30 164 30

大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源：互联网公开数据标签：大型语言模型，数据集，自然语言处理，机器学习，文本生成，对话系统，人工智能，语言技术数据概述：该数据集包含用于训练大型语言模型的提示数据，记录了多种类型的对话和文本生成任务的示例。主要特征如下：...

ZIP

印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner

2025年5月28日 30 151 20

印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner 数据来源：互联网公开数据标签：自然语言处理，文本分析，数据集，机器学习，重复检测，语言技术，印地语，文本相似度数据概述：该数据集包含印地语文本的重复检测数据，记录了印地语文本中的重复或改写文本对。主要特征如下：...

ZIP

手写卡纳达语数据集HandwrittenKannadaDataset-rumanabegum

2025年5月28日 30 29 1

手写卡纳达语数据集HandwrittenKannadaDataset-rumanabegum 数据来源：互联网公开数据标签：手写识别，卡纳达语，数据集，图像处理，机器学习，模式识别，人工智能，语言技术数据概述：该数据集包含来自公开来源的手写卡纳达语字符数据，记录了手写卡纳达语字母、数字及符号的图像信息。主要特征如下：...

ZIP

阿拉伯语阅读理解数据集ArabicReadingComprehensionDataset-omniasayed

2025年5月16日 30 164 50

阿拉伯语阅读理解数据集ArabicReadingComprehensionDataset-omniasayed 数据来源：互联网公开数据标签：自然语言处理，阅读理解，机器学习，阿拉伯语，文本分析，语言技术，数据集，人工智能数据概述：该数据集包含阿拉伯语的阅读理解数据，记录了阿拉伯语文本与相应的问题及答案。主要特征如下：...

ZIP

语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001

2025年4月26日 30 171 85

语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001 数据来源：互联网公开数据标签：自然语言处理，语法纠错，数据集，机器学习，文本分析，语言技术，教育技术，人工智能数据概述：该数据集包含来自多种来源的文本数据，记录了包含语法错误的句子及其对应的正确句子。主要特征如下：...

ZIP

错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran

2025年4月26日 30 4 2

错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源：互联网公开数据标签：自然语言处理，泰米尔语，语料库，错误标注，机器学习，语言技术，文本分析，数据挖掘数据概述：该数据集包含来自泰米尔语的错误标注语料，记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下：...

ZIP

阿塞拜疆语情感分析数据集AzerbaijaniSentimentAnalysisDataset-nazimt

2025年4月26日 30 117 88

阿塞拜疆语情感分析数据集AzerbaijaniSentimentAnalysisDataset-nazimt 数据来源：互联网公开数据标签：情感分析，自然语言处理，数据集，机器学习，文本分类，语言技术，多语言处理，情感挖掘数据概述：该数据集包含来自互联网的阿塞拜疆语文本数据，记录了不同来源的文本内容的情感倾向。主要特征如下：...

ZIP

找到83个数据集

注册成功！