数据集 - 海数据

学生写作水平评估数据集StudentEssayWritingAssessment-yhorm6

2025年5月18日

学生写作水平评估数据集StudentEssayWritingAssessment-yhorm6 数据来源：互联网公开数据标签：写作评估, 文本分析, 机器学习, 自然语言处理, 文本生成, 教育, 写作能力, 语言模型数据概述：该数据集包含来自学生写作的论文数据，用于评估学生的写作水平和识别文本生成特征。主要特征如下：...

ZIP

阿拉伯语问答数据集ArabicQuestionAnsweringDataset-salahmak

2025年5月17日

阿拉伯语问答数据集ArabicQuestionAnsweringDataset-salahmak 数据来源：互联网公开数据标签：问答系统, 自然语言处理, 阿拉伯语, 文本理解, 机器阅读理解, 数据标注, 语言模型, 知识检索数据概述：该数据集包含来自多个来源的阿拉伯语问答对，旨在用于训练和评估阿拉伯语问答系统。主要特征如下：...

ZIP

中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing

2025年5月7日

中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing 数据来源：互联网公开数据标签：古文阅读, 文本理解, 语言模型, 中文NLP, 考试测评, 语义分析, 机器阅读理解, 知识问答数据概述：...

ZIP

FlauSino-LLM-T5模型训练数据集-brunoflausino

2025年5月21日

FlauSino-LLM-T5模型训练数据集-brunoflausino 数据来源：互联网公开数据标签：自然语言处理，数据集，文本生成，机器翻译，文本摘要，多任务学习，深度学习，模型训练，语言模型数据概述：该数据集用于训练 FlauSino-LLM-T5 模型，该模型是基于 T5...

ZIP

英语作文质量评估特征数据集EnglishEssayQualityAssessmentFeatureDataset-wcqyfly

2025年5月21日

英语作文质量评估特征数据集EnglishEssayQualityAssessmentFeatureDataset-wcqyfly 数据来源：互联网公开数据标签：作文评估, 文本分析, 机器学习, 语言模型, 自然语言处理, 写作质量, 特征工程, LightGBM模型数据概述：...

ZIP

俄语文学作品文本分析数据集RussianLiteratureTextAnalysisDataset-nikitaprzd

2025年5月21日

俄语文学作品文本分析数据集RussianLiteratureTextAnalysisDataset-nikitaprzd 数据来源：互联网公开数据标签：俄语文学, 文本分析, 自然语言处理, 作者分析, 语料库, 情感分析, 文本挖掘, 语言模型数据概述：...

ZIP

英文写作质量评估数据集EnglishWritingQualityEvaluation-goldenlock

2025年5月21日

英文写作质量评估数据集EnglishWritingQualityEvaluation-goldenlock 数据来源：互联网公开数据标签：文本质量, 写作评估, 自然语言处理, 多维度评价, 文本分析, 机器学习, 语言模型, 写作能力数据概述：...

ZIP

僧伽罗语文本情感分类数据集SinhalaTextSentimentClassificationDataset-vajithchamuditha99

2025年5月21日

僧伽罗语文本情感分类数据集SinhalaTextSentimentClassificationDataset-vajithchamuditha99 数据来源：互联网公开数据标签：情感分析, 文本分类, 僧伽罗语, 语言模型, 恶意内容检测, 情感标注, 多分类, 机器学习数据概述：...

ZIP

VK公司新闻文本命名实体识别数据集VKNERDataset-alexeylyamzin

2025年5月17日

VK公司新闻文本命名实体识别数据集VKNERDataset-alexeylyamzin 数据来源：互联网公开数据标签：命名实体识别，自然语言处理，文本分析，数据集，俄语，机器学习，信息抽取，语言模型数据概述：该数据集包含来自VK公司新闻文章的文本数据，用于命名实体识别任务。主要特征如下：时间跨度：数据记录的时间跨度为特定年份的新闻文章。...

ZIP

预处理语料数据集PreprocessedCorpusDataset-hctingnht

2025年5月16日

预处理语料数据集PreprocessedCorpusDataset-hctingnht 数据来源：互联网公开数据标签：自然语言处理，文本分析，数据集，机器学习，语言模型，数据预处理，文本挖掘，人工智能数据概述：该数据集包含经过预处理的文本数据，记录了来自多个来源的文本内容。主要特征如下：时间跨度：数据记录的时间范围未明确，可能涵盖多个时间段。...

ZIP

写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222

2025年5月9日

写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222 数据来源：互联网公开数据标签：文本嵌入, 写作评估, 语义分析, 深度学习, 语言模型, 自然语言处理, 文本相似度, 情感分析数据概述：...

ZIP

自然语言推理文本蕴含数据集NaturalLanguageInferenceTextualEntailmentDataset-sharmaharsh

2025年5月9日

自然语言推理文本蕴含数据集NaturalLanguageInferenceTextualEntailmentDataset-sharmaharsh 数据来源：互联网公开数据标签：文本蕴含, 自然语言推理, 情感分析, 语义理解, 文本匹配, 深度学习, 语言模型, 多分类数据概述：...

ZIP

Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg

2025年5月14日

Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，机器学习，问答系统，信息检索，数据挖掘，语言模型数据概述：该数据集来自Quora平台，记录了用户提交的各类问题及其分类标签。主要特征如下：...

ZIP

电影剧本数据集MovieScriptsDataset-parthplc

2025年5月13日

电影剧本数据集MovieScriptsDataset-parthplc 数据来源：互联网公开数据标签：电影，剧本，数据集，文本分析，自然语言处理，情感分析，语言模型，影视研究数据概述：该数据集包含电影剧本数据，记录了各类电影的剧本文本内容。主要特征如下：时间跨度：数据记录的时间范围涵盖了不同年代的电影剧本。...

ZIP

学生写作质量评估文本特征数据集StudentWritingQualityAssessmentTextFeatureDataset-ajenningsfrankston

2025年5月9日

学生写作质量评估文本特征数据集StudentWritingQualityAssessmentTextFeatureDataset-ajenningsfrankston 数据来源：互联网公开数据标签：文本分析, 写作质量, 语义特征, 语言模型, 机器学习, 情感分析, 教育评估, 自然语言处理数据概述：...

ZIP

语言模型提示恢复数据集LLMPromptRecoveryDataset-pedromb

2025年5月12日

语言模型提示恢复数据集LLMPromptRecoveryDataset-pedromb 数据来源：互联网公开数据标签：自然语言处理，语言模型，数据集，提示工程，机器学习，文本生成，人工智能，模型训练数据概述：该数据集包含用于语言模型提示恢复的文本数据，记录了不同类型的提示及其对应的恢复结果。主要特征如下：时间跨度：数据记录的时间范围不明确。...

ZIP

新闻摘要生成数据集Mediasum-49999Dataset-gautamil

2025年5月12日

新闻摘要生成数据集Mediasum-49999Dataset-gautamil 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，机器翻译，新闻报道，深度学习，文本生成，语言模型数据概述：该数据集包含来自多个新闻来源的文章及其对应的摘要，旨在用于文本摘要生成任务。主要特征如下：时间跨度：数据记录的时间范围涵盖了多个时间段的新闻报道。...

ZIP

中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11

2025年5月20日

中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11 数据来源：互联网公开数据标签：机器翻译, 文本翻译, 语言学习, 双语对照, 自然语言处理, 语料库, 语言模型, 文本分析数据概述：该数据集包含中英双语短句，记录了英语短语及其对应的中文翻译。主要特征如下：...

ZIP

RoBERTa模型配置V2版本数据集-kiiroi

2025年5月19日

RoBERTa模型配置V2版本数据集-kiiroi 数据来源：互联网公开数据标签：自然语言处理，文本分析，RoBERTa，数据集，模型训练，语言模型，文本生成，机器学习数据概述：该数据集包含了用于训练和评估RoBERTa模型配置V2版本的数据，主要用于提升模型在各种自然语言处理任务中的性能。主要特征如下：...