-
自然语言处理模型与算法数据集TransformersTutorialDataset-b1ueee
自然语言处理模型与算法数据集TransformersTutorialDataset-b1ueee 数据来源:互联网公开数据 标签:自然语言处理,机器学习,深度学习,数据集,模型训练,文本分类,语言模型,算法研究 数据概述: 该数据集包含来自自然语言处理领域的模型与算法数据,记录了用于训练和评估自然语言处理模型的文本和标签信息。主要特征如下:... -
语言模型系统数据集LMSYSDatasets-lizhecheng
语言模型系统数据集LMSYSDatasets-lizhecheng 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,语言模型,文本生成,深度学习,人工智能,模型评估 数据概述: 该数据集由LMSYS项目提供,主要记录了多种语言模型在文本生成和自然语言处理任务中的表现数据。主要特征如下:... -
文本润色指令数据集TextRefinementPromptDataset-yuanzhezhou
文本润色指令数据集TextRefinementPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 提示工程, 自然语言处理, 文本编辑, 风格迁移, 数据标注, 语言模型, 任务指令 数据概述: 该数据集包含用于文本润色的指令,记录了多种文本改写、风格转换的任务描述。主要特征如下:... -
文本片段上下文关系数据集TextFragmentContextRelationshipDataset-srisanthoshhari
文本片段上下文关系数据集TextFragmentContextRelationshipDataset-srisanthoshhari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,上下文关系,片段抽取,语言模型,数据标注,文本序列,语料库 数据概述: 该数据集包含从特定语料库中提取的文本片段及其上下文信息。主要特征如下:... -
文本生成与写作评估数据集TextGenerationandWritingAssessmentDataset-sahilingole
文本生成与写作评估数据集TextGenerationandWritingAssessmentDataset-sahilingole 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器写作, 论文写作, 自然语言处理, 语言模型, 文本分析, 机器学习 数据概述:... -
英语作文质量评估特征数据集EssayQualityAssessmentFeatureDataset-suj20n9
英语作文质量评估特征数据集EssayQualityAssessmentFeatureDataset-suj20n9 数据来源:互联网公开数据 标签:作文评估, 文本分析, 自然语言处理, 语言模型, 写作质量, 英语学习, 机器学习, 特征工程 数据概述:... -
学生写作水平评估数据集StudentEssayWritingAssessment-yhorm6
学生写作水平评估数据集StudentEssayWritingAssessment-yhorm6 数据来源:互联网公开数据 标签:写作评估, 文本分析, 机器学习, 自然语言处理, 文本生成, 教育, 写作能力, 语言模型 数据概述: 该数据集包含来自学生写作的论文数据,用于评估学生的写作水平和识别文本生成特征。主要特征如下:... -
阿拉伯语问答数据集ArabicQuestionAnsweringDataset-salahmak
阿拉伯语问答数据集ArabicQuestionAnsweringDataset-salahmak 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本理解, 机器阅读理解, 数据标注, 语言模型, 知识检索 数据概述: 该数据集包含来自多个来源的阿拉伯语问答对,旨在用于训练和评估阿拉伯语问答系统。主要特征如下:... -
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing
中文古文阅读理解测试数据集ChineseClassicalTextReadingComprehensionTestDataset-biebeixing 数据来源:互联网公开数据 标签:古文阅读, 文本理解, 语言模型, 中文NLP, 考试测评, 语义分析, 机器阅读理解, 知识问答 数据概述:... -
FlauSino-LLM-T5模型训练数据集-brunoflausino
FlauSino-LLM-T5模型训练数据集-brunoflausino 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器翻译,文本摘要,多任务学习,深度学习,模型训练,语言模型 数据概述: 该数据集用于训练 FlauSino-LLM-T5 模型,该模型是基于 T5... -
英语作文质量评估特征数据集EnglishEssayQualityAssessmentFeatureDataset-wcqyfly
英语作文质量评估特征数据集EnglishEssayQualityAssessmentFeatureDataset-wcqyfly 数据来源:互联网公开数据 标签:作文评估, 文本分析, 机器学习, 语言模型, 自然语言处理, 写作质量, 特征工程, LightGBM模型 数据概述:... -
俄语文学作品文本分析数据集RussianLiteratureTextAnalysisDataset-nikitaprzd
俄语文学作品文本分析数据集RussianLiteratureTextAnalysisDataset-nikitaprzd 数据来源:互联网公开数据 标签:俄语文学, 文本分析, 自然语言处理, 作者分析, 语料库, 情感分析, 文本挖掘, 语言模型 数据概述:... -
英文写作质量评估数据集EnglishWritingQualityEvaluation-goldenlock
英文写作质量评估数据集EnglishWritingQualityEvaluation-goldenlock 数据来源:互联网公开数据 标签:文本质量, 写作评估, 自然语言处理, 多维度评价, 文本分析, 机器学习, 语言模型, 写作能力 数据概述:... -
僧伽罗语文本情感分类数据集SinhalaTextSentimentClassificationDataset-vajithchamuditha99
僧伽罗语文本情感分类数据集SinhalaTextSentimentClassificationDataset-vajithchamuditha99 数据来源:互联网公开数据 标签:情感分析, 文本分类, 僧伽罗语, 语言模型, 恶意内容检测, 情感标注, 多分类, 机器学习 数据概述:... -
VK公司新闻文本命名实体识别数据集VKNERDataset-alexeylyamzin
VK公司新闻文本命名实体识别数据集VKNERDataset-alexeylyamzin 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,数据集,俄语,机器学习,信息抽取,语言模型 数据概述: 该数据集包含来自VK公司新闻文章的文本数据,用于命名实体识别任务。主要特征如下: 时间跨度:数据记录的时间跨度为特定年份的新闻文章。... -
预处理语料数据集PreprocessedCorpusDataset-hctingnht
预处理语料数据集PreprocessedCorpusDataset-hctingnht 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,数据预处理,文本挖掘,人工智能 数据概述:该数据集包含经过预处理的文本数据,记录了来自多个来源的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确,可能涵盖多个时间段。... -
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222
写作质量评估文本嵌入数据集WritingQualityAssessmentTextEmbeddings-shubhamchauhan22222 数据来源:互联网公开数据 标签:文本嵌入, 写作评估, 语义分析, 深度学习, 语言模型, 自然语言处理, 文本相似度, 情感分析 数据概述:... -
自然语言推理文本蕴含数据集NaturalLanguageInferenceTextualEntailmentDataset-sharmaharsh
自然语言推理文本蕴含数据集NaturalLanguageInferenceTextualEntailmentDataset-sharmaharsh 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 情感分析, 语义理解, 文本匹配, 深度学习, 语言模型, 多分类 数据概述:... -
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg
Quora问题分类数据集QuoraQuestionClassificationDataset-ludwigvinberg 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,语言模型 数据概述: 该数据集来自Quora平台,记录了用户提交的各类问题及其分类标签。主要特征如下:... -
电影剧本数据集MovieScriptsDataset-parthplc
电影剧本数据集MovieScriptsDataset-parthplc 数据来源:互联网公开数据 标签:电影,剧本,数据集,文本分析,自然语言处理,情感分析,语言模型,影视研究 数据概述: 该数据集包含电影剧本数据,记录了各类电影的剧本文本内容。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的电影剧本。...