-
学生写作质量评估文本特征数据集StudentWritingQualityAssessmentTextFeatureDataset-ajenningsfrankston
学生写作质量评估文本特征数据集StudentWritingQualityAssessmentTextFeatureDataset-ajenningsfrankston 数据来源:互联网公开数据 标签:文本分析, 写作质量, 语义特征, 语言模型, 机器学习, 情感分析, 教育评估, 自然语言处理 数据概述:... -
语言模型提示恢复数据集LLMPromptRecoveryDataset-pedromb
语言模型提示恢复数据集LLMPromptRecoveryDataset-pedromb 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,提示工程,机器学习,文本生成,人工智能,模型训练 数据概述: 该数据集包含用于语言模型提示恢复的文本数据,记录了不同类型的提示及其对应的恢复结果。主要特征如下: 时间跨度:数据记录的时间范围不明确。... -
新闻摘要生成数据集Mediasum-49999Dataset-gautamil
新闻摘要生成数据集Mediasum-49999Dataset-gautamil 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,新闻报道,深度学习,文本生成,语言模型 数据概述: 该数据集包含来自多个新闻来源的文章及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个时间段的新闻报道。... -
中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11
中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学习, 双语对照, 自然语言处理, 语料库, 语言模型, 文本分析 数据概述: 该数据集包含中英双语短句,记录了英语短语及其对应的中文翻译。主要特征如下:... -
RoBERTa模型配置V2版本数据集-kiiroi
RoBERTa模型配置V2版本数据集-kiiroi 数据来源:互联网公开数据 标签:自然语言处理,文本分析,RoBERTa,数据集,模型训练,语言模型,文本生成,机器学习 数据概述:该数据集包含了用于训练和评估RoBERTa模型配置V2版本的数据,主要用于提升模型在各种自然语言处理任务中的性能。主要特征如下:... -
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi 数据来源:互联网公开数据 标签:孟加拉语, 文本转换, 语言模型, 机器翻译, 自然语言处理, 数据集, 文本分析, 句子生成 数据概述:... -
Transformer初始模型子集数据集-tatsumicrub
Transformer初始模型子集数据集-tatsumicrub 数据来源:互联网公开数据 标签:Transformer,自然语言处理,数据集,模型训练,文本生成,机器翻译,语言模型,深度学习 数据概述: 该数据集包含用于Transformer初始模型训练和评估的文本数据子集。主要特征如下:... -
LLM文本重写数据集LLMTextRewritingDataset-adrienriaux
LLM文本重写数据集LLMTextRewritingDataset-adrienriaux 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 文本重写, 提示工程, 机器学习, 数据标注, 文本转换, 语言模型 数据概述: 该数据集包含来自文本重写任务的数据,记录了使用大型语言模型(LLM)对原始文本进行重写的结果。主要特征如下:... -
Medium文章内容预测数据集Next-Sents-base-on-Medium-ArticlesDataset-terrychanorg
Medium文章内容预测数据集Next-Sents-base-on-Medium-ArticlesDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,内容预测,文章续写,深度学习 数据概述:... -
多语言数据集Multy-LangDatasets-embarkiomar
多语言数据集Multy-LangDatasets-embarkiomar 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分类,语言模型,人工智能,计算机科学 数据概述: 该数据集包含来自多个语言的数据,记录了不同语言之间的文本对齐和文本分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
写作评估与提示数据集WritingAssessment-PromptsDataset-giovanniiannuzzi
写作评估与提示数据集WritingAssessment-PromptsDataset-giovanniiannuzzi 数据来源:互联网公开数据 标签:写作评估, 文本生成, 论文写作, 自然语言处理, 文本分析, 语言模型, 创作提示, 写作辅助 数据概述: 该数据集包含用于写作评估与提示的数据,记录了学生写作的文本以及对应的写作提示。主要特征如下:... -
语言模型偏好对比评测数据集LanguageModelPreferenceComparisonEvaluationDataset-mbaiornommbaihodji
语言模型偏好对比评测数据集LanguageModelPreferenceComparisonEvaluationDataset-mbaiornommbaihodji 数据来源:互联网公开数据 标签:语言模型, 对比评测, 自然语言处理, 文本生成, 模型评估, 偏好排序, 人工智能, 文本分析 数据概述:... -
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 问答系统, 孟加拉语, 对比学习, 文本生成, 语言模型, 数据集 数据概述: 该数据集包含用于训练和评估孟加拉语指令问答模型的结构化数据。主要特征如下:... -
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan 数据来源:互联网公开数据 标签:孟加拉语, 文本语料库, 自然语言处理, 文本分析, 语言模型, 文本挖掘, 语料库构建, 文本数据 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种来源的孟加拉语文本片段。主要特征如下:... -
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 词性标注, 语言模型, 语料库, 机器学习 数据概述:... -
土耳其新闻文本分析数据集TurkishNewsTextAnalysisDataset-ahmetelgn
土耳其新闻文本分析数据集TurkishNewsTextAnalysisDataset-ahmetelgn 数据来源:互联网公开数据 标签:新闻文本, 土耳其, 文本分析, 自然语言处理, 时序分析, 舆情分析, 政治新闻, 语言模型 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityEvaluation-tianyihuang0224
英语写作质量评估数据集EnglishWritingQualityEvaluation-tianyihuang0224 数据来源:互联网公开数据 标签:英语写作, 文本评估, 语言模型, 语法分析, 文本分析, 写作质量, 自动评分, 自然语言处理 数据概述: 该数据集包含用于评估英语写作质量的结构化数据,记录了不同文本的多个维度评估分数。主要特征如下:... -
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung 数据来源:互联网公开数据 标签:机器翻译, 尼泊尔语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 数据集 数据概述: 该数据集包含来自多种来源的尼泊尔语-... -
孟加拉语语音识别数据集BengaliSpeechRecognitionDataset-ttahara
孟加拉语语音识别数据集BengaliSpeechRecognitionDataset-ttahara 数据来源:互联网公开数据 标签:语音识别,孟加拉语,数据集,深度学习,自然语言处理,声学模型,语言模型,语音信号处理 数据概述: 该数据集包含孟加拉语语音数据,主要用于语音识别模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围为未知。...