-
越南语语音转录文本数据集VietnameseSpeechTranscriptionDataset-chauly
越南语语音转录文本数据集VietnameseSpeechTranscriptionDataset-chauly 数据来源:互联网公开数据 标签:语音识别, 语音转录, 越南语, 声学模型, 语言模型, 文本标注, 音频分析, 深度学习 数据概述: 该数据集包含越南语语音片段及其对应的文本转录内容。主要特征如下:... -
大型语言模型提示恢复门控聚类标签数据集LLMPromptRecoveryGateClusterTagsDataset-arc144
大型语言模型提示恢复门控聚类标签数据集LLMPromptRecoveryGateClusterTagsDataset-arc144 数据来源:互联网公开数据 标签:语言模型,提示恢复,聚类分析,数据集,机器学习,自然语言处理,人工智能,数据挖掘 数据概述:... -
维基百科训练数据集Wiki-TrainDataset-victoriasaz
维基百科训练数据集Wiki-TrainDataset-victoriasaz 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,维基百科,文本分类,语言模型,信息检索 数据概述: 该数据集包含来自维基百科的文本数据,主要用于训练自然语言处理模型。主要特征如下:... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-fadyelkbeer
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 自然语言处理, 文本摘要, 机器翻译, 新闻语料库, 文本分析, 语言模型 数据概述: 该数据集包含来自BBC新闻的阿拉伯语新闻文章及其摘要,旨在用于文本摘要任务。主要特征如下:... -
数据235k人类与大型语言模型对比数据集235kHumanvs-LLMDatasetwith1024Tokens-hajarhisham
235k人类与大型语言模型对比数据集235kHumanvs-LLMDatasetwith1024Tokens-hajarhisham 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,语言模型,文本生成,对比分析,模型评估 数据概述:... -
文本创作风格迁移指令数据集TextStyleTransferPromptDataset-yuanzhezhou
文本创作风格迁移指令数据集TextStyleTransferPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 自然语言处理, 提示工程, 文本创作, 深度学习, 数据增强, 语言模型 数据概述:... -
网络评论反讽识别数据集SarcasmPreprocessedDataset-arghya007
网络评论反讽识别数据集SarcasmPreprocessedDataset-arghya007 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,情感识别,语言模型,社交媒体 数据概述: 该数据集包含经过预处理的网络评论数据,主要用于识别和分类反讽评论。主要特征如下:... -
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器翻译,语言模型,多语言数据集,机器学习,语义分析,人工智能 数据概述: 该数据集包含来自波斯语领域的文本改写数据,记录了波斯语文本的改写和翻译对。主要特征如下:... -
数据2024年语音识别与自然语言处理大赛Whisper2024数据集Whisper2024Dataset-tsobolev
2024年语音识别与自然语言处理大赛Whisper2024数据集Whisper2024Dataset-tsobolev 数据来源:互联网公开数据 标签:语音识别,自然语言处理,数据集,机器学习,语音转文字,人工智能,深度学习,语言模型 数据概述: 该数据集由2024年语音识别与自然语言处理大赛(Whisper... -
神经问答翻译数据集NQ-TranslatedDataDataset-vanle73
神经问答翻译数据集NQ-TranslatedDataDataset-vanle73 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,问答系统,数据集,文本翻译,语义理解,深度学习,语言模型 数据概述: 该数据集包含了从神经问答(NQ)数据集中翻译而来的数据,旨在用于机器翻译和跨语言问答系统的研究。主要特征如下:... -
TinyBERT文本相似度计算数据集-ktgiahieu
TinyBERT文本相似度计算数据集-ktgiahieu 数据来源:互联网公开数据 标签:文本相似度,自然语言处理,数据集,语义分析,机器翻译,深度学习,文本分析,语言模型 数据概述: 该数据集是用于训练和评估基于TinyBERT模型的文本相似度计算任务的数据集。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本数据。... -
大型语言模型与人类在机器学习分类任务中的表现对比数据集LLMvsHumanMLClassifiersDataset-mohamedlotfy50
大型语言模型与人类在机器学习分类任务中的表现对比数据集LLMvsHumanMLClassifiersDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:机器学习,语言模型,分类任务,性能对比,人工智能,数据分析,模型评估,自然语言处理 数据概述: 该数据集专注于对比大型语言模型(Large Language Models,... -
阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104
阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 自然语言处理, 文本分析, 舆情分析, 语言模型, 摘要生成 数据概述:... -
快速AI语言模型训练数据集FastAIWt103LanguageModelTrainingDataset-aunghtayah
快速AI语言模型训练数据集FastAIWt103LanguageModelTrainingDataset-aunghtayah 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,深度学习,文本分类,文本生成,机器学习,AI研究 数据概述:... -
伪推理数据集Pseudo-InferenceDataset2-black99ylunar
伪推理数据集Pseudo-InferenceDataset2-black99ylunar 数据来源:互联网公开数据 标签:伪推理,数据集,自然语言处理,机器学习,文本生成,深度学习,人工智能,语言模型 数据概述: 该数据集包含用于自然语言处理和机器学习任务中的伪推理数据,记录了文本生成和推理任务中的输入输出对。主要特征如下:... -
自然语言处理模型与算法数据集TransformersTutorialDataset-b1ueee
自然语言处理模型与算法数据集TransformersTutorialDataset-b1ueee 数据来源:互联网公开数据 标签:自然语言处理,机器学习,深度学习,数据集,模型训练,文本分类,语言模型,算法研究 数据概述: 该数据集包含来自自然语言处理领域的模型与算法数据,记录了用于训练和评估自然语言处理模型的文本和标签信息。主要特征如下:... -
语言模型系统数据集LMSYSDatasets-lizhecheng
语言模型系统数据集LMSYSDatasets-lizhecheng 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,语言模型,文本生成,深度学习,人工智能,模型评估 数据概述: 该数据集由LMSYS项目提供,主要记录了多种语言模型在文本生成和自然语言处理任务中的表现数据。主要特征如下:... -
文本润色指令数据集TextRefinementPromptDataset-yuanzhezhou
文本润色指令数据集TextRefinementPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 提示工程, 自然语言处理, 文本编辑, 风格迁移, 数据标注, 语言模型, 任务指令 数据概述: 该数据集包含用于文本润色的指令,记录了多种文本改写、风格转换的任务描述。主要特征如下:... -
文本片段上下文关系数据集TextFragmentContextRelationshipDataset-srisanthoshhari
文本片段上下文关系数据集TextFragmentContextRelationshipDataset-srisanthoshhari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,上下文关系,片段抽取,语言模型,数据标注,文本序列,语料库 数据概述: 该数据集包含从特定语料库中提取的文本片段及其上下文信息。主要特征如下:... -
文本生成与写作评估数据集TextGenerationandWritingAssessmentDataset-sahilingole
文本生成与写作评估数据集TextGenerationandWritingAssessmentDataset-sahilingole 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器写作, 论文写作, 自然语言处理, 语言模型, 文本分析, 机器学习 数据概述:...