找到730个数据集

标签: 语言模型

过滤结果
  • 语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha

    2025年4月22日   

    语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha 数据来源:互联网公开数据 标签:诗歌,语言模型,NLP,文本生成,机器学习,教育,学习资源 数据概述: 本数据集包含100首诗歌,适用于语言模型的文本生成任务。数据集中的诗歌涵盖了不同的风格和主题,包括抒情诗、叙事诗和自由诗等,为训练语言模型提供了丰富的文本素材。...
    packageimg
  • 英语模板数据集EnglishTemplatedDataset-rnaveensrinivas

    2025年4月22日   

    英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:...
    packageimg
  • 自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb

    2025年4月22日   

    自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,深度学习,神经网络,文本处理,语言模型,翻译模型 数据概述:...
    packageimg
  • 词性标注数据集POSTaggingDataset-hiuanh

    2025年4月22日   

    词性标注数据集POSTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:自然语言处理,词性标注,数据集,文本分析,机器学习,语言模型,文本挖掘,计算机语言学 数据概述: 该数据集专注于词性标注任务,包含大量文本样本及其对应的词性标签。主要特征如下: 时间跨度:数据记录的时间范围未明确,但数据集内容通常反映通用语言特征。...
    packageimg
  • 莫里哀戏剧台词数据集-guillaumegrosjean

    2025年4月22日   

    莫里哀戏剧台词数据集-guillaumegrosjean 数据来源:互联网公开数据 标签:戏剧,文学,莫里哀,台词,表演,语言模型,文本分析,法国古典主义,剧本 数据概述: 本数据集收录了莫里哀创作的32部戏剧作品中的所有台词提示(cue)。数据集以.csv文件形式存储,包含6个字段,详细描述了每句台词的上下文信息。 数据结构:...
    packageimg
  • 十大说唱歌手作品文本分析数据集-2023-ngxdtv

    2025年4月22日   

    十大说唱歌手作品文本分析数据集-2023-ngxdtv 数据来源:互联网公开数据 标签:说唱音乐,文本分析,自然语言处理,机器学习,文本分类,情感分析,主题建模,文本生成,语言模型,语音识别 数据概述: 本数据集包含超过2600首由十个不同说唱歌手创作的作品文本,其中包括Ali As、Alligatoah、Kollegah和Kool...
    packageimg
  • 阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889

    2025年4月22日   

    阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,数据集,文本分析,机器翻译,语言模型,文本语料库,语言学 数据概述: 该数据集包含超过70万条阿拉伯语句子,旨在为自然语言处理(NLP)任务提供丰富的文本语料库。主要特征如下:...
    packageimg
  • CommonLit英语文章摘要数据集-artisusxiren

    2025年4月22日   

    CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:...
    packageimg
  • Spacy测试数据集SpacyTestDataset-hhhurenyuan

    2025年4月22日   

    Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99

    2025年4月22日   

    语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源:互联网公开数据 标签:语言模型,文本生成,数据集,自然语言处理,机器学习,文本分析,语义理解,人工智能 数据概述: 该数据集包含用于语言模型训练和评估的文本数据,记录了多种文本的语义变换和生成任务。主要特征如下:...
    packageimg
  • 大型语言模型偏见与真实性评估数据集-pallaviroyal

    2025年4月22日   

    大型语言模型偏见与真实性评估数据集-pallaviroyal 数据来源:互联网公开数据 标签:语言模型,偏见,真实性,评估,自然语言处理,机器学习,CrowS-Pairs,WinoGender,TruthfulQA 数据概述:...
    packageimg
  • 孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath

    2025年4月22日   

    孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本分析,机器学习,语言模型,数据集,文本分类,机器翻译 数据概述: 该数据集包含来自孟加拉语的段落文本数据,记录了孟加拉语的段落内容。主要特征如下: 时间跨度:数据记录的时间范围不明确。...
    packageimg
  • 全球GPT-1N外部模型评估数据集-sasrdw

    2025年4月22日   

    全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。...
    packageimg
  • 对话摘要数据集SAMSUM-jainikkhil

    2025年4月22日   

    对话摘要数据集SAMSUM-jainikkhil 数据来源:互联网公开数据 标签:对话摘要,文本摘要,自然语言处理,数据集,机器学习,语言模型,文本分析,信息检索 数据概述:该数据集包含来自社交媒体平台的对话摘要数据,记录了用户之间的对话及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 提示生成数据集PromptsGeneratedV2Dataset-andreivanenko

    2025年4月22日   

    提示生成数据集PromptsGeneratedV2Dataset-andreivanenko 数据来源:互联网公开数据 标签:自然语言处理,提示生成,数据集,机器学习,文本生成,人工智能,语言模型,数据科学 数据概述: 该数据集包含来自Prompts Generated V2项目的提示生成数据,记录了用于训练和评估语言模型的提示文本。主要特征如下:...
    packageimg
  • 僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal

    2025年4月22日   

    僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:...
    packageimg
  • 杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh

    2025年4月22日   

    杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,模型训练,BART,文本匹配,语言模型,人工智能 数据概述: 该数据集包含杰布·普罗姆特(JB...
    packageimg
  • 文本可读性分析演示数据集-uocoeeds

    2025年4月22日   

    文本可读性分析演示数据集-uocoeeds 数据来源:互联网公开数据 标签:文本分析,可读性,自然语言处理,数据集,语言模型,文本挖掘,机器学习,教育 数据概述: 该数据集包含来自不同来源的文本数据,旨在用于评估和演示文本可读性分析方法。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的文本。...
    packageimg
  • 金融推文数据集-2021至2023年-amulyas

    2025年4月22日   

    金融推文数据集-2021至2023年-amulyas 数据来源:互联网公开数据 标签:金融推文,社交媒体,金融影响者,情感分析,语言模型,比特币,股票,市场趋势 数据概述:...
    packageimg
  • ChatGPT推特首月数据集2022年11月至12月-pcminh0505

    2025年4月22日   

    ChatGPT推特首月数据集2022年11月至12月-pcminh0505 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,人工智能,语言模型,科研,学术研究 数据概述: 本数据集包含了2022年11月30日至2022年12月31日期间,所有与ChatGPT相关的推特信息。数据通过Twitter API...
    packageimg