找到11,752个数据集

标签: 自然语言处理

过滤结果
  • AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip

    2025年4月24日   

    AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,数据集,文本生成,机器学习,人工智能,机器翻译,智能对话 数据概述: 该数据集包含来自 Alpaca GPT4 项目的中文数据,记录了用于训练和优化大型语言模型的高质量文本数据。主要特征如下:...
    packageimg
  • 医学教育与评估培训数据集NBMETrainsetDataset-vumichien

    2025年4月24日   

    医学教育与评估培训数据集NBMETrainsetDataset-vumichien 数据来源:互联网公开数据 标签:医学教育,评估培训,数据集,机器学习,自然语言处理,教育研究,医学知识,人工智能...
    packageimg
  • 提取摘要数据集ExtractAbstractDataset-potatohuhu

    2025年4月24日   

    提取摘要数据集ExtractAbstractDataset-potatohuhu 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,深度学习,摘要生成,文本分析,人工智能 数据概述:该数据集包含从互联网上提取的文本及其对应的摘要信息,旨在用于文本摘要模型的训练和评估。主要特征如下:...
    packageimg
  • 自然语言处理自动补全数据集NLPAutosuggestionDataset-bhuvanavijaya

    2025年4月24日   

    自然语言处理自动补全数据集NLPAutosuggestionDataset-bhuvanavijaya 数据来源:互联网公开数据 标签:自然语言处理,自动补全,数据集,文本分析,机器学习,人工智能,推荐系统,语言模型 数据概述: 该数据集包含来自互联网公开资源的自然语言处理自动补全数据,记录了用户在输入过程中可能的补全建议。主要特征如下:...
    packageimg
  • 法律文档训练数据集TrainDataLegalDocDataset-lthnhtinostic

    2025年4月24日   

    法律文档训练数据集TrainDataLegalDocDataset-lthnhtinostic 数据来源:互联网公开数据 标签:法律,文档分析,数据集,自然语言处理,文本分类,机器学习,合规性,智能合约 数据概述: 该数据集包含法律文档的相关数据,记录了各类法律文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 谷歌应用商店预算类应用评论数据集-irineshishkina

    2025年4月24日   

    谷歌应用商店预算类应用评论数据集-irineshishkina 数据来源:互联网公开数据 标签:应用商店,评论数据,预算管理,用户评价,文本分析,情感分析,自然语言处理,移动应用 数据概述: 该数据集包含来自谷歌应用商店的预算类应用的评论数据,记录了用户对预算管理类应用的反馈和评价。主要特征如下:...
    packageimg
  • 自然语言处理核心技术与CORD-19疫情文献数据集NLPCoreandCORD-19OutputDataset-varunmittalnlpcore

    2025年4月24日   

    自然语言处理核心技术与CORD-19疫情文献数据集NLPCoreandCORD-19OutputDataset-varunmittalnlpcore 数据来源:互联网公开数据 标签:自然语言处理,疫情研究,数据集,文本分析,机器学习,公共卫生,文献挖掘,人工智能 数据概述: 该数据集包含来自NLP...
    packageimg
  • 孟加拉语网络欺凌数据集BengaliBullyDataset-mdalamintalukder

    2025年4月24日   

    孟加拉语网络欺凌数据集BengaliBullyDataset-mdalamintalukder 数据来源:互联网公开数据 标签:网络欺凌,孟加拉语,数据集,文本分析,社交媒体,自然语言处理,机器学习,社会研究 数据概述: 该数据集包含来自孟加拉国社交媒体平台的网络欺凌文本数据,记录了网络用户之间的欺凌行为及相关评论。主要特征如下:...
    packageimg
  • 日本社交平台对话数据集JapanConversationDataset-nguyencongcuong

    2025年4月24日   

    日本社交平台对话数据集JapanConversationDataset-nguyencongcuong 数据来源:互联网公开数据 标签:对话数据,日语,文本分析,自然语言处理,情感分析,社交媒体,语言学,机器学习 数据概述: 该数据集包含来自日本社交平台的用户对话数据,记录了用户间的交流内容。主要特征如下: 时间跨度:数据记录的时间范围为未知。...
    packageimg
  • 谷歌问答数据集GoogleQuestionDataset-tankmitesh

    2025年4月24日   

    谷歌问答数据集GoogleQuestionDataset-tankmitesh 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,信息检索,人工智能,搜索引擎,用户查询 数据概述: 该数据集包含来自谷歌搜索引擎的用户查询数据,记录了用户向谷歌搜索提问的具体内容和相关特征。主要特征如下:...
    packageimg
  • 数据2022年印度板球超级联赛推文数据集IPL2022TweetsDataset-karan003

    2025年4月24日   

    2022年印度板球超级联赛推文数据集IPL2022TweetsDataset-karan003 数据来源:互联网公开数据 标签:社交媒体,板球,数据分析,情感分析,机器学习,体育赛事,自然语言处理,大数据 数据概述: 该数据集包含来自2022年印度板球超级联赛(IPL)期间的推文数据,记录了用户在社交媒体上关于赛事的讨论和反馈。主要特征如下:...
    packageimg
  • 莎士比亚作品文本数据分析数据集ShakespeareDataCSVDataset-dredox

    2025年4月24日   

    莎士比亚作品文本数据分析数据集ShakespeareDataCSVDataset-dredox 数据来源:互联网公开数据 标签:文学分析,文本挖掘,数据集,莎士比亚,自然语言处理,机器学习,文学研究,数据科学 数据概述: 该数据集包含莎士比亚作品的相关文本数据,记录了莎士比亚戏剧和诗歌的文本内容及其属性。主要特征如下:...
    packageimg
  • 拉丁语语料库数据集CorpusLatinDataset-nerdofdot

    2025年4月24日   

    拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:...
    packageimg
  • 德语语法数据集GermanGrammarDataset-upamasarker

    2025年4月24日   

    德语语法数据集GermanGrammarDataset-upamasarker 数据来源:互联网公开数据 标签:语言学,语法分析,数据集,自然语言处理,教育技术,机器学习,德语学习,语言研究 数据概述: 该数据集包含来自德语语法研究项目的数据,记录了德语语法规则和例句的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang

    2025年4月24日   

    多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:...
    packageimg
  • 新冠疫情推文情感分析数据集COVID-19TweetSentimentAnalysisDataset-fidelicajeanny

    2025年4月24日   

    新冠疫情推文情感分析数据集COVID-19TweetSentimentAnalysisDataset-fidelicajeanny 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,公共卫生,数据挖掘,自然语言处理,疫情研究 数据概述:...
    packageimg
  • 孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70

    2025年4月24日   

    孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,语言处理,孟加拉语,分类算法 数据概述: 该数据集包含来自孟加拉语新闻网站的数据,记录了各类新闻文章的文本内容和分类标签。主要特征如下:...
    packageimg
  • 常识问答数据集CommonsenseQADataset-dschettler8845

    2025年4月24日   

    常识问答数据集CommonsenseQADataset-dschettler8845 数据来源:互联网公开数据 标签:常识推理,问答,自然语言处理,机器学习,人工智能,知识图谱,语义理解,数据集 数据概述: 该数据集包含来自常识问答任务的数据,旨在评估模型对常识知识的理解和推理能力。主要特征如下:...
    packageimg
  • 推特社交媒体情感分析数据集TweetsAnalysisDataset-aswitharamasamy

    2025年4月24日   

    推特社交媒体情感分析数据集TweetsAnalysisDataset-aswitharamasamy 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,文本挖掘,自然语言处理,机器学习,舆情分析,社交网络 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,用于情感分析和舆情分析研究。主要特征如下:...
    packageimg
  • 俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik

    2025年4月24日   

    俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:...
    packageimg