找到11,756个数据集

标签: 自然语言处理

过滤结果
  • 增强版Fairseq模型训练数据集-arinaruck

    2025年4月24日   

    增强版Fairseq模型训练数据集-arinaruck 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,文本生成,数据集,深度学习,Fairseq,模型训练,人工智能 数据概述: 该数据集是用于训练和评估增强版Fairseq模型的文本数据集合,旨在提升模型在自然语言处理任务中的性能。主要特征如下: 时间跨度:...
    packageimg
  • 模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67

    2025年4月24日   

    模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67 数据来源:互联网公开数据 标签:模糊匹配,相似度分析,数据集,自然语言处理,文本匹配,文本处理,数据清洗,人工智能 数据概述: 该数据集包含使用FuzzyWuzzy库进行文本相似度匹配的输出结果,记录了不同文本字符串之间的相似度分数。主要特征如下:...
    packageimg
  • IMDB电影评论数据集2011-2017年-ivancanepa

    2025年4月24日   

    IMDB电影评论数据集2011-2017年-ivancanepa 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,文本分析,娱乐研究,社会学 数据概述:该数据集包含来自IMDB的50,000条电影评论,记录了用户对电影的感受和评价。主要特征如下: 时间跨度:数据记录的时间范围从2011年到2017年。...
    packageimg
  • 韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub

    2025年4月24日   

    韩国文本到SQL生成数据集KO-Text2SQL-CleanDataset-cocolabhub 数据来源:互联网公开数据 标签:文本到SQL,自然语言处理,数据集,数据库,语义解析,机器学习,韩国语,代码生成 数据概述: 该数据集包含韩国语文本及其对应的SQL查询语句,用于训练和评估文本到SQL(Text-to-SQL)生成模型。主要特征如下:...
    packageimg
  • Ankit推理数据集AnkitInferenceDataset-andysama79

    2025年4月24日   

    Ankit推理数据集AnkitInferenceDataset-andysama79 数据来源:互联网公开数据 标签:推理,数据集,自然语言处理,机器学习,文本分析,人工智能,深度学习,语言模型 数据概述: 该数据集包含来自Ankit项目的推理数据,记录了用于训练和评估自然语言处理模型的文本数据。主要特征如下:...
    packageimg
  • 巴西BuzzFeed点击诱饵标题数据集-rogeriochaves

    2025年4月24日   

    巴西BuzzFeed点击诱饵标题数据集-rogeriochaves 数据来源:互联网公开数据 标签:点击诱饵,巴西,BuzzFeed,标题,自然语言处理,文本分析,社交媒体,内容创作 数据概述: 该数据集包含了来自巴西BuzzFeed网站的点击诱饵标题数据,旨在研究和分析巴西葡萄牙语环境下的标题生成和内容传播规律。主要特征如下:...
    packageimg
  • 职位描述预测工作类型分类数据集-adarshsng

    2025年4月24日   

    职位描述预测工作类型分类数据集-adarshsng 数据来源:互联网公开数据 标签:职位描述,工作类型,自然语言处理,文本分类,机器学习,招聘,职业分析,数据挖掘 数据概述:该数据集包含来自招聘网站的职位描述数据,记录了不同职位的详细信息,用于预测工作类型分类。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了较长时期的招聘信息。...
    packageimg
  • 论辩训练数据集ArgumentTrainingDataset-wcqyfly

    2025年4月24日   

    论辩训练数据集ArgumentTrainingDataset-wcqyfly 数据来源:互联网公开数据 标签:自然语言处理,文本分类,论辩分析,机器学习,情感分析,文本挖掘,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的论辩文本数据,记录了不同主题的论辩内容和相关特征。主要特征如下:...
    packageimg
  • Flipkart产品评论情感分析数据集FlipkartDatasetforSentimentAnalysis-rohankulakarni

    2025年4月24日   

    Flipkart产品评论情感分析数据集FlipkartDatasetforSentimentAnalysis-rohankulakarni 数据来源:互联网公开数据 标签:产品评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,商业智能,电商分析 数据概述:...
    packageimg
  • 自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus

    2025年4月24日   

    自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,深度学习,人工智能,信息检索 数据概述: 该数据集来源于ChAIi问答任务竞赛,专注于自然语言处理领域的问答系统研究。主要特征如下:...
    packageimg
  • 英语阅读理解数据集RAGEnglishReadingComprehensionDataset-saadtahmid

    2025年4月24日   

    英语阅读理解数据集RAGEnglishReadingComprehensionDataset-saadtahmid 数据来源:互联网公开数据 标签:英语阅读,数据集,自然语言处理,机器学习,文本理解,学术研究,语言学习,教育...
    packageimg
  • 移动应用商店评论数据集Kredivoo从GooglePlay的评论数据集-ahmadseloabadi

    2025年4月24日   

    移动应用商店评论数据集Kredivoo从GooglePlay的评论数据集-ahmadseloabadi 数据来源:互联网公开数据 标签:移动应用,用户评论,数据集,应用商店,自然语言处理,情感分析,用户反馈,市场研究 数据概述: 该数据集包含来自 Google Play 商店的评论数据,主要记录了用户对移动应用的评价和反馈。主要特征如下:...
    packageimg
  • 句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05

    2025年4月24日   

    句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05 数据来源:互联网公开数据 标签:自然语言处理,句法分析,数据集,文本分类,机器学习,语言学研究,人工智能,教育技术 数据概述:...
    packageimg
  • 情感分析多模态数据集MOSIText-OnlyDataset-arminkgarj

    2025年4月24日   

    情感分析多模态数据集MOSIText-OnlyDataset-arminkgarj 数据来源:互联网公开数据 标签:情感分析,多模态数据,数据集,自然语言处理,机器学习,情感计算,文本分析,情感识别 数据概述: 该数据集来自情感分析多模态数据集(MOSI),专注于文本数据的情感分析。主要特征如下:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-kaizenhibiki

    2025年4月24日   

    IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-kaizenhibiki 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,机器学习,文本分类,数据集,电影评论 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • Reddit拆分数据集RedditSplitDataset-rajkumargovarthanan

    2025年4月24日   

    Reddit拆分数据集RedditSplitDataset-rajkumargovarthanan 数据来源:互联网公开数据 标签:Reddit, 数据集, 社交媒体, 文本分析, 自然语言处理, 机器学习, 情感分析, 社会研究 数据概述:该数据集包含来自Reddit社交网络的帖子数据,经过拆分处理,适用于文本分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • Kaggle大型语言模型科学考试数据集KaggleLargeLanguageModelScienceExamDataset-sabahesaraki

    2025年4月24日   

    Kaggle大型语言模型科学考试数据集KaggleLargeLanguageModelScienceExamDataset-sabahesaraki 数据来源:互联网公开数据 标签:科学考试,数据集,大型语言模型,机器学习,自然语言处理,教育技术,人工智能,评估研究 数据概述:...
    packageimg
  • 亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998

    2025年4月24日   

    亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998 数据来源:互联网公开数据 标签:电商,商品评论,自然语言处理,多语言,情感分析,机器学习,文本分析,亚马逊 数据概述: 该数据集由亚马逊提供,包含了来自亚马逊平台的商品评论数据,覆盖多种语言。主要特征如下:...
    packageimg
  • 推特样本数据集TwitterSampleDataset-siddheshshelke

    2025年4月24日   

    推特样本数据集TwitterSampleDataset-siddheshshelke 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,信息传播 数据概述: 该数据集包含来自推特平台的公开用户数据,记录了用户发布的推文内容及相关信息。主要特征如下:...
    packageimg
  • 烂番茄电影评论情感分析数据集RottenTomatoesViewsDataset-rohit265

    2025年4月24日   

    烂番茄电影评论情感分析数据集RottenTomatoesViewsDataset-rohit265 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,电影行业,观众反馈 数据概述: 该数据集包含来自烂番茄网站的电影评论数据,主要记录了观众对电影的评价和观点。主要特征如下:...
    packageimg