找到11,684个数据集

标签: 自然语言处理

过滤结果
  • 葡萄酒品鉴笔记分析数据集WineTastingNotesAnalysis-statiana

    2025年5月29日   

    葡萄酒品鉴笔记分析数据集WineTastingNotesAnalysis-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴笔记, 文本分析, 自然语言处理, 情感分析, 葡萄酒产区, 数据清洗, 机器学习 数据概述: 该数据集包含来自葡萄酒品鉴笔记的数据,记录了不同年份、不同葡萄酒的品鉴描述。主要特征如下:...
    packageimg
  • 人物图像描述生成数据集PersonImageDescriptionGeneration-superai21383

    2025年5月29日   

    人物图像描述生成数据集PersonImageDescriptionGeneration-superai21383 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 人工智能, 图像识别, 自然语言处理, 数据标注, 图像文本, 多模态学习 数据概述: 该数据集包含人物图像及其对应的文字描述,旨在用于图像描述生成任务。主要特征如下:...
    packageimg
  • 亚马逊商品评论情感分析数据集AmazonProductReviewSentimentAnalysis-jamiajackson

    2025年5月29日   

    亚马逊商品评论情感分析数据集AmazonProductReviewSentimentAnalysis-jamiajackson 数据来源:互联网公开数据 标签:情感分析, 文本分类, 评论分析, 机器学习, 自然语言处理, 数据标注, 情感极性, 电商数据 数据概述:...
    packageimg
  • 电影评论情感分析数据集MovieReviewSentimentAnalysis-faseehurrehman

    2025年5月29日   

    电影评论情感分析数据集MovieReviewSentimentAnalysis-faseehurrehman 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 情感词典 数据概述: 该数据集包含来自IMDB(Internet Movie...
    packageimg
  • 代码笔记语言识别与排名数据集CodeNotebookLanguageIdentificationandRanking-kirderf

    2025年5月29日   

    代码笔记语言识别与排名数据集CodeNotebookLanguageIdentificationandRanking-kirderf 数据来源:互联网公开数据 标签:代码笔记, 语言识别, 文本分析, 机器学习, 排名预测, 自然语言处理, 数据标注, 代码分析 数据概述:...
    packageimg
  • 亚马逊食品评论文本清洗数据集-bchltrng

    2025年5月29日   

    亚马逊食品评论文本清洗数据集-bchltrng 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,亚马逊,食品评论,数据集,机器学习,评论数据 数据概述: 该数据集包含来自亚马逊网站的食品评论数据,主要用于自然语言处理和文本分析任务。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,涵盖了亚马逊网站上的食品评论历史数据。 地理范围:...
    packageimg
  • 假新闻与真实新闻检测数据集FakeandRealNewsDetectionDataset-vivekrainaa

    2025年5月29日   

    假新闻与真实新闻检测数据集FakeandRealNewsDetectionDataset-vivekrainaa 数据来源:互联网公开数据 标签:新闻检测,数据集,文本分析,机器学习,自然语言处理,信息传播,数据分析,深度学习 数据概述: 该数据集包含来自多个新闻来源的假新闻与真实新闻数据,记录了新闻文本及其标签(真假类别)。主要特征如下:...
    packageimg
  • IMDB电影评论按评分分组数据集IMDBMovieReviewsGroupedbyRatingsDataset-mlopssss

    2025年5月29日   

    IMDB电影评论按评分分组数据集IMDBMovieReviewsGroupedbyRatingsDataset-mlopssss 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本分类,机器学习,情感识别,数据挖掘 数据概述:...
    packageimg
  • 越南法律法规文本数据集-thinh4526

    2025年5月29日   

    越南法律法规文本数据集-thinh4526 数据来源:互联网公开数据 标签:法律法规,文本分析,自然语言处理,越南,数据集,法律检索,文本挖掘,法规研究 数据概述: 该数据集包含来自越南政府官方网站及其他公开渠道的法律法规文本数据,记录了越南的法律法规、政府规章、决议等文件。主要特征如下: 时间跨度:数据记录的时间范围从20世纪90年代至今。...
    packageimg
  • YouTube视频内容分析数据集YouTubeVideosCleanedSet-coffeeinspace

    2025年5月29日   

    YouTube视频内容分析数据集YouTubeVideosCleanedSet-coffeeinspace 数据来源:互联网公开数据 标签:视频分析,数据集,社交媒体,内容挖掘,自然语言处理,机器学习,传播学,多媒体处理 数据概述: 该数据集包含来自YouTube平台的已清理视频数据,记录了视频的基本信息、内容特征及用户互动数据。主要特征如下:...
    packageimg
  • 英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar

    2025年5月29日   

    英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:...
    packageimg
  • 消费者金融投诉数据集CFPBComplaintsDataset-koushiktcs12

    2025年5月29日   

    消费者金融投诉数据集CFPBComplaintsDataset-koushiktcs12 数据来源:互联网公开数据 标签:消费者金融,投诉数据,数据集,自然语言处理,文本分析,金融科技,客户服务,风险管理 数据概述: 该数据集包含来自美国消费者金融保护局(CFPB)的消费者投诉数据,记录了消费者对各种金融产品和服务的投诉信息。主要特征如下:...
    packageimg
  • 计算机科学论文引用关系数据集CSPapersCrowwdDataset-siyagarg12

    2025年5月29日   

    计算机科学论文引用关系数据集CSPapersCrowwdDataset-siyagarg12 数据来源:互联网公开数据 标签:计算机科学,论文引用,数据集,学术研究,文献计量学,知识图谱,自然语言处理,数据挖掘 数据概述: 该数据集包含了来自CrowdFlower平台的计算机科学论文数据,记录了论文之间的引用关系。主要特征如下:...
    packageimg
  • 金融情绪分析股票数据集EMH-Data-darrenmok

    2025年5月29日   

    金融情绪分析股票数据集EMH-Data-darrenmok 数据来源:互联网公开数据 标签:金融情绪,股票市场,数据集,自然语言处理,情绪分析,金融市场,投资决策,量化分析 数据概述: 该数据集包含来自EMH-Data的数据,记录了社交媒体和新闻媒体中关于股票市场的情绪信息及其对股票价格的影响。主要特征如下:...
    packageimg
  • Sber银行问答数据集SberQADataset-theerror

    2025年5月29日   

    Sber银行问答数据集SberQADataset-theerror 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,人工智能,银行服务,客户支持,信息检索 数据概述:该数据集由Sber银行提供,包含了一系列用户与银行客服之间的问答对话,适用于自然语言处理和问答系统的研究。主要特征如下:...
    packageimg
  • 有毒评论清理数据集JigsawToxicCommentCleanData-harits

    2025年5月29日   

    有毒评论清理数据集JigsawToxicCommentCleanData-harits 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,情感分析,垃圾信息,网络安全,数据清理 数据概述: 该数据集包含来自Jigsaw平台的有毒评论数据,记录了网络上具有攻击性、侮辱性或不当内容的评论信息。主要特征如下:...
    packageimg
  • 代码单元排序模型评估数据集CodeCellOrderingModelEvaluationDataset-goldenlock

    2025年5月29日   

    代码单元排序模型评估数据集CodeCellOrderingModelEvaluationDataset-goldenlock 数据来源:互联网公开数据 标签:代码单元排序, 机器学习, 模型评估, 自然语言处理, 代码分析, 深度学习, 文本序列, 实验结果 数据概述:...
    packageimg
  • reddit比特币话题文本数据集RedditBitcoinTopicTextDataset-afterrain007

    2025年5月29日   

    reddit比特币话题文本数据集RedditBitcoinTopicTextDataset-afterrain007 数据来源:互联网公开数据 标签:社交网络,比特币,文本分析,数据集,机器学习,自然语言处理,金融科技,数据挖掘 数据概述:...
    packageimg
  • 俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh

    2025年5月29日   

    俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:...
    packageimg
  • 图像文字识别测试数据集ImageTextRecognitionTestDataset-vinhlaq

    2025年5月29日   

    图像文字识别测试数据集ImageTextRecognitionTestDataset-vinhlaq 数据来源:互联网公开数据 标签:图像识别, OCR, 文字识别, 文本检测, 图像处理, 机器学习, 测试集, 自然语言处理 数据概述: 该数据集包含从图像中提取的文字信息,用于评估和测试图像文字识别(OCR)模型的性能。主要特征如下:...
    packageimg