找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy

    2025年4月24日   

    知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy 数据来源:互联网公开数据 标签:知识库,数据集,信息检索,自然语言处理,人工智能,机器学习,语义网,知识图谱 数据概述: 该数据集包含用于知识库构建与应用的多领域结构化数据,记录了各类实体,属性及关系信息。主要特征如下: 时间跨度:...
    packageimg
  • 西班牙国会发言标点检测数据集

    2025年4月24日   

    西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1....
    packageimg
  • 文本处理测试数据集-sandeep100joshi

    2025年4月24日   

    文本处理测试数据集-sandeep100joshi 数据来源:互联网公开数据 标签:文本处理,测试,数据集,自然语言处理,机器学习,文本分析,数据清洗,模型评估 数据概述: 该数据集包含用于文本处理任务的测试数据,记录了各种文本信息。主要特征如下: 时间跨度: 数据记录的时间范围不限,主要关注文本内容本身。 地理范围:...
    packageimg
  • 产品关键词生成数据集-sarafrancic

    2025年4月24日   

    产品关键词生成数据集-sarafrancic 数据来源:互联网公开数据 标签:产品,关键词,生成,文本分析,自然语言处理,机器学习,搜索引擎优化,市场营销 数据概述:该数据集包含从各种来源收集的产品描述和相应的关键词,用于训练和评估关键词生成模型。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。 地理范围:数据来源广泛,涵盖全球市场。...
    packageimg
  • 情绪文本数据集EmotionsCleanTextDataset-markta186

    2025年4月24日   

    情绪文本数据集EmotionsCleanTextDataset-markta186 数据来源:互联网公开数据 标签:情绪分析,文本数据,数据集,自然语言处理,情感识别,机器学习,心理学,社会研究 数据概述: 该数据集包含经过清洗和标注的情绪文本数据,记录了不同情绪状态下的文本描述。主要特征如下:...
    packageimg
  • 邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan

    2025年4月24日   

    邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。...
    packageimg
  • 书籍推荐系统数据集BooksRecommendationDataset-vincentkohm

    2025年4月24日   

    书籍推荐系统数据集BooksRecommendationDataset-vincentkohm 数据来源:互联网公开数据 标签:书籍推荐,数据集,用户行为,机器学习,自然语言处理,用户画像,算法模型,个性化推荐 数据概述:该数据集包含来自多个在线书籍平台的用户行为数据,记录了用户的书籍阅读和推荐历史。主要特征如下:...
    packageimg
  • 新闻聚合平台用户行为数据集-overvisual

    2025年4月24日   

    新闻聚合平台用户行为数据集-overvisual 数据来源:互联网公开数据 标签:新闻聚合,用户行为,数据集,推荐系统,自然语言处理,点击预测,用户画像,数据分析 数据概述: 该数据集包含来自新闻聚合平台的用户行为数据,记录了用户在平台上的浏览,点击,分享等交互行为。主要特征如下: 时间跨度:数据记录的时间范围为一段时间,具体起止时间未明确。...
    packageimg
  • 点击诱饵内容识别数据集ClickbaitDataset-arkyabagchi

    2025年4月24日   

    点击诱饵内容识别数据集ClickbaitDataset-arkyabagchi 数据来源:互联网公开数据 标签:内容识别,数据集,自然语言处理,文本分类,机器学习,信息传播,媒体分析,广告技术 数据概述: 该数据集包含来自互联网公开渠道的文本内容数据,记录了用于识别和分类“点击诱饵”内容的样本。主要特征如下:...
    packageimg
  • 食谱生成数据集RecipeGenerationDataset-thakkarhiren

    2025年4月24日   

    食谱生成数据集RecipeGenerationDataset-thakkarhiren 数据来源:互联网公开数据 标签:食谱,菜谱,烹饪,数据集,自然语言处理,文本生成,机器学习,菜品推荐 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的制作方法和相关信息。主要特征如下: 时间跨度:数据记录的时间范围不限,覆盖了不同年代和地区的菜谱。...
    packageimg
  • 情绪符号情感分析数据集-2015-thomasseleck

    2025年4月24日   

    情绪符号情感分析数据集-2015-thomasseleck 数据来源:互联网公开数据 标签:情绪符号,情感分析,社交媒体,机器学习,自然语言处理,多语言,人类标注,科研 数据概述: 本数据集包含751个情绪符号及其自动分配的情感评分。情感评分是基于来自70,000条推文的分析得出的,这些推文由83位人类标注者在13种欧洲语言中进行标注。...
    packageimg
  • WebGPT与OpenAI模型性能对比数据集

    2025年4月24日   

    WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:...
    packageimg
  • 仇恨言论识别与分类数据集FinalCleanedHateSpeechBalancedDataDataset-nirmalgaud

    2025年4月24日   

    仇恨言论识别与分类数据集FinalCleanedHateSpeechBalancedDataDataset-nirmalgaud 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论,数据集,文本分类,机器学习,社会媒体,文本分析,情感分析 数据概述:...
    packageimg
  • 组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet

    2025年4月24日   

    组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:...
    packageimg
  • 技术问题编辑数据集-sshikamaru

    2025年4月24日   

    技术问题编辑数据集-sshikamaru 数据来源:互联网公开数据 标签:技术问题,编辑,数据集,技术文档,文本分析,问题解决,自然语言处理,技术支持 数据概述:该数据集包含来自编辑技术问题的记录,详细记录了用户提出的技术问题及其解决方案。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 问答数据集QuestionAnsweringDataset-namphmquang

    2025年4月24日   

    问答数据集QuestionAnsweringDataset-namphmquang 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,语言模型,知识库,信息检索,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 阿拉伯语仇恨言论检测数据集ArabicHateSpeechDetectionDataset-malkim

    2025年4月24日   

    阿拉伯语仇恨言论检测数据集ArabicHateSpeechDetectionDataset-malkim 数据来源:互联网公开数据 标签:仇恨言论,语言分析,数据集,机器学习,文本分类,社会媒体,自然语言处理,情感分析 数据概述: 该数据集包含来自阿拉伯语社交媒体平台的文本数据,记录了用户发布的内容及其是否被标记为仇恨言论。主要特征如下:...
    packageimg
  • 安防监控设备商品信息数据集-Souq-com-2023年-mansouraljuaid

    2025年4月24日   

    安防监控设备商品信息数据集-Souq-com-2023年-mansouraljuaid 数据来源:互联网公开数据 标签:监控摄像头,安防设备,商品信息,电商数据,价格分析,品牌,类别,自然语言处理,目标检测,计算机视觉 数据概述:...
    packageimg
  • 股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3

    2025年4月24日   

    股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3 数据来源:互联网公开数据 标签:股票情绪分析,新闻标题,数据集,金融分析,自然语言处理,机器学习,投资决策,信息检索 数据概述: 该数据集包含新闻标题,用于分析新闻报道对股票市场情绪的影响。主要特征如下:...
    packageimg
  • 六种情绪识别数据集SixEmotionRecognitionDataset-dtughdr

    2025年4月24日   

    六种情绪识别数据集SixEmotionRecognitionDataset-dtughdr 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,情感分析,心理学,计算机视觉,自然语言处理,人工智能 数据概述:该数据集包含来自多个来源的情绪识别数据,记录了六种主要情绪(快乐,悲伤,愤怒,惊讶,恐惧,厌恶)的详细信息。主要特征如下:...
    packageimg