找到5,735个数据集

标签: 文本分析

过滤结果
  • 正负样本对书写数据集Positive-NegativePairHandwritingDataset-mariyamtahir

    2025年4月24日   

    正负样本对书写数据集Positive-NegativePairHandwritingDataset-mariyamtahir 数据来源:互联网公开数据 标签:手写识别,数据集,模式识别,数据增强,机器学习,计算机视觉,文本分析,自然语言处理 数据概述: 该数据集包含正负样本对的手写数据,记录了手写文本的识别与分类任务所需的训练和验证样本。主要特征如下:...
    packageimg
  • 自然语言处理与BERT模型评论数据集NLPBERTReviewsDataset-topcoder101

    2025年4月24日   

    自然语言处理与BERT模型评论数据集NLPBERTReviewsDataset-topcoder101 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,文本分析,机器学习,情感分析,深度学习,人工智能 数据概述: 该数据集包含来自多个平台的用户评论数据,记录了不同领域的产品或服务的用户评价。主要特征如下:...
    packageimg
  • 亚马逊机器学习训练数据集AmazonMLTrainDataset-bhavanabandi

    2025年4月24日   

    亚马逊机器学习训练数据集AmazonMLTrainDataset-bhavanabandi 数据来源:互联网公开数据 标签:机器学习,数据集,亚马逊,训练数据,自然语言处理,文本分析,推荐系统,数据挖掘 数据概述: 该数据集包含来自亚马逊的各种数据,主要用于机器学习模型的训练和评估。主要特征如下:...
    packageimg
  • 替换逗号数据集ReplacingCommaDataset-rojaramani

    2025年4月24日   

    替换逗号数据集ReplacingCommaDataset-rojaramani 数据来源:互联网公开数据 标签:数据清理,文本处理,数据集,自然语言处理,数据预处理,文本分析,数据科学,编程 数据概述:该数据集包含来自互联网公开的数据,记录了需要进行逗号替换的文本片段。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。...
    packageimg
  • 循环神经网络自然语言处理数据集RecurrentNeuralNetworkNLPDataset-jazidesigns

    2025年4月24日   

    循环神经网络自然语言处理数据集RecurrentNeuralNetworkNLPDataset-jazidesigns 数据来源:互联网公开数据 标签:自然语言处理,循环神经网络,数据集,机器学习,文本分析,深度学习,语言模型,序列建模 数据概述:...
    packageimg
  • 越南语聊天机器人数据集VietnameseChatbotDataset-huhuyngun

    2025年4月24日   

    越南语聊天机器人数据集VietnameseChatbotDataset-huhuyngun 数据来源:互联网公开数据 标签:人工智能,自然语言处理,聊天机器人,越南语,数据集,机器学习,文本分析,对话系统 数据概述: 该数据集包含来自越南语聊天机器人项目的对话数据,记录了用户与机器人之间的互动内容。主要特征如下:...
    packageimg
  • 亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21

    2025年4月24日   

    亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源:互联网公开数据 标签:情感分析,罗马乌尔都语,数据集,自然语言处理,机器学习,文本分析,亚马逊评论,语言学 数据概述: 该数据集包含了来自亚马逊的罗马乌尔都语评论数据,用于情感分析任务。主要特征如下: 时间跨度: 数据记录时间跨度未知,但包含了亚马逊用户在一定时期内发表的评论。...
    packageimg
  • 可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit

    2025年4月24日   

    可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源:互联网公开数据 标签:文本分析,可读性评估,数据集,自然语言处理,教育研究,机器学习,语料库,语言技术 数据概述: 该数据集包含用于可读性评估的文本数据,记录了多种不同难度级别的文本样本。主要特征如下: 时间跨度:...
    packageimg
  • 美国政府数据集标题数据集Data-govDatasetTitlesDataset-travistyler

    2025年4月24日   

    美国政府数据集标题数据集Data-govDatasetTitlesDataset-travistyler 数据来源:互联网公开数据 标签:政府数据,数据集,开放数据,数据分析,公共服务,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含了来自美国政府开放数据平台Data.gov的各种数据集标题。主要特征如下:...
    packageimg
  • 自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk

    2025年4月24日   

    自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,文本分析,机器学习,人工智能,语言模型,对比研究 数据概述:...
    packageimg
  • YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty

    2025年4月24日   

    YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty 数据来源:互联网公开数据 标签:视频字幕,数据集,自然语言处理,文本分析,机器学习,数据挖掘,多媒体,人工智能 数据概述: 该数据集包含来自YouTube平台的视频字幕数据,记录了视频内容的文字转录信息。主要特征如下:...
    packageimg
  • 法律领域分类数据集LegalAreasClassificationDataset-mohit3430

    2025年4月24日   

    法律领域分类数据集LegalAreasClassificationDataset-mohit3430 数据来源:互联网公开数据 标签:法律,数据集,分类,机器学习,自然语言处理,文本分析,人工智能,法律研究 数据概述: 该数据集包含来自法律领域的文本数据,记录了不同法律领域的案例,法规和判决等信息。主要特征如下:...
    packageimg
  • 真实洞察数据集FRICKMyRealInsightsMeansDataset-aniruddhkb

    2025年4月24日   

    真实洞察数据集FRICKMyRealInsightsMeansDataset-aniruddhkb 数据来源:互联网公开数据 标签:消费者行为,情感分析,用户洞察,市场调查,文本分析,社交媒体,机器学习,数据挖掘 数据概述: 该数据集包含来自FRICK My Real Insights...
    packageimg
  • 深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh

    2025年4月24日   

    深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh 数据来源:互联网公开数据 标签:自然语言处理,深度学习,数据集,文本分析,机器学习,语言模型,文本分类,情感分析 数据概述:该数据集包含用于自然语言处理的深度学习模型训练和评估的数据,记录了多种文本类型和任务的数据。主要特征如下:...
    packageimg
  • 统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny

    2025年4月24日   

    统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny 数据来源:互联网公开数据 标签:统计分析,词频计数,数据集,文本分析,自然语言处理,文本挖掘,数据科学,数据处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同文本的词频计数信息,适用于文本分析和词频统计等任务。主要特征如下:...
    packageimg
  • 推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147

    2025年4月24日   

    推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147 数据来源:互联网公开数据 标签:推特,退休,数据集,社交媒体,文本分析,情感分析,自然语言处理,用户行为 数据概述: 该数据集包含推特(Twitter)上与退休相关的数据,记录了用户发布的推文信息。主要特征如下:...
    packageimg
  • 预处理与词形还原测试数据数据集-marouanesidali

    2025年4月24日   

    预处理与词形还原测试数据数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,数据集,文本分析,机器学习,NLP,测试数据 数据概述: 该数据集包含了经过预处理和词形还原处理的文本数据,主要用于测试和评估文本处理算法的性能。主要特征如下:...
    packageimg
  • 古兰经经文转录数据集GeneratedTranscriptionoftheHolyQuranDataset-abdo3id

    2025年4月24日   

    古兰经经文转录数据集GeneratedTranscriptionoftheHolyQuranDataset-abdo3id 数据来源:互联网公开数据 标签:古兰经,宗教,经文,数据集,伊斯兰教,宗教研究,文本分析,文化研究 数据概述: 该数据集包含古兰经经文的数字化转录,记录了伊斯兰教经典《古兰经》的完整经文。主要特征如下:...
    packageimg
  • 极端言论检测数据集ExtremismDetectionDataset-ftgroups

    2025年4月24日   

    极端言论检测数据集ExtremismDetectionDataset-ftgroups 数据来源:互联网公开数据 标签:文本分析,极端言论,数据集,机器学习,自然语言处理,安全研究,社会研究,情感分析 数据概述: 该数据集包含来自网络平台和社交媒体的文本数据,记录了不同类型的极端言论内容。主要特征如下:...
    packageimg
  • Pneuma基准测试数据集-luthfibalaka

    2025年4月24日   

    Pneuma基准测试数据集-luthfibalaka 数据来源:互联网公开数据 标签:Pneuma,基准测试,自然语言处理,机器学习,文本生成,模型评估,文本分析,人工智能 数据概述:该数据集包含Pneuma项目发布的基准测试数据,用于评估自然语言处理模型的性能,特别是在文本生成和文本理解方面。主要特征如下:...
    packageimg