找到5,741个数据集

标签: 文本分析

过滤结果
  • 新闻文本分类数据集-oussemahedri

    2025年4月25日   

    新闻文本分类数据集-oussemahedri 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,文本分析,数据集,新闻报道,中文 数据概述:该数据集包含来自互联网新闻网站的新闻文本数据,记录了不同类别新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov

    2025年4月25日   

    楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:...
    packageimg
  • 语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng

    2025年4月25日   

    语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng 数据来源:互联网公开数据 标签:人工智能,语言模型,数据生成,自然语言处理,机器学习,数据集,文本分析,智能生成 数据概述: 该数据集包含由语言模型和人工智能技术生成的文本数据,记录了通过先进AI模型生成的各种类型文本内容。主要特征如下:...
    packageimg
  • IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7

    2025年4月25日   

    IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,文本分析,机器学习,情感分析,文本分类,人工智能 数据概述:该数据集包含来自IMDb网站的电影评论数据,已经进行了预处理,适用于情感分析,文本分类等任务。主要特征如下:...
    packageimg
  • BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban

    2025年4月25日   

    BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:...
    packageimg
  • BBC新闻训练集BBCNewsTrainingSet-subhashisb

    2025年4月25日   

    BBC新闻训练集BBCNewsTrainingSet-subhashisb 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分类,自然语言处理,机器学习,深度学习,文本分析,学术资源 数据概述:该数据集包含来自BBC新闻的训练数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 文章元数据数据集ArticleMeta-dataDataset-gautamsandeep

    2025年4月25日   

    文章元数据数据集ArticleMeta-dataDataset-gautamsandeep 数据来源:互联网公开数据 标签:元数据,数据集,信息检索,文本分析,自然语言处理,学术研究,知识发现,数据挖掘 数据概述:该数据集包含来自学术文章的元数据,记录了文章的各种信息,如标题,摘要,作者,关键词,出版日期,期刊信息等。主要特征如下:...
    packageimg
  • 法官判决命中数据集JudgeHitData-jidbro1

    2025年4月25日   

    法官判决命中数据集JudgeHitData-jidbro1 数据来源:互联网公开数据 标签:司法,判决,数据集,机器学习,法律,文本分析,自然语言处理,刑事案件 数据概述: 该数据集包含法官判决相关数据,旨在用于研究判决结果预测,法律文本分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围从[起始年份]到[结束年份],例如2010年至2020年。...
    packageimg
  • 社交平台评论分类均衡数据集JigsawClassesBalancedDataset-linshokaku

    2025年4月25日   

    社交平台评论分类均衡数据集JigsawClassesBalancedDataset-linshokaku 数据来源:互联网公开数据 标签:社交平台,评论分类,数据集,机器学习,自然语言处理,文本分析,情感分析,不平衡数据处理 数据概述:该数据集包含来自社交平台的评论数据,旨在用于情感和主题分类任务。主要特征如下:...
    packageimg
  • UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti

    2025年4月25日   

    UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,情感分析,机器翻译,机器学习,人工智能,文本挖掘 数据概述: 该数据集包含来自UnivAI黑客松活动的数据,记录了参赛者在活动中生成和处理的文本数据。主要特征如下:...
    packageimg
  • 波斯语Farsi励志语录数据集MotivateQuotesFarsiPersianDataset-alijahani

    2025年4月25日   

    波斯语Farsi励志语录数据集MotivateQuotesFarsiPersianDataset-alijahani 数据来源:互联网公开数据 标签:励志语录,波斯语,数据集,语言学习,文化研究,文本分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 凤凰Wright优秀律师第一季剧本数据集PhoenixWrightAceAttorneySeason1TranscriptDataset-gideonmckinlay

    2025年4月25日   

    凤凰Wright优秀律师第一季剧本数据集PhoenixWrightAceAttorneySeason1TranscriptDataset-gideonmckinlay 数据来源:互联网公开数据 标签:法律剧本,游戏数据,文本分析,自然语言处理,数据集,机器学习,法律研究,游戏设计 数据概述: 该数据集包含来自《凤凰 Wright...
    packageimg
  • 自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque

    2025年4月25日   

    自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque 数据来源:互联网公开数据 标签:自然语言处理,相似度计算,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含用于训练自然语言处理模型的数据,专注于文本相似度计算任务。主要特征如下:...
    packageimg
  • 英国招聘网站职位描述数据集ReedJobBoardJobDescriptionsDataset-zeeshaanpathan

    2025年4月25日   

    英国招聘网站职位描述数据集ReedJobBoardJobDescriptionsDataset-zeeshaanpathan 数据来源:互联网公开数据 标签:招聘,职位描述,文本分析,自然语言处理,数据集,就业市场,机器学习,数据挖掘 数据概述: 该数据集包含了来自英国Reed招聘网站的职位描述信息,记录了不同行业和职位的详细描述。主要特征如下:...
    packageimg
  • 真实与虚假论文数据集RealandFakeEssaysDataset-olegnsemenov

    2025年4月25日   

    真实与虚假论文数据集RealandFakeEssaysDataset-olegnsemenov 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,论文写作,机器学习,文本分类,学术诚信,写作风格 数据概述: 该数据集包含真实论文和虚假论文的数据,旨在用于文本分析和学术诚信研究。主要特征如下: 时间跨度:...
    packageimg
  • 孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary

    2025年4月25日   

    孟加拉语转罗马字数据集BanglatoRomanTransliterationDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:孟加拉语,罗马字,转写,数据集,自然语言处理,语言学,机器学习,文本分析 数据概述:...
    packageimg
  • 推特训练数据集TwitterTrainingDataset-aatithi

    2025年4月25日   

    推特训练数据集TwitterTrainingDataset-aatithi 数据来源:互联网公开数据 标签:社交媒体,文本分析,机器学习,情感分析,自然语言处理,数据挖掘,情感计算,数据标注 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关特征。主要特征如下:...
    packageimg
  • 表情符号数据集EmojiDataset-thecavemanjonno

    2025年4月25日   

    表情符号数据集EmojiDataset-thecavemanjonno 数据来源:互联网公开数据 标签:表情符号,数据集,自然语言处理,情感分析,文本分析,机器学习,社交媒体,情感识别 数据概述: 该数据集包含了各种表情符号及其对应的文本描述和上下文信息。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了多种表情符号的发布和使用时间。...
    packageimg
  • 英语推文数据集Tweet-EnglishDataset-mahdimahdi55

    2025年4月25日   

    英语推文数据集Tweet-EnglishDataset-mahdimahdi55 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,自然语言处理,机器学习,情感识别,数据挖掘 数据概述: 该数据集包含来自Twitter平台的英语推文数据,记录了用户在社交媒体上的文本内容。主要特征如下:...
    packageimg
  • 机器学习工程师岗位描述数据集-hasankumar

    2025年4月25日   

    机器学习工程师岗位描述数据集-hasankumar 数据来源:互联网公开数据 标签:机器学习,岗位描述,自然语言处理,文本分析,招聘,职位,数据科学,职业发展 数据概述: 该数据集包含了来自互联网的机器学习工程师岗位描述信息,记录了不同公司发布的招聘信息,旨在分析和理解机器学习工程师的职位要求,技能需求,工作职责等。主要特征如下: 时间跨度:...
    packageimg