找到5,744个数据集

标签: 文本分析

过滤结果
  • 维基百科评论毒性检测数据集WikipediaToxicityDetectionDataset-manishguptads

    2025年4月26日   

    维基百科评论毒性检测数据集WikipediaToxicityDetectionDataset-manishguptads 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,机器学习,内容审核,网络安全,数据挖掘 数据概述: 该数据集包含来自维基百科的评论数据,记录了用户在维基百科上的评论内容及其毒性标签。主要特征如下:...
    packageimg
  • CNN新闻文章数据集CNNNewsArticlesDataset-rockystats

    2025年4月26日   

    CNN新闻文章数据集CNNNewsArticlesDataset-rockystats 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,媒体研究,数据挖掘 数据概述: 该数据集包含来自美国有线电视新闻网(CNN)的新闻文章数据,记录了该媒体的新闻报道内容及相关信息。主要特征如下:...
    packageimg
  • 垃圾邮件识别数据集SpamMailClassificationDataset-yeswanthraj

    2025年4月26日   

    垃圾邮件识别数据集SpamMailClassificationDataset-yeswanthraj 数据来源:互联网公开数据 标签:垃圾邮件,数据集,邮件分类,自然语言处理,机器学习,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自多个邮件服务商的邮件数据,记录了各类邮件的文本内容和标签信息。主要特征如下:...
    packageimg
  • arXiv论文摘要及分类数据集DF-arXivResampledDataset-martabrasola

    2025年4月26日   

    arXiv论文摘要及分类数据集DF-arXivResampledDataset-martabrasola 数据来源:互联网公开数据 标签:学术论文,数据集,文本分析,机器学习,自然语言处理,论文分类,arXiv,深度学习 数据概述:...
    packageimg
  • 中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal

    2025年4月26日   

    中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:...
    packageimg
  • 推特游戏门事件数据集TwitterGameGateDataset-shishu1421

    2025年4月26日   

    推特游戏门事件数据集TwitterGameGateDataset-shishu1421 数据来源:互联网公开数据 标签:推特,游戏,社交媒体,舆情分析,数据挖掘,文本分析,情感分析,事件研究 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与“游戏门”(GameGate)事件相关的推文。主要特征如下:...
    packageimg
  • 垃圾邮件数据集SpamDataSet-vhenrique21

    2025年4月26日   

    垃圾邮件数据集SpamDataSet-vhenrique21 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,机器学习,文本分析,自然语言处理,数据挖掘,信息安全 数据概述: 该数据集包含来自电子邮件平台的邮件数据,记录了邮件的分类信息,主要用于垃圾邮件识别研究。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。...
    packageimg
  • 乌克兰新闻文章分类数据集UkrainianNewsArticlesbyCategoriesDataset-andriibilinskiy

    2025年4月26日   

    乌克兰新闻文章分类数据集UkrainianNewsArticlesbyCategoriesDataset-andriibilinskiy 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,分类,乌克兰,时事,媒体研究 数据概述: 该数据集包含来自乌克兰不同来源的新闻文章,根据内容进行分类。主要特征如下: 时间跨度:...
    packageimg
  • 文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees

    2025年4月26日   

    文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,深度学习,NLP,文本分析,语言模型 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在训练和评估自动文本摘要模型。主要特征如下: 时间跨度:...
    packageimg
  • 马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc

    2025年4月26日   

    马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc 数据来源:互联网公开数据 标签:语言处理,马拉地语,自然语言处理,数据集,文本分析,机器学习,语言翻译,数据挖掘 数据概述: 该数据集包含经过处理的马拉地语文本数据,记录了马拉地语的自然语言文本信息。主要特征如下:...
    packageimg
  • 瑞克和莫蒂剧情脚本数据集RickandMortyEditedScriptDataset-zudeneku

    2025年4月26日   

    瑞克和莫蒂剧情脚本数据集RickandMortyEditedScriptDataset-zudeneku 数据来源:互联网公开数据 标签:电视剧,剧情脚本,数据集,自然语言处理,机器学习,文本分析,影视研究,对话分析 数据概述: 该数据集包含来自电视剧《瑞克和莫蒂》的编辑版剧情脚本,记录了剧集的主要对话和情节内容。主要特征如下:...
    packageimg
  • 印度政治新闻2018数据集IndianPoliticsNews2018Dataset-xenomorph

    2025年4月26日   

    印度政治新闻2018数据集IndianPoliticsNews2018Dataset-xenomorph 数据来源:互联网公开数据 标签:印度政治,新闻数据,数据集,文本分析,自然语言处理,政治研究,社会学,数据分析 数据概述:该数据集包含来自2018年的印度政治新闻报道,记录了该年度内主要政治事件,领导人讲话,政策声明及相关评论。主要特征如下:...
    packageimg
  • 客户服务礼貌性评估数据集2022年版-bitext

    2025年4月26日   

    客户服务礼貌性评估数据集2022年版-bitext 数据来源:互联网公开数据 标签:客户服务,礼貌性评估,数据集,自然语言处理,客户满意度,文本分析,机器学习,商业智能 数据概述:该数据集包含来自客户服务对话的文本数据,记录了客户与客服代表之间的互动,主要特征如下: 时间跨度:数据记录的时间范围从2022年初到2022年底。...
    packageimg
  • 招聘信息数据库数据集JobsDatabaseDataset-diab91

    2025年4月26日   

    招聘信息数据库数据集JobsDatabaseDataset-diab91 数据来源:互联网公开数据 标签:招聘,就业,数据集,自然语言处理,文本分析,机器学习,职业发展,人力资源 数据概述: 该数据集包含来自多个招聘网站和平台的招聘信息数据,记录了各种职位和公司的详细招聘信息。主要特征如下:...
    packageimg
  • 招聘信息分析数据集-adarshsalunkhe

    2025年4月26日   

    招聘信息分析数据集-adarshsalunkhe 数据来源:互联网公开数据 标签:招聘,职位,数据集,自然语言处理,文本分析,机器学习,就业市场,人力资源 数据概述:该数据集包含了来自多个招聘网站的公开招聘信息,记录了不同公司发布的职位描述和相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2024年。...
    packageimg
  • 机器生成论据数据集ArgumentGPT生成论据Dataset-huannguyentrong

    2025年4月26日   

    机器生成论据数据集ArgumentGPT生成论据Dataset-huannguyentrong 数据来源:互联网公开数据 标签:机器生成,论据,文本分析,自然语言处理,人工智能,数据集,机器学习,学术研究 数据概述:该数据集包含来自 ArgumentGPT 的机器生成论据,记录了用于各种主题和立场的论据文本。主要特征如下:...
    packageimg
  • 教育领域ChatGPT相关推文数据集ChatGPTandEducationTweetsDataset-nutrientaxis

    2025年4月26日   

    教育领域ChatGPT相关推文数据集ChatGPTandEducationTweetsDataset-nutrientaxis 数据来源:互联网公开数据 标签:教育科技,社交媒体,数据集,文本分析,机器学习,自然语言处理,学术研究,舆情分析 数据概述:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechDetectionTwitterDataset-nidhibhatt10

    2025年4月26日   

    社交媒体仇恨言论检测数据集HateSpeechDetectionTwitterDataset-nidhibhatt10 数据来源:互联网公开数据 标签:社交媒体,仇恨言论,数据集,文本分析,机器学习,自然语言处理,情感分析,网络安全...
    packageimg
  • 乌尔都语罗马转写资源数据集-zeshanali

    2025年4月26日   

    乌尔都语罗马转写资源数据集-zeshanali 数据来源:互联网公开数据 标签:乌尔都语,罗马转写,语言资源,自然语言处理,数据集,文本分析,机器翻译,文本转换 数据概述: 该数据集包含了乌尔都语的罗马字母转写文本资源。主要特征如下: 时间跨度:数据涵盖了不同时期的乌尔都语文本。 地理范围:数据主要来源于乌尔都语使用者群体。...
    packageimg
  • Kaggle提示词自动评估数据集PromptsAESKaggleDataset-hadrianmarlowe

    2025年4月26日   

    Kaggle提示词自动评估数据集PromptsAESKaggleDataset-hadrianmarlowe 数据来源:互联网公开数据 标签:自然语言处理,提示词,自动评估,数据集,机器学习,文本分析,人工智能,教育技术 数据概述: 该数据集来源于Kaggle平台,专注于提示词(Prompts)的自动评估(Automated Essay...
    packageimg