找到11,716个数据集

标签: 自然语言处理

过滤结果
  • 文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai

    2025年4月22日   

    文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:...
    packageimg
  • 西班牙政治推特语料库2023-ricardomoya

    2025年4月22日   

    西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和...
    packageimg
  • 德里推特数据集DelhiTweetsDataset-mlcovidresearch

    2025年4月22日   

    德里推特数据集DelhiTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:推特数据,社交媒体,数据分析,自然语言处理,城市研究,社会学,情感分析,机器学习 数据概述:该数据集包含来自德里的推特数据,记录了德里居民在社交媒体平台上的讨论和活动。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。...
    packageimg
  • 法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant

    2025年4月22日   

    法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant 数据来源:互联网公开数据 标签:财经新闻,法国,股票市场,情绪分析,CAC40,预测,自然语言处理,时间序列,VADER,翻译 数据概述:...
    packageimg
  • 数据2021年5月Job-A-Thon竞赛数据集-makrovh

    2025年4月22日   

    2021年5月Job-A-Thon竞赛数据集-makrovh 数据来源:互联网公开数据 标签:招聘,求职,数据集,机器学习,自然语言处理,文本分析,预测模型,人才市场 数据概述: 该数据集包含了2021年5月Job-A-Thon竞赛的相关数据,主要记录了招聘和求职信息,旨在用于构建预测模型。主要特征如下:...
    packageimg
  • 斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29

    2025年4月22日   

    斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29 数据来源:互联网公开数据 标签:斯瓦希里语,语音识别,数据集,自然语言处理,机器学习,语音技术,人工智能,语言学 数据概述: 该数据集包含来自互联网公开的斯瓦希里语语音数据,主要用于语音识别和自然语言处理的研究。主要特征如下:...
    packageimg
  • 英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong

    2025年4月22日   

    英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:...
    packageimg
  • 意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli

    2025年4月22日   

    意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,数据集,机器学习,文本分析,社交媒体,人工智能 数据概述:该数据集包含来自意大利社交媒体平台的数据,记录了用户发布的评论及其是否为讽刺的判断结果。主要特征如下:...
    packageimg
  • 情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999

    2025年4月22日   

    情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,社交媒体,学术研究,信息检索 数据概述:该数据集来自情感分析比赛,主要记录了社交媒体上的文本数据及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan

    2025年4月22日   

    互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本分析,机器学习,信息检索,媒体研究,互联网新闻 数据概述: 该数据集包含来自互联网新闻网站的新闻文章及其对应的摘要,适用于新闻摘要生成,文本摘要技术研究等任务。主要特征如下:...
    packageimg
  • 美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375

    2025年4月22日   

    美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375 数据来源:互联网公开数据 标签:航空业,情感分析,数据集,社交媒体,自然语言处理,客户反馈,市场研究,社会媒体分析 数据概述:该数据集包含来自推特的关于美国各大航空公司客户评论的数据,记录了客户对航空公司服务的情感评价。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri

    2025年4月22日   

    电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,信息安全,数据分析 数据概述: 该数据集包含来自电子邮件系统的邮件数据,记录了邮件的分类标签和内容特征。主要特征如下:...
    packageimg
  • Zipf分布与Gabor特征数据集ZipfandGaborFeaturesDataset-mohamedchakerouari

    2025年4月22日   

    Zipf分布与Gabor特征数据集ZipfandGaborFeaturesDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:特征提取,数据集,信号处理,模式识别,机器学习,视觉特征,自然语言处理,频率分析 数据概述:...
    packageimg
  • 放射科报告数据集RadiologyReportDataset-lucario73

    2025年4月22日   

    放射科报告数据集RadiologyReportDataset-lucario73 数据来源:互联网公开数据 标签:医学影像,放射学,数据集,自然语言处理,文本分析,疾病诊断,深度学习,医疗健康 数据概述:该数据集包含来自公开医疗机构的放射科报告,记录了患者的影像学检查结果和医生的诊断意见。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDb50kMovieReviewDataset-zahidhasan00

    2025年4月22日   

    电影评论情感分析数据集IMDb50kMovieReviewDataset-zahidhasan00 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,电影评论,机器学习,文本分类,人工智能,心理学 数据概述: 该数据集包含来自IMDb(互联网电影数据库)的电影评论数据,记录了用户对电影的评价和对应的情感标签。主要特征如下:...
    packageimg
  • 垃圾邮件与正常邮件数据集Spam-HamEmailDataset-ppdolphinyy

    2025年4月22日   

    垃圾邮件与正常邮件数据集Spam-HamEmailDataset-ppdolphinyy 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,文本分类,自然语言处理,机器学习,数据集,邮件分析,情感分析 数据概述: 该数据集包含来自互联网的电子邮件数据,记录了邮件的内容及其类别(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 肺不张MIMIC报告数据集AtelectasisMIMICReportsDataset-wasifnafee

    2025年4月22日   

    肺不张MIMIC报告数据集AtelectasisMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗健康,肺不张,MIMIC数据库,临床报告,自然语言处理,医学研究,数据分析,临床决策支持 数据概述:...
    packageimg
  • YouTube视频评论文本数据数据集-counito27

    2025年4月22日   

    YouTube视频评论文本数据数据集-counito27 数据来源:互联网公开数据 标签:YouTube,评论,文本数据,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自YouTube平台的视频评论数据,记录了用户对不同视频的评论内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据集的创建时间。...
    packageimg
  • 法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal

    2025年4月22日   

    法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal 数据来源:互联网公开数据 标签:法律数据,预处理,数据集,文本分析,自然语言处理,法律研究,数据清洗,法律文本 数据概述: 该数据集包含经过预处理的法律文本数据,适用于法律研究,文本分析和自然语言处理等任务。主要特征如下:...
    packageimg
  • 命运2游戏论坛热门帖子数据集DestinyTheGameSubredditTop1kPostsDataset-keplaxo

    2025年4月22日   

    命运2游戏论坛热门帖子数据集DestinyTheGameSubredditTop1kPostsDataset-keplaxo 数据来源:互联网公开数据 标签:游戏,数据集,论坛,社区,文本分析,情感分析,自然语言处理,游戏讨论 数据概述: 该数据集包含来自命运2(Destiny...
    packageimg