-
文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai
文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:... -
西班牙政治推特语料库2023-ricardomoya
西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和... -
德里推特数据集DelhiTweetsDataset-mlcovidresearch
德里推特数据集DelhiTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:推特数据,社交媒体,数据分析,自然语言处理,城市研究,社会学,情感分析,机器学习 数据概述:该数据集包含来自德里的推特数据,记录了德里居民在社交媒体平台上的讨论和活动。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant
法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant 数据来源:互联网公开数据 标签:财经新闻,法国,股票市场,情绪分析,CAC40,预测,自然语言处理,时间序列,VADER,翻译 数据概述:... -
数据2021年5月Job-A-Thon竞赛数据集-makrovh
2021年5月Job-A-Thon竞赛数据集-makrovh 数据来源:互联网公开数据 标签:招聘,求职,数据集,机器学习,自然语言处理,文本分析,预测模型,人才市场 数据概述: 该数据集包含了2021年5月Job-A-Thon竞赛的相关数据,主要记录了招聘和求职信息,旨在用于构建预测模型。主要特征如下:... -
斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29
斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29 数据来源:互联网公开数据 标签:斯瓦希里语,语音识别,数据集,自然语言处理,机器学习,语音技术,人工智能,语言学 数据概述: 该数据集包含来自互联网公开的斯瓦希里语语音数据,主要用于语音识别和自然语言处理的研究。主要特征如下:... -
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:... -
意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli
意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,数据集,机器学习,文本分析,社交媒体,人工智能 数据概述:该数据集包含来自意大利社交媒体平台的数据,记录了用户发布的评论及其是否为讽刺的判断结果。主要特征如下:... -
情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999
情感分析比赛数据集IsemevalDataset-adityaraghuvanshi999 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,社交媒体,学术研究,信息检索 数据概述:该数据集来自情感分析比赛,主要记录了社交媒体上的文本数据及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:... -
互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan
互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本分析,机器学习,信息检索,媒体研究,互联网新闻 数据概述: 该数据集包含来自互联网新闻网站的新闻文章及其对应的摘要,适用于新闻摘要生成,文本摘要技术研究等任务。主要特征如下:... -
美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375
美国航空业情感分析数据集USAirlineSentimentsDataset-levii2375 数据来源:互联网公开数据 标签:航空业,情感分析,数据集,社交媒体,自然语言处理,客户反馈,市场研究,社会媒体分析 数据概述:该数据集包含来自推特的关于美国各大航空公司客户评论的数据,记录了客户对航空公司服务的情感评价。主要特征如下:... -
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-devaanshpuri 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,信息安全,数据分析 数据概述: 该数据集包含来自电子邮件系统的邮件数据,记录了邮件的分类标签和内容特征。主要特征如下:... -
Zipf分布与Gabor特征数据集ZipfandGaborFeaturesDataset-mohamedchakerouari
Zipf分布与Gabor特征数据集ZipfandGaborFeaturesDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:特征提取,数据集,信号处理,模式识别,机器学习,视觉特征,自然语言处理,频率分析 数据概述:... -
放射科报告数据集RadiologyReportDataset-lucario73
放射科报告数据集RadiologyReportDataset-lucario73 数据来源:互联网公开数据 标签:医学影像,放射学,数据集,自然语言处理,文本分析,疾病诊断,深度学习,医疗健康 数据概述:该数据集包含来自公开医疗机构的放射科报告,记录了患者的影像学检查结果和医生的诊断意见。主要特征如下:... -
电影评论情感分析数据集IMDb50kMovieReviewDataset-zahidhasan00
电影评论情感分析数据集IMDb50kMovieReviewDataset-zahidhasan00 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,电影评论,机器学习,文本分类,人工智能,心理学 数据概述: 该数据集包含来自IMDb(互联网电影数据库)的电影评论数据,记录了用户对电影的评价和对应的情感标签。主要特征如下:... -
垃圾邮件与正常邮件数据集Spam-HamEmailDataset-ppdolphinyy
垃圾邮件与正常邮件数据集Spam-HamEmailDataset-ppdolphinyy 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,文本分类,自然语言处理,机器学习,数据集,邮件分析,情感分析 数据概述: 该数据集包含来自互联网的电子邮件数据,记录了邮件的内容及其类别(垃圾邮件或正常邮件)。主要特征如下:... -
肺不张MIMIC报告数据集AtelectasisMIMICReportsDataset-wasifnafee
肺不张MIMIC报告数据集AtelectasisMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗健康,肺不张,MIMIC数据库,临床报告,自然语言处理,医学研究,数据分析,临床决策支持 数据概述:... -
YouTube视频评论文本数据数据集-counito27
YouTube视频评论文本数据数据集-counito27 数据来源:互联网公开数据 标签:YouTube,评论,文本数据,自然语言处理,情感分析,机器学习,社交媒体,数据挖掘 数据概述: 该数据集包含来自YouTube平台的视频评论数据,记录了用户对不同视频的评论内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据集的创建时间。... -
法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal
法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal 数据来源:互联网公开数据 标签:法律数据,预处理,数据集,文本分析,自然语言处理,法律研究,数据清洗,法律文本 数据概述: 该数据集包含经过预处理的法律文本数据,适用于法律研究,文本分析和自然语言处理等任务。主要特征如下:... -
命运2游戏论坛热门帖子数据集DestinyTheGameSubredditTop1kPostsDataset-keplaxo
命运2游戏论坛热门帖子数据集DestinyTheGameSubredditTop1kPostsDataset-keplaxo 数据来源:互联网公开数据 标签:游戏,数据集,论坛,社区,文本分析,情感分析,自然语言处理,游戏讨论 数据概述: 该数据集包含来自命运2(Destiny...