-
推特客户服务数据集CustomerSupportonTwitterDataset-aminaslam
推特客户服务数据集CustomerSupportonTwitterDataset-aminaslam 数据来源:互联网公开数据 标签:客户服务,推特,社交媒体,数据集,情感分析,文本挖掘,自然语言处理,数据分析 数据概述: 该数据集包含来自推特平台上的客户服务相关数据,记录了用户与品牌之间的互动情况。主要特征如下:... -
肺炎患者病历报告数据集PneumoniaMIMICReportsDataset-wasifnafee
肺炎患者病历报告数据集PneumoniaMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗健康,病历分析,肺炎,数据集,自然语言处理,临床研究,人工智能,医学影像 数据概述: 该数据集包含来自大规模医疗数据库MIMIC(Medical Information Mart for Intensive... -
美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah
美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah 数据来源:互联网公开数据 标签:专利数据,数据扩充,机器翻译,自然语言处理,数据集,文本分析,创新研究,知识产权... -
英印机器翻译练习数据集-arunmohan003
英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:... -
anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26
anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26 数据来源:互联网公开数据 标签:标注数据,数据集,机器学习,数据挖掘,人工智能,自然语言处理,图像识别,计算机视觉 数据概述: 该数据集包含来自anno-data平台的标注数据,记录了各类数据样本的标注信息。主要特征如下:... -
CommonLit英语文章摘要数据集-artisusxiren
CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:... -
家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998
家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998 数据来源:互联网公开数据 标签:零售业,搜索关键词,数据集,自然语言处理,文本挖掘,机器学习,消费者行为,市场分析 数据概述: 该数据集包含来自家得宝(Home... -
巴基斯坦推特推文数据集PakistanTweetsDataset-umarfarooq45
巴基斯坦推特推文数据集PakistanTweetsDataset-umarfarooq45 数据来源:互联网公开数据 标签:社交媒体,推特,文本分析,巴基斯坦,自然语言处理,情感分析,社会学,舆情分析 数据概述: 该数据集包含了来自巴基斯坦地区的推特推文数据,记录了用户在推特平台上的公开言论。主要特征如下:... -
检索公共测试数据集-nhutchung
检索公共测试数据集-nhutchung 数据来源:互联网公开数据 标签:信息检索,数据集,文本分析,机器学习,自然语言处理,搜索,评估,测试 数据概述: 该数据集包含用于信息检索任务的公开测试数据,记录了检索系统性能的评估指标。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的发布时间。... -
HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola
HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola 数据来源:互联网公开数据 标签:Hacker News,新闻,社交媒体,数据分析,自然语言处理,文本挖掘,机器学习,网络社区 数据概述: 该数据集包含来自Hacker News网站的文章数据,记录了Hacker... -
自然语言处理与灾难推文数据集NLPwithDisasterTweetsCleanedData-phchen5
自然语言处理与灾难推文数据集NLPwithDisasterTweetsCleanedData-phchen5 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本分类,情感分析,机器学习,社交媒体,应急管理 数据概述: 该数据集包含了来自推特(Twitter)的推文数据,这些推文与各种灾难事件相关。主要特征如下:... -
命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa
命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,人工智能,语言学,文本挖掘 数据概述:该数据集包含来自多个来源的原始文本数据,记录了用于命名实体识别的任务。主要特征如下:... -
文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai
文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:... -
西班牙政治推特语料库2023-ricardomoya
西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和... -
德里推特数据集DelhiTweetsDataset-mlcovidresearch
德里推特数据集DelhiTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:推特数据,社交媒体,数据分析,自然语言处理,城市研究,社会学,情感分析,机器学习 数据概述:该数据集包含来自德里的推特数据,记录了德里居民在社交媒体平台上的讨论和活动。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant
法国财经新闻与股票市场情绪分析预测数据集-2018年11月至2021年3月-arcticgiant 数据来源:互联网公开数据 标签:财经新闻,法国,股票市场,情绪分析,CAC40,预测,自然语言处理,时间序列,VADER,翻译 数据概述:... -
数据2021年5月Job-A-Thon竞赛数据集-makrovh
2021年5月Job-A-Thon竞赛数据集-makrovh 数据来源:互联网公开数据 标签:招聘,求职,数据集,机器学习,自然语言处理,文本分析,预测模型,人才市场 数据概述: 该数据集包含了2021年5月Job-A-Thon竞赛的相关数据,主要记录了招聘和求职信息,旨在用于构建预测模型。主要特征如下:... -
斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29
斯瓦希里语语音数据集SwahiliTrainSplitDataset-rainmaker29 数据来源:互联网公开数据 标签:斯瓦希里语,语音识别,数据集,自然语言处理,机器学习,语音技术,人工智能,语言学 数据概述: 该数据集包含来自互联网公开的斯瓦希里语语音数据,主要用于语音识别和自然语言处理的研究。主要特征如下:... -
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong
英语仇恨言论检测数据集EnglishHateSpeechDetectionDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,文本分类,机器学习,情感分析,社交媒体,文本数据,数据集 数据概述: 该数据集包含了英语社交媒体平台上的文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度:... -
意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli
意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,数据集,机器学习,文本分析,社交媒体,人工智能 数据概述:该数据集包含来自意大利社交媒体平台的数据,记录了用户发布的评论及其是否为讽刺的判断结果。主要特征如下:...