-
短信文本清洗数据集SMSCleanedDataset-ashishgoraniya
短信文本清洗数据集SMSCleanedDataset-ashishgoraniya 数据来源:互联网公开数据 标签:短信,文本清洗,数据集,自然语言处理,机器学习,文本分析,通信数据,数据预处理 数据概述: 该数据集包含来自短信通信的文本数据,记录了经过清洗和标准化的短信内容。主要特征如下: 时间跨度:数据记录的时间范围未明确指定,推测涵盖不同时间段。... -
酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien
酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien 数据来源:互联网公开数据 标签:酒店评论,数据集,自然语言处理,机器翻译,文本分析,旅游行业,用户体验,情感分析 数据概述: 该数据集包含来自全球多家酒店的评论数据,记录了用户对酒店的评价和反馈,并提供了多语言翻译版本。主要特征如下:... -
阿比谢克访谈数据集AbhishekInterviewDataset-joylunkad
阿比谢克访谈数据集AbhishekInterviewDataset-joylunkad 数据来源:互联网公开数据 标签:访谈,数据集,面试,机器学习,自然语言处理,文本分析,数据挖掘,人物访谈 数据概述: 该数据集包含了阿比谢克(Abhishek)的访谈数据,记录了他在不同场合,不同主题下的访谈内容。主要特征如下:... -
尼泊尔豪华酒店评论数据集NepalLuxuryHotelReviewsDataset-suprapandey
尼泊尔豪华酒店评论数据集NepalLuxuryHotelReviewsDataset-suprapandey 数据来源:互联网公开数据 标签:酒店评论,尼泊尔,旅游,情感分析,自然语言处理,数据集,文本分析,豪华酒店 数据概述: 该数据集包含来自互联网的尼泊尔豪华酒店评论数据,记录了游客对尼泊尔豪华酒店的评价和反馈。主要特征如下:... -
印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2
印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:... -
宠物领养情感实体数据集Petfinder情感实体数据集-tototohpl
宠物领养情感实体数据集Petfinder情感实体数据集-tototohpl 数据来源:互联网公开数据 标签:情感分析,实体识别,宠物领养,数据集,自然语言处理,机器学习,文本分析,社会科学研究 数据概述:该数据集包含来自Petfinder的数据,记录了用户在领养宠物时发表的评论,适用于情感分析和实体识别等任务。主要特征如下:... -
大篮子谷歌应用商店评论数据集BigBasketGooglePlayAppReviewsforBasicNLP-apurvavarshney
大篮子谷歌应用商店评论数据集BigBasketGooglePlayAppReviewsforBasicNLP-apurvavarshney 数据来源:互联网公开数据 标签:购物应用,评论数据,自然语言处理,用户反馈,电商分析,数据集,应用评价,市场研究 数据概述:该数据集包含了大篮子(Big... -
新冠病毒研究文献分析数据集-全球疫情-学术论文-2019-2023-thedevastator
新冠病毒研究文献分析数据集-全球疫情-学术论文-2019-2023-thedevastator 数据来源:互联网公开数据 标签:COVID-19,新冠病毒,疫情,医学,生物学,自然语言处理,文献分析,科研,公共卫生,学术论文 数据概述:... -
韩国极右翼网站WOMAD仇恨言论数据集KoreanExtremistWebsiteWOMADHateSpeechDataset-captainnemo9292
韩国极右翼网站WOMAD仇恨言论数据集KoreanExtremistWebsiteWOMADHateSpeechDataset-captainnemo9292 数据来源:互联网公开数据 标签:仇恨言论,数据集,极右翼,社交媒体,语言分析,自然语言处理,社会学,网络安全... -
零样本与少样本学习数据集CleananerCorpZero-ShotandFew-ShotDataset-abdullahahmedabooof
零样本与少样本学习数据集CleananerCorpZero-ShotandFew-ShotDataset-abdullahahmedabooof 数据来源:互联网公开数据 标签:机器学习,零样本学习,少样本学习,数据集,自然语言处理,深度学习,计算机科学,人工智能 数据概述:... -
乌尔都文字识别手写数据集-2023-i191796majid
乌尔都文字识别手写数据集-2023-i191796majid 数据来源:互联网公开数据 标签:乌尔都语,OCR,手写识别,自然语言处理,手写分析,图像处理 数据概述:... -
中文政治情感分析数据集PoliticalSentimentChineseDataset-charliegong
中文政治情感分析数据集PoliticalSentimentChineseDataset-charliegong 数据来源:互联网公开数据 标签:情感分析,政治,数据集,文本挖掘,自然语言处理,机器学习,社会研究,舆论分析 数据概述: 该数据集包含来自中文互联网公开渠道的政治相关文本数据,记录了不同政治事件,政策或话题下的公众言论情感倾向。主要特征如下:... -
唐代诗歌数据集PoetryDaTangDataset-geokocha
唐代诗歌数据集PoetryDaTangDataset-geokocha 数据来源:互联网公开数据 标签:诗歌,唐代,文学研究,数据分析,自然语言处理,文化遗产,机器学习,历史文献 数据概述: 该数据集包含来自唐代(公元618-907年)的诗歌数据,记录了唐代诗人的诗歌作品及其相关信息。主要特征如下:... -
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu
罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,媒体研究,信息提取,机器学习,新闻媒体 数据概述: 该数据集包含罗马尼亚新闻网站的文章数据,记录了特定日期的新闻内容和相关信息。主要特征如下:... -
乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan
乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,罗马转写,情感分析,机器学习,语言学,数据集 数据概述: 该数据集来自加州大学欧文分校(UCI),包含了乌尔都语的罗马转写文本数据,主要用于自然语言处理和文本分析研究。主要特征如下:... -
阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi
阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi 数据来源:互联网公开数据 标签:阿拉伯语,文本分析,数据集,社交媒体,机器学习,情感分析,自然语言处理,情感识别 数据概述:... -
大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen
大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,上下文理解,文本分析,机器学习,人工智能,语义分析 数据概述:... -
柏林LinkedIn数据科学与分析职位招聘信息数据集-2024年-wilomentena
柏林LinkedIn数据科学与分析职位招聘信息数据集-2024年-wilomentena 数据来源:互联网公开数据 标签:数据分析,数据科学,数据工程师,招聘,职位,柏林,LinkedIn,NLP,自然语言处理,市场分析,技能需求 数据概述:... -
英语测试数据集EnglishTestDataDataset-prateek3g
英语测试数据集EnglishTestDataDataset-prateek3g 数据来源:互联网公开数据 标签:英语测试,数据集,语言学习,教育技术,机器学习,自然语言处理,教育研究,标准化考试 数据概述: 该数据集包含来自英语测试领域的标准化考试数据,记录了英语学习者的测试成绩和相关信息。主要特征如下:... -
印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906
印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906 数据来源:互联网公开数据 标签:印度,BERT,微调,自然语言处理,机器学习,数据集,文本分析,人工智能 数据概述:该数据集包含来自印度的各种文本数据,适用于BERT模型的微调和自然语言处理任务。主要特征如下:...