-
推特灾难检测数据集BOWLSTMandGRUforTwitterDisasterDetectionDataset-hamsawahed98
推特灾难检测数据集BOWLSTMandGRUforTwitterDisasterDetectionDataset-hamsawahed98 数据来源:互联网公开数据 标签:推特,灾难检测,数据集,自然语言处理,深度学习,机器学习,文本分析,社交媒体 数据概述:该数据集包含来自推特的灾难相关文本数据,适用于灾难检测,文本分类等任务。主要特征如下:... -
乌尔都语罗马字符文本数据集RomanUrduDatasets-sameedrazi
乌尔都语罗马字符文本数据集RomanUrduDatasets-sameedrazi 数据来源:互联网公开数据 标签:乌尔都语,罗马字符,文本数据,自然语言处理,NLP,语言学,数据集,文本分析 数据概述: 该数据集包含使用罗马字符书写的乌尔都语文本数据,旨在促进乌尔都语的自然语言处理研究。主要特征如下:... -
网络欺凌印地-英语数据集CyberBullyingHinglishDataset-ishan8055
网络欺凌印地-英语数据集CyberBullyingHinglishDataset-ishan8055 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,社交媒体,机器学习,自然语言处理,社会学,网络行为 数据概述: 该数据集包含来自社交媒体平台的网络欺凌相关文本数据,记录了使用印地-... -
Reddit平台iPhone讨论话题数据集iPhoneDiscussioninRedditDataset-muhammadhussain11
Reddit平台iPhone讨论话题数据集iPhoneDiscussioninRedditDataset-muhammadhussain11 数据来源:互联网公开数据 标签:社交媒体,iPhone,讨论话题,文本分析,情感分析,自然语言处理,数据集,苹果公司 数据概述:... -
亚马逊公司员工职位评价数据集AmazonJobReviewsfromIndeed-com-lgalbavt
亚马逊公司员工职位评价数据集AmazonJobReviewsfromIndeed-com-lgalbavt 数据来源:互联网公开数据 标签:亚马逊,员工评价,职位,数据集,文本分析,情感分析,自然语言处理,人力资源 数据概述: 该数据集包含来自Indeed.com的亚马逊公司员工职位评价数据,记录了员工对亚马逊公司不同职位的评价和反馈。主要特征如下:... -
增强诈骗电话录音数据集AugmentedScamCallTranscriptDataset-yingzisilver
增强诈骗电话录音数据集AugmentedScamCallTranscriptDataset-yingzisilver 数据来源:互联网公开数据 标签:诈骗电话,数据集,语音识别,自然语言处理,文本分析,安全研究,机器学习,恶意行为检测 数据概述:该数据集包含增强的诈骗电话录音文本转录数据,旨在促进对诈骗电话的检测和分析。主要特征如下:... -
斯拉夫流行歌曲歌词数据集SlavaKPSSLyricsDataset-neuralmaestroarti
斯拉夫流行歌曲歌词数据集SlavaKPSSLyricsDataset-neuralmaestroarti 数据来源:互联网公开数据 标签:歌词,音乐,俄罗斯,嘻哈,说唱,文化研究,文本分析,自然语言处理 数据概述: 该数据集包含来自俄罗斯艺术家Slava KPSS的歌曲歌词数据,记录了Slava KPSS创作的歌曲的歌词文本。主要特征如下:... -
-
新冠疫情推特数据集Covid-19TwitterDataset-divanshu22
新冠疫情推特数据集Covid-19TwitterDataset-divanshu22 数据来源:互联网公开数据 标签:新冠疫情,社交媒体,推特,数据集,文本分析,公共卫生,社会影响,信息传播 数据概述: 该数据集包含来自推特的与新冠疫情相关的推文数据,记录了公众对疫情的看法,情绪和讨论。主要特征如下:... -
翻译数据数据集TranslationDataDataset-khoahongg
翻译数据数据集TranslationDataDataset-khoahongg 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,跨文化交流,文本分析,人工智能 数据概述: 该数据集包含来自不同语言之间的翻译数据,记录了多种语言文本的翻译对应关系。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
社交媒体仇恨言论与冒犯性语言数据集-suchindrakumar057
社交媒体仇恨言论与冒犯性语言数据集-suchindrakumar057 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体,文本分析,自然语言处理,情感分析,机器学习,语言学 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用户发布的仇恨言论和冒犯性语言。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据抓取的时间段。... -
Transformer模型研究数据集-abhishek
Transformer模型研究数据集-abhishek 数据来源:互联网公开数据 标签:自然语言处理,深度学习,Transformer,文本分析,机器翻译,模型训练,数据集,NLP 数据概述: 该数据集包含与 Transformer 模型相关的各种数据,主要用于模型训练,评估和研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了从早期... -
亚马逊图书销售与评论数据集AmazonBooksData-ashishkumar111
亚马逊图书销售与评论数据集AmazonBooksData-ashishkumar111 数据来源:互联网公开数据 标签:图书,亚马逊,销售数据,评论数据,文本分析,自然语言处理,推荐系统,市场分析 数据概述: 该数据集包含来自亚马逊平台上的图书销售和用户评论数据,记录了图书的详细信息和用户反馈。主要特征如下:... -
Mercari商品价格预测数据集MercariPriceSuggestionChallengeDataset-hhl028
Mercari商品价格预测数据集MercariPriceSuggestionChallengeDataset-hhl028 数据来源:互联网公开数据 标签:电商,商品价格预测,数据集,机器学习,自然语言处理,文本分析,推荐系统,在线市场 数据概述:... -
自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija
自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,文本挖掘,人工智能 数据概述: 该数据集包含来自各类博客平台的文章数据,记录了不同主题和内容的博客文章信息。主要特征如下:... -
文本摘要数据集TextSummarizationDataset-cuitengfeui
文本摘要数据集TextSummarizationDataset-cuitengfeui 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,人工智能,语言学,信息提取,文本分析 数据概述:该数据集包含来自多个来源的文本摘要数据,记录了原文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
电影票房与剧情摘要数据集MovieOverviewDataset-nickolashirata
电影票房与剧情摘要数据集MovieOverviewDataset-nickolashirata 数据来源:互联网公开数据 标签:电影,票房,剧情,数据集,自然语言处理,文本分析,机器学习,电影产业 数据概述:该数据集包含来自互联网的电影票房数据与剧情摘要信息,记录了大量电影的详细信息。主要特征如下:... -
新冠疫情相关推文数据集COVID-RelatedTweetsDataset-akshaykumarvenur
新冠疫情相关推文数据集COVID-RelatedTweetsDataset-akshaykumarvenur 数据来源:互联网公开数据 标签:社交媒体,新冠疫情,数据集,文本分析,情感分析,公共卫生,机器学习,舆情监测 数据概述:该数据集包含来自Twitter平台的数据,记录了与新冠疫情相关的推文内容。主要特征如下:... -
拼写校正数据集SpellingCorrectionDataset-antooo511
拼写校正数据集SpellingCorrectionDataset-antooo511 数据来源:互联网公开数据 标签:拼写校正,数据集,自然语言处理,文本分析,机器学习,语言技术,教育技术,数据挖掘 数据概述: 该数据集专注于记录和分析拼写错误的文本,包含大量带有拼写错误的句子及其对应的正确拼写版本。主要特征如下:... -
Reddit评论数据集RedditCommentDataset-lordjay
Reddit评论数据集RedditCommentDataset-lordjay 数据来源:互联网公开数据 标签:社交媒体,评论,数据集,自然语言处理,机器学习,情感分析,社会研究,文本分析 数据概述:该数据集包含来自Reddit平台的用户评论数据,记录了Reddit论坛上用户之间的互动和讨论内容。主要特征如下:...