-
钓鱼网站网址检测数据集-biggbok
钓鱼网站网址检测数据集-biggbok 数据来源:互联网公开数据 标签:钓鱼网站,网址检测,安全,机器学习,恶意软件,网络安全,数据集,自然语言处理 数据概述: 该数据集包含来自互联网的网址数据,用于钓鱼网站(也称网络钓鱼)的检测和识别。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的钓鱼网站网址。 地理范围:... -
中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar
中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语资源,文本分析,语言技术,人工智能 数据概述: 该数据集包含来自中越双语平行语料库的数据,记录了中越两种语言的对应文本。主要特征如下:... -
Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp
Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,网络文化,内容挖掘 数据概述: 该数据集包含来自Reddit平台的热门帖子标题数据,记录了平台上备受关注的帖子的标题信息。主要特征如下:... -
垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819
垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819 数据来源:互联网公开数据 标签:垃圾短信,语音识别,数据集,机器学习,文本分析,自然语言处理,通信,反垃圾 数据概述: 该数据集包含了垃圾短信的语音识别结果,记录了通过语音识别技术转换后的垃圾短信文本数据。主要特征如下:... -
情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert
情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert 数据来源:互联网公开数据 标签:情感分析,评论数据,数据集,自然语言处理,机器学习,文本分析,市场研究,用户体验 数据概述: 该数据集包含来自互联网公开平台的用户评论数据,记录了用户对不同产品,服务或内容的情感表达。主要特征如下:... -
多语言标记数据集MultilangTokensDataset-pranav51286
多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:... -
趣味问答题目数据集TriviaQuestionsDataset-abishpius
趣味问答题目数据集TriviaQuestionsDataset-abishpius 数据来源:互联网公开数据 标签:趣味问答,数据集,教育,娱乐,知识竞赛,游戏设计,人工智能,自然语言处理 数据概述: 该数据集包含来自互联网公开资源的趣味问答题目数据,记录了各类知识问答题目的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从近年至现代。... -
电影情感分析数据集MovieSentimentAnalysisDataset-naufalalfarisi
电影情感分析数据集MovieSentimentAnalysisDataset-naufalalfarisi 数据来源:互联网公开数据 标签:电影,情感分析,数据集,自然语言处理,机器学习,文本分析,评论,社交媒体 数据概述:该数据集包含来自多个电影评论网站的用户评论,记录了对电影的情感评价。主要特征如下:... -
网页链接与描述数据集-fan1dy
网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。... -
图书评分与评论数据集BooksRatingandMetadataDataset-raneem6y
图书评分与评论数据集BooksRatingandMetadataDataset-raneem6y 数据来源:互联网公开数据 标签:图书评分,评论,图书推荐系统,自然语言处理,评分分布,图书市场分析,元数据,数据集,CSV,UTF-8 数据概述:... -
AI聊天机器人对话数据集
AI聊天机器人对话数据集 数据来源:互联网公开数据 标签:AI聊天机器人,自然语言处理,对话系统,人机交互,机器学习,数据集,训练数据 数据概述:... -
CORD-19问答内容数据集-davidmezzetti
CORD-19问答内容数据集-davidmezzetti 数据来源:互联网公开数据 标签:CORD-19,问答系统,自然语言处理,机器学习,数据集,Transformer模型,高能研究 数据概述: 本数据集包含用于构建CORD-19数据集问答模型的各类文件。数据集包括以下文件: -... -
印度谷歌评价数据集TCSIndiaGoogleReviewsDataset-nj2310
印度谷歌评价数据集TCSIndiaGoogleReviewsDataset-nj2310 数据来源:互联网公开数据 标签:谷歌评价,数据集,消费者反馈,自然语言处理,市场分析,商业智能,印度市场,客户满意度 数据概述:该数据集包含来自谷歌的印度用户对TCS(印度塔塔咨询服务有限公司)的评价数据,记录了用户对TCS服务的反馈和评价。主要特征如下:... -
文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni
文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni 数据来源:互联网公开数据 标签:文本可读性,数据集,自然语言处理,机器学习,教育,阅读理解,文本分析,语言学... -
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips 数据来源:互联网公开数据 标签:自然语言处理,文本增强,数据集,机器学习,深度学习,文本挖掘,语言模型,信息检索 数据概述:... -
推特灾难文本分析数据集-bharathsj
推特灾难文本分析数据集-bharathsj 数据来源:互联网公开数据 标签:推特数据,灾难事件,文本分析,自然语言处理,情感分析,信息提取,机器学习,社会科学 数据概述: 该数据集包含来自推特(Twitter)的文本数据,记录了与灾难事件相关的推文内容。主要特征如下: 时间跨度: 数据记录的时间范围根据数据集具体情况而定,通常涵盖特定灾难事件发生前后。... -
推特情感分析数据集TwitterSentimentalData-ipraypatel
推特情感分析数据集TwitterSentimentalData-ipraypatel 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本挖掘,自然语言处理,机器学习,情绪识别,舆情分析 数据概述: 该数据集包含了来自推特(Twitter)的推文数据,并标注了情感极性。主要特征如下:... -
博客文章内容分析数据集NewBlogsDataset-rinenami
博客文章内容分析数据集NewBlogsDataset-rinenami 数据来源:互联网公开数据 标签:博客文章,内容分析,数据集,自然语言处理,文本挖掘,机器学习,社交媒体,数据分析 数据概述:该数据集包含来自多个知名博客平台的新博客文章,记录了文章的文本内容,发布日期,作者,标签和评论等信息。主要特征如下:... -
埃隆-马斯克推文数据集ElonMuskTweetsDataset-mohamedabidi97
埃隆-马斯克推文数据集ElonMuskTweetsDataset-mohamedabidi97 数据来源:互联网公开数据 标签:社交媒体,推文分析,数据集,自然语言处理,机器学习,情感分析,公众人物,数据挖掘 数据概述: 该数据集包含来自埃隆·马斯克(Elon... -
消费者投诉数据分析数据集-robertyu02
消费者投诉数据分析数据集-robertyu02 数据来源:互联网公开数据 标签:消费者投诉,数据分析,文本挖掘,情感分析,市场调研,客户服务,行业分析,自然语言处理 数据概述: 该数据集包含来自不同来源的消费者投诉数据,记录了消费者对产品或服务的反馈和不满。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了近年来大量的投诉信息。...