-
纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13
纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13 数据来源:互联网公开数据 标签:房地产,租赁,数据集,咨询,自然语言处理,机器学习,文本分析,纽约 数据概述: 该数据集包含来自纽约租赁房产的咨询数据,记录了租房者与房产经纪人之间的互动信息。主要特征如下:... -
电影类型预测数据集-abhikdhar
电影类型预测数据集-abhikdhar 数据来源:互联网公开数据 标签:电影,类型,预测,数据集,机器学习,自然语言处理,文本分析,娱乐,影评 数据概述: 该数据集包含电影相关的文本数据,旨在用于电影类型的预测任务。主要特征如下: 时间跨度:数据涵盖了不同年份上映的电影。 地理范围:数据主要来源于全球范围内的电影。... -
推文训练数据集Tweets-TrainDataset-priyankacheruku
推文训练数据集Tweets-TrainDataset-priyankacheruku 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的文本内容和相关情感标签。主要特征如下:... -
讯飞农业领域数据集-xuyatian
讯飞农业领域数据集-xuyatian 数据来源:互联网公开数据 标签:农业,数据集,自然语言处理,人工智能,文本分析,农业科技,信息抽取,命名实体识别 数据概述:该数据集包含来自讯飞公开的农业领域相关数据,涵盖了农业领域的技术文档,新闻报道,专家访谈,学术论文等多种文本类型。主要特征如下:... -
H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej
H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej 数据来源:互联网公开数据 标签:时尚,零售,产品,文章,数据集,文本分析,自然语言处理,推荐系统 数据概述: 该数据集包含 H&M 集团的产品文章数据,记录了 H&M 集团发布的关于服装和其他产品的文章信息。主要特征如下:... -
越南语有害评论数据集ToxicCommentVietnameseDataset-trandong2932002
越南语有害评论数据集ToxicCommentVietnameseDataset-trandong2932002 数据来源:互联网公开数据 标签:有害评论,文本分析,数据集,机器学习,自然语言处理,情感分析,语言技术,网络安全 数据概述: 该数据集包含来自越南语互联网平台的评论数据,记录了用户发布的有害内容,如仇恨言论,骚扰,歧视等。主要特征如下:... -
垃圾邮件与非垃圾邮件分类数据集Ham-SpamClassificationDataset-venkat1002
垃圾邮件与非垃圾邮件分类数据集Ham-SpamClassificationDataset-venkat1002 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,分类算法,数据挖掘 数据概述: 该数据集包含来自公开邮件数据源的数据,记录了邮件内容及其分类标签(垃圾邮件或非垃圾邮件)。主要特征如下:... -
信件特征数据集LettersFeaturesDataset-mingfengli1024
信件特征数据集LettersFeaturesDataset-mingfengli1024 数据来源:互联网公开数据 标签:信件特征,数据集,文本分析,自然语言处理,机器学习,通信学,学术研究,邮件分类 数据概述:该数据集包含来自多个来源的信件特征数据,记录了不同信件的文本特征信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
奥斯卡颁奖典礼推文数据集OscarTweetsDataset-vechoo
奥斯卡颁奖典礼推文数据集OscarTweetsDataset-vechoo 数据来源:互联网公开数据 标签:奥斯卡,推文,社交媒体,情感分析,自然语言处理,电影,数据集,文本分析 数据概述: 该数据集包含来自Twitter的关于奥斯卡颁奖典礼的推文数据,记录了用户在颁奖典礼期间的实时互动和观点。主要特征如下:... -
中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845
中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845 数据来源:互联网公开数据 标签:自然语言处理,数学应用题,数据集,语义理解,机器阅读理解,人工智能,教育,文本分析 数据概述: 该数据集由台湾中央研究院(Academia... -
脸书帖子与评论数据FacebookPostsandCommentsData-hunhthanhphong
脸书帖子与评论数据FacebookPostsandCommentsData-hunhthanhphong 数据来源:互联网公开数据 标签:社交媒体,脸书,帖子,评论,文本分析,情感分析,数据集,用户行为 数据概述: 该数据集包含了来自脸书平台的帖子及其对应的评论数据,记录了用户在社交媒体上的互动信息。主要特征如下:... -
德国新闻文本命名实体识别数据集-rodionshkokov
德国新闻文本命名实体识别数据集-rodionshkokov 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,德语,NLP,文本分析,信息抽取,机器学习 数据概述: 该数据集包含来自德国新闻网站的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下: 时间跨度: 数据记录的时间范围未明确给出,但数据内容主要来源于新闻报道。... -
网络钓鱼邮件数据集PhishingEmailDataset-wenkangcheng
网络钓鱼邮件数据集PhishingEmailDataset-wenkangcheng 数据来源:互联网公开数据 标签:网络钓鱼,数据集,电子邮件,安全,机器学习,文本分析,恶意软件,信息安全 数据概述: 该数据集包含网络钓鱼邮件的数据,用于研究和分析网络钓鱼攻击。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据集的创建和更新时间。... -
多语言定制数据集MultilingualCustomDataset-amarendradeo
多语言定制数据集MultilingualCustomDataset-amarendradeo 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分析,语言模型,文本语料库,跨语言 数据概述: 该数据集包含多种语言的文本数据,旨在支持多语言处理任务,特别是机器翻译和语言模型训练。主要特征如下:... -
印度斯坦时报新闻文章数据集HindustanTimesNewsArticlesDataset-abdunnoor11
印度斯坦时报新闻文章数据集HindustanTimesNewsArticlesDataset-abdunnoor11 数据来源:互联网公开数据 标签:新闻,印度,文本分析,自然语言处理,文本挖掘,新闻文章,数据集,时事 数据概述: 该数据集包含来自印度斯坦时报(Hindustan... -
文本分类2022数据集DF-Classify2022-huynhtruc109
文本分类2022数据集DF-Classify2022-huynhtruc109 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,深度学习,文本分析,人工智能,数据科学 数据概述: 该数据集包含来自2022年的文本分类数据,记录了不同类别文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2022年。... -
有毒聊天记录数据集ToxicChatParquetDataset-alimistro123
有毒聊天记录数据集ToxicChatParquetDataset-alimistro123 数据来源:互联网公开数据 标签:聊天记录,数据集,文本分析,自然语言处理,机器学习,社交媒体,数据清理,情感分析 数据概述:该数据集包含多个来源的有毒聊天记录,记录了互联网上不同平台上的聊天内容。主要特征如下:... -
仇恨言论检测数据集CleanedHateSpeechDataset-mustafahabeeb90
仇恨言论检测数据集CleanedHateSpeechDataset-mustafahabeeb90 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,文本分析,机器学习,社会研究,情感分析,网络安全 数据概述: 该数据集包含经过清洗的仇恨言论数据,记录了社交媒体或其他公开平台上的文本内容及其标签。主要特征如下:... -
词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra
词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra 数据来源:互联网公开数据 标签:词性标注,数据集,自然语言处理,机器学习,语言学,文本分析,学术研究,信息检索 数据概述:该数据集包含来自Penn Treebank的词性标注数据,记录了英文文本中每个单词的词性和上下文信息。主要特征如下:... -
Slack求助消息数据集Slack求助消息数据集-teddyerror
Slack求助消息数据集Slack求助消息数据集-teddyerror 数据来源:互联网公开数据 标签:Slack, 求助消息, 数据集, 通信分析, 自然语言处理, 客服支持, 用户行为, 文本分析 数据概述: 该数据集包含来自Slack平台的求助消息记录,适用于通信分析,客服支持以及自然语言处理等领域。主要特征如下: 时间跨度:...