-
自然语言处理新闻文章数据集NLPNewsArticleDataset-saumyamishrads
自然语言处理新闻文章数据集NLPNewsArticleDataset-saumyamishrads 数据来源:互联网公开数据 标签:自然语言处理,新闻文章,数据集,文本分析,机器学习,信息检索,文本挖掘,新闻学 数据概述:该数据集包含来自多个新闻网站的文章数据,记录了大量的新闻报道信息。主要特征如下:... -
奥密克戎疫情相关推特数据集OmicronTweetsfromTwitterDataset-surajpreetham
奥密克戎疫情相关推特数据集OmicronTweetsfromTwitterDataset-surajpreetham 数据来源:互联网公开数据 标签:社交媒体,流行病学,数据集,文本分析,舆情分析,公共卫生,机器学习,自然语言处理 数据概述:... -
推特仇恨言论检测数据集TwitterHateSpeechDetectionDataset-trangnguyn95
推特仇恨言论检测数据集TwitterHateSpeechDetectionDataset-trangnguyn95 数据来源:互联网公开数据 标签:推特,仇恨言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,文本分类 数据概述:该数据集包含来自推特的文本数据,记录了用户发布的推文及其是否包含仇恨言论的信息。主要特征如下:... -
GitHub热门仓库PR与Issue关联分析数据集GitHubPullRequest-IssueAssociationDataset-petrescustefan
GitHub热门仓库PR与Issue关联分析数据集GitHubPullRequest-IssueAssociationDataset-petrescustefan 数据来源:互联网公开数据 标签:GitHub, 开源, 数据集, 软件工程, 文本分析, 自然语言处理, 社交网络, 机器学习 数据概述:... -
政治新闻真伪检测数据集Politifact-BuzzFeedFakeNewsDataset-sohaila103
政治新闻真伪检测数据集Politifact-BuzzFeedFakeNewsDataset-sohaila103 数据来源:互联网公开数据 标签:假新闻,政治,数据集,文本分析,自然语言处理,机器学习,信息核查,新闻报道 数据概述: 该数据集包含来自Politifact和BuzzFeed的新闻文章,旨在用于假新闻检测研究。主要特征如下:... -
英语-乌尔都语翻译数据集English-UrduTranslationDataset-ali2631
英语-乌尔都语翻译数据集English-UrduTranslationDataset-ali2631 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,双语对照,文本分析,人工智能,语言学习 数据概述: 该数据集包含英语到乌尔都语的平行文本对,记录了两种语言之间的翻译对应关系。主要特征如下:... -
亚马逊用户评论数据集AmazonUserReviewDataset-alokojha24
亚马逊用户评论数据集AmazonUserReviewDataset-alokojha24 数据来源:互联网公开数据 标签:电子商务,用户评论,数据集,文本分析,情感分析,机器学习,商业智能,消费者行为 数据概述: 该数据集包含来自亚马逊平台的用户评论数据,记录了消费者对购买产品的评价内容。主要特征如下:... -
情感分析特征提取数据集SentimentAnalysisFeatureExtractionDataset-amrutak050505
情感分析特征提取数据集SentimentAnalysisFeatureExtractionDataset-amrutak050505 数据来源:互联网公开数据 标签:情感分析,特征提取,数据集,自然语言处理,机器学习,文本分析,数据挖掘,数据科学 数据概述: 该数据集包含用于情感分析任务的特征提取数据,记录了文本数据的情感特征和分类标签。主要特征如下:... -
暴力内容检测数据集-sohamsachinkaranjkar
暴力内容检测数据集-sohamsachinkaranjkar 数据来源:互联网公开数据 标签:暴力内容,数据集,图像识别,文本分析,机器学习,人工智能,安全,内容审核 数据概述: 该数据集包含多种形式的暴力内容数据,旨在用于训练和评估暴力内容检测模型。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。... -
原神角色对话数据集ZhongliDialogGenshinImpactDataset-andyishi
原神角色对话数据集ZhongliDialogGenshinImpactDataset-andyishi 数据来源:互联网公开数据 标签:角色对话,游戏数据,数据集,自然语言处理,机器学习,游戏开发,文本分析,人工智能 数据概述: 该数据集包含来自《原神》游戏中角色钟离的对话数据,记录了该角色在游戏中的对话内容。主要特征如下:... -
动漫角色文本情感分析数据集AnimeDatasetforNLP-muhammadishaque
动漫角色文本情感分析数据集AnimeDatasetforNLP-muhammadishaque 数据来源:互联网公开数据 标签:动漫,NLP,情感分析,数据集,文本分析,机器学习,角色,日语 数据概述: 该数据集收录了动漫相关的文本数据,主要用于自然语言处理(NLP)任务,特别是情感分析。主要特征如下:... -
推特机器人检测数据集TwitterBotDetectionDataset-charvijain27
推特机器人检测数据集TwitterBotDetectionDataset-charvijain27 数据来源:互联网公开数据 标签:社交媒体,推特,机器人检测,数据集,自然语言处理,机器学习,文本分析,网络安全 数据概述: 该数据集包含推特账号相关数据,用于检测推特账号是否为机器人。主要特征如下: 时间跨度:... -
YouTube视频评论情感分析数据集YouTubeVideoCommentsSentimentAnalysisDataset-yumoan
YouTube视频评论情感分析数据集YouTubeVideoCommentsSentimentAnalysisDataset-yumoan 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分析,机器学习,社交媒体,视频评论,用户行为 数据概述:... -
韩语圣经经典与现代版本对照数据集-rycont
韩语圣经经典与现代版本对照数据集-rycont 数据来源:互联网公开数据 标签:圣经,韩语,语言学,文本分析,数据集,翻译研究,对比分析,文化研究 数据概述:该数据集包含韩语圣经经典版本和现代版本的对照数据,记录了不同翻译版本之间的对应关系。主要特征如下: 时间跨度:数据涵盖了韩语圣经的经典版本和现代版本。 地理范围:数据主要关注韩国及其韩语使用者。... -
英特尔神经聊天AI文本数据集IntelNeuralChatAITextDataDataset-iharshmgoyal
英特尔神经聊天AI文本数据集IntelNeuralChatAITextDataDataset-iharshmgoyal 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,文本生成,机器学习,语言模型,数据挖掘,文本分析 数据概述: 该数据集由英特尔公司提供,包含用于训练和评估神经聊天AI模型的文本数据。主要特征如下:... -
英语到法语翻译数据集EnglishtoFrenchTranslationDataset-karanmakwana001
英语到法语翻译数据集EnglishtoFrenchTranslationDataset-karanmakwana001 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,多语言,人工智能,教育技术 数据概述: 该数据集包含来自公开翻译资源的英语到法语的平行文本数据,记录了大量的双语句子对。主要特征如下:... -
马拉维新闻数据集MalawiNewsDataset-alka93
马拉维新闻数据集MalawiNewsDataset-alka93 数据来源:互联网公开数据 标签:新闻分析,数据集,新闻挖掘,文本分析,自然语言处理,马拉维,媒体研究 数据概述: 该数据集包含来自马拉维的新闻数据,记录了马拉维地区发生的各类新闻事件及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
情感识别文本数据集TextEmotionDataset-phichetphuangkaeo
情感识别文本数据集TextEmotionDataset-phichetphuangkaeo 数据来源:互联网公开数据 标签:文本分析,情感识别,数据集,自然语言处理,机器学习,人工智能,情感计算,文本挖掘 数据概述: 该数据集包含来自公开文本资源的情感识别数据,记录了各类文本样本及其对应的情感标签。主要特征如下:... -
法律文书文本规范化数据集CorpusfromVilexNormDataset-nguyennam231
法律文书文本规范化数据集CorpusfromVilexNormDataset-nguyennam231 数据来源:互联网公开数据 标签:法律文书,文本规范化,数据集,自然语言处理,法律科技,文本分析,机器学习,数据挖掘 数据概述: 该数据集包含来自VilexNorm项目的法律文书文本数据,记录了法律文书的文本内容和规范化处理结果。主要特征如下:... -
法国作家作品数据集FrenchWriterDataset-antoinebourgois2
法国作家作品数据集FrenchWriterDataset-antoinebourgois2 数据来源:互联网公开数据 标签:文学,作家,数据集,文本分析,自然语言处理,文学研究,机器学习,文化研究 数据概述: 该数据集包含来自法国多位著名作家的文学作品数据,记录了这些作家的经典作品及其相关信息。主要特征如下:...