-
歌曲特征与歌词分析数据集-gabrielagarciafranz
歌曲特征与歌词分析数据集-gabrielagarciafranz 数据来源:互联网公开数据 标签:音乐分析,歌词,数据集,自然语言处理,机器学习,情感分析,文本挖掘,音乐推荐 数据概述: 该数据集包含了歌曲的音频特征和歌词文本数据,旨在用于音乐分析和自然语言处理相关研究。主要特征如下:... -
URL特征提取数据集-rujisansoongklang
URL特征提取数据集-rujisansoongklang 数据来源:互联网公开数据 标签:URL,特征提取,网络安全,机器学习,数据挖掘,自然语言处理,恶意URL检测,网络分析 数据概述:该数据集包含从互联网收集的URL数据,并提取了各种特征,用于URL分析和分类。主要特征如下: 时间跨度:数据记录时间不限,持续更新。... -
大规模语言模型数学能力评估数据集LLM-MathEvaluationsDataset-mccocoful
大规模语言模型数学能力评估数据集LLM-MathEvaluationsDataset-mccocoful 数据来源:互联网公开数据 标签:大规模语言模型,数学能力,评估,数据集,自然语言处理,机器学习,数学,人工智能 数据概述: 该数据集包含一系列专门设计用于评估大型语言模型(LLM)数学能力的题目和相应的解答。主要特征如下:... -
法律文本预处理数据集PreprocessingLegalDataDataset-philanpersonal
法律文本预处理数据集PreprocessingLegalDataDataset-philanpersonal 数据来源:互联网公开数据 标签:法律,文本预处理,数据集,自然语言处理,法律科技,机器学习,文本分析,信息检索 数据概述: 该数据集包含经过预处理的法律文本数据,主要用于自然语言处理和机器学习任务。主要特征如下:... -
YouTube评论情感分析数据集YouTubeCommentsLabeledDataset-aayushkumar15
YouTube评论情感分析数据集YouTubeCommentsLabeledDataset-aayushkumar15 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,社交媒体,机器学习,文本分类,数据挖掘,计算机科学 数据概述:... -
土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000
土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000 数据来源:互联网公开数据 标签:患者问答,医生回复,医疗咨询,土耳其语,NLP,自然语言处理,医疗研究,医学教育 数据概述: 本数据集收录了iCliniq平台上真实患者提出的医疗问题及其医生回复的土耳其语翻译版本。该数据集源于iCliniq Medical... -
宠物领养情感分析数据集SentimentPetfinderDataset-tototohpl
宠物领养情感分析数据集SentimentPetfinderDataset-tototohpl 数据来源:互联网公开数据 标签:情感分析,数据集,宠物领养,自然语言处理,机器学习,社会研究,动物福利,用户反馈 数据概述: 该数据集包含来自Petfinder网站的用户评论数据,记录了用户对宠物及其领养过程的情感评价。主要特征如下:... -
论文摘要生成数据集PaperSummarizationDataset-mohammedserag
论文摘要生成数据集PaperSummarizationDataset-mohammedserag 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,信息提取,学术研究,深度学习,文本分析 数据概述: 该数据集包含来自学术文献和科技文章的论文摘要数据,记录了论文的原文与相应的摘要信息。主要特征如下:... -
英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh
英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,语言学,深度学习,文本数据,英语西班牙语 数据概述: 该数据集包含英语到西班牙语的翻译对,记录了英语文本及其对应的西班牙语翻译。主要特征如下:... -
卡纳达语评论数据集KannadaReviewDataset-kishorsinnur
卡纳达语评论数据集KannadaReviewDataset-kishorsinnur 数据来源:互联网公开数据 标签:自然语言处理,卡纳达语,数据集,文本分析,情感分析,机器学习,多语言处理,语料库 数据概述:该数据集包含来自卡纳达语互联网平台的大量用户评论,记录了用户对各种产品,服务或内容的评价信息。主要特征如下:... -
推特情感分析数据集TweetSentimentExtractionDataset-tunguz
推特情感分析数据集TweetSentimentExtractionDataset-tunguz 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本分类,机器学习,情感提取,社交媒体,NLP 数据概述: 该数据集包含来自推特(Twitter)的文本数据,旨在用于情感分析和情感提取任务。主要特征如下:... -
多类别攻击分类数据集OffenseClassification-MultipleOffenseDataset-dhawan123
多类别攻击分类数据集OffenseClassification-MultipleOffenseDataset-dhawan123 数据来源:互联网公开数据 标签:文本分类,自然语言处理,攻击检测,情感分析,机器学习,安全领域,恶意文本,数据集 数据概述: 该数据集包含来自互联网的文本数据,记录了多种类型的攻击性言论。主要特征如下:... -
推特葡萄牙语使用数据集TwitterPortugueseUsageDataset-adilmar
推特葡萄牙语使用数据集TwitterPortugueseUsageDataset-adilmar 数据来源:互联网公开数据 标签:社交媒体,推特,葡萄牙语,文本分析,自然语言处理,情感分析,机器学习,数据挖掘 数据概述: 该数据集包含来自推特平台的葡萄牙语文本数据,记录了用户在推特上发布的推文内容。主要特征如下:... -
医疗文本PHI受保护健康信息标注数据集-vijayakashv03
医疗文本PHI受保护健康信息标注数据集-vijayakashv03 数据来源:互联网公开数据 标签:PHI,医疗文本,数据标注,隐私保护,NLP,自然语言处理,文本处理,数据安全,敏感信息,信息脱敏 数据概述: 本数据集专为敏感信息脱敏设计,特别是受保护健康信息(PHI, Protected Health... -
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass 数据来源:互联网公开数据 标签:人工智能,生成式AI,数据集,机器学习,自然语言处理,图像生成,文本生成,多模态学习... -
索赔检测数据集ClaimDetectionDataset-shankhad
索赔检测数据集ClaimDetectionDataset-shankhad 数据来源:互联网公开数据 标签:索赔检测,数据集,自然语言处理,机器学习,文本分析,信息检索,法律研究,数据分析 数据概述: 该数据集包含来自多个来源的索赔信息,记录了索赔文本及其真假标签。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2020年。 地理范围:... -
漫画情感分析数据集ComicEmotionAnalysisDataset-rajanmishra123
漫画情感分析数据集ComicEmotionAnalysisDataset-rajanmishra123 数据来源:互联网公开数据 标签:情感分析,漫画,数据集,文本分析,自然语言处理,机器学习,图像识别,文化研究 数据概述: 该数据集包含来自多部流行漫画的数据,记录了漫画中的文字对话,情节描述以及角色情感标签。主要特征如下:... -
哈利波特系列电影与原著文本数据集HarryPotterSeriesMovieandBookTextDataset-umdogqualquer
哈利波特系列电影与原著文本数据集HarryPotterSeriesMovieandBookTextDataset-umdogqualquer 数据来源:互联网公开数据 标签:文学,电影,数据集,文本分析,自然语言处理,哈利波特,数据挖掘,情感分析 数据概述:... -
恐怖电影与小说文本数据集-thne1111
恐怖电影与小说文本数据集-thne1111 数据来源:互联网公开数据 标签:恐怖电影,恐怖小说,文本分析,数据集,情感分析,自然语言处理,内容分析,文化研究 数据概述: 该数据集包含来自恐怖电影和恐怖小说的数据,记录了恐怖文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了从经典恐怖作品到现代恐怖作品。... -
电子邮件垃圾邮件检测与预测数据集EmailSpamDetectionandPredictionDataset-amritmth
电子邮件垃圾邮件检测与预测数据集EmailSpamDetectionandPredictionDataset-amritmth 数据来源:互联网公开数据 标签:垃圾邮件,邮件检测,数据集,机器学习,自然语言处理,文本分类,网络安全,数据挖掘 数据概述:...