-
社交平台评论毒性评估预测数据集SocialPlatformCommentToxicityPrediction-hhstrand
社交平台评论毒性评估预测数据集SocialPlatformCommentToxicityPrediction-hhstrand 数据来源:互联网公开数据 标签: 毒性检测, 文本分类, 机器学习, 情感分析, 自然语言处理, 深度学习, 评论分析, 模型预测 数据概述: 该数据集包含来自社交平台评论的预测结果,用于评估评论的毒性程度。主要特征如下:... -
事实核查声明文本数据集Fact-checkingClaimTextDataset-ritvik916
事实核查声明文本数据集Fact-checkingClaimTextDataset-ritvik916 数据来源:互联网公开数据 标签:事实核查, 声明文本, 文本分类, 政治声明, 真伪判断, 自然语言处理, 信息抽取, 数据标注 数据概述: 该数据集包含来自事实核查网站的数据,记录了用于事实核查的声明文本。主要特征如下:... -
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-sunidhiprakash
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-sunidhiprakash 数据来源:互联网公开数据 标签:文本分析, 学术研究, 自然语言处理, 论文摘要, 机器学习, 文本摘要, 计算机科学, 金融工程 数据概述:... -
视频字幕过滤数据集SubtitleFilteredDataset-hooong
视频字幕过滤数据集SubtitleFilteredDataset-hooong 数据来源:互联网公开数据 标签:字幕,视频,文本分析,自然语言处理,数据集,内容过滤,机器学习,数据清洗 数据概述: 该数据集包含经过筛选和过滤的视频字幕数据,旨在用于文本分析、内容过滤和自然语言处理任务。主要特征如下:... -
尼泊尔梵文字手写数据集NepaliBarnamala手写数据集-balnyaupane
尼泊尔梵文字手写数据集NepaliBarnamala手写数据集-balnyaupane 数据来源:互联网公开数据 标签:尼泊尔文,手写识别,数据集,图像处理,机器学习,自然语言处理,学术资源,图像分析 数据概述: 该数据集包含来自尼泊尔梵文字母的手写样本数据,记录了尼泊尔语的各个字母的手写形式。主要特征如下:... -
新闻文章情感强度预测数据集-parshantkumar2033
新闻文章情感强度预测数据集-parshantkumar2033 数据来源:互联网公开数据 标签:情感分析,文本挖掘,新闻文章,情感强度,自然语言处理,机器学习,情感分类,数据分析 数据概述: 该数据集包含来自新闻文章的数据,用于情感强度预测任务。主要特征如下: 时间跨度:数据记录的时间范围未知,取决于新闻文章的发布时间。... -
语言模型性能评估数据集LMSYSDataset-coldn00ldes
语言模型性能评估数据集LMSYSDataset-coldn00ldes 数据来源:互联网公开数据 标签:语言模型,性能评估,数据集,机器学习,自然语言处理,人工智能,模型优化,算法评估 数据概述: 该数据集由LMSYS项目提供,主要记录了不同语言模型在多种任务中的性能表现。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
医疗健康聊天机器人数据集HealthcareChatbotDataset-lthnhtin
医疗健康聊天机器人数据集HealthcareChatbotDataset-lthnhtin 数据来源:互联网公开数据 标签:医疗健康,聊天机器人,数据集,自然语言处理,人工智能,医疗咨询,患者支持,机器学习 数据概述:该数据集包含来自多个医疗机构和健康咨询平台的聊天记录,记录了用户与医疗健康聊天机器人的交互数据。主要特征如下:... -
虚假信息与讽刺性新闻数据集MisinformationandSatireNewsDataset-hrithikmajumdar
虚假信息与讽刺性新闻数据集MisinformationandSatireNewsDataset-hrithikmajumdar 数据来源:互联网公开数据 标签:虚假信息,新闻分析,数据集,文本分类,自然语言处理,媒体研究,机器学习,内容审核 数据概述:... -
汽车评论情感分析数据集CarReviewsDataset-pranavmanoj
汽车评论情感分析数据集CarReviewsDataset-pranavmanoj 数据来源:互联网公开数据 标签:汽车,评论,情感分析,文本数据,自然语言处理,机器学习,情感分类,舆情分析 数据概述: 该数据集包含了来自互联网的汽车评论数据,旨在用于情感分析和文本挖掘任务。主要特征如下: 时间跨度:... -
泰米尔语维基百科摘要数据集TamilWikipediaSummarizationDataset-aswin037
泰米尔语维基百科摘要数据集TamilWikipediaSummarizationDataset-aswin037 数据来源:互联网公开数据 标签:泰米尔语,维基百科,摘要生成,自然语言处理,机器学习,文本处理,多语言,人工智能 数据概述:... -
卫报新闻内容数据集GuardianNewsDataset-sameedhayat
卫报新闻内容数据集GuardianNewsDataset-sameedhayat 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,媒体研究,新闻传播,机器学习,内容分析 数据概述: 该数据集包含来自英国《卫报》的新闻内容数据,记录了该报的报道文章及相关元信息。主要特征如下:... -
电子邮件内容分析数据集SampledEmailDataset-sanjayyym
电子邮件内容分析数据集SampledEmailDataset-sanjayyym 数据来源:互联网公开数据 标签:电子邮件,数据分析,文本挖掘,自然语言处理,机器学习,信息分类,数据挖掘,通信研究 数据概述: 该数据集包含来自多个电子邮件服务提供商的邮件样本数据,记录了电子邮件的发送者、接收者、主题、正文内容、发送时间等信息。主要特征如下:... -
查询扩展技术数据集QueryExpansionDataset-fallzqm
查询扩展技术数据集QueryExpansionDataset-fallzqm 数据来源:互联网公开数据 标签:信息检索,查询扩展,数据集,自然语言处理,机器学习,搜索引擎,文本分析,人工智能 数据概述: 该数据集专注于查询扩展技术,记录了用户查询及其扩展后的相关查询信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
中文文本情感分析训练数据集ChineseTextSentimentAnalysisTrainingData-zhangkaihua88
中文文本情感分析训练数据集ChineseTextSentimentAnalysisTrainingData-zhangkaihua88 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 机器学习, 自然语言处理, 情感标注, 中文文本, 深度学习, BERT模型 数据概述:... -
Elham语音识别数据集ELHAMASRDataset-melikasaadi
Elham语音识别数据集ELHAMASRDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别,数据集,声学建模,自然语言处理,机器学习,语音信号处理,波斯语,阿拉伯语 数据概述: 该数据集由 Elham 项目提供,包含用于语音识别任务的波斯语和阿拉伯语语音数据。主要特征如下:... -
药品评论数据集DrugReviewsDataset-shaikjasheen
药品评论数据集DrugReviewsDataset-shaikjasheen 数据来源:互联网公开数据 标签:药品评论,数据集,医疗健康,消费者反馈,自然语言处理,文本挖掘,市场研究,药物评价 数据概述:该数据集包含来自互联网公开平台的药品评论数据,记录了消费者对各种药品的使用体验和反馈。主要特征如下:... -
虚假新闻预处理数据集-gongjunmin
虚假新闻预处理数据集-gongjunmin 数据来源:互联网公开数据 标签:虚假新闻,文本分析,自然语言处理,数据集,机器学习,新闻分类,信息检索,舆情分析 数据概述: 该数据集包含了经过预处理的虚假新闻数据,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖近年来新闻报道。... -
arXiv论文集增强版包含文体特征数据集arXivDatasetEnhancedwithStylometricFeatures-desaraxhura
arXiv论文集增强版包含文体特征数据集arXivDatasetEnhancedwithStylometricFeatures-desaraxhura 数据来源:互联网公开数据 标签:学术研究,文体分析,数据集,机器学习,文本挖掘,自然语言处理,信息检索,数据科学 数据概述:... -
图像描述生成数据集ImageCaptioningDataset-amank4212
图像描述生成数据集ImageCaptioningDataset-amank4212 数据来源:互联网公开数据 标签:图像识别, 自然语言处理, 图像描述, 计算机视觉, 深度学习, 数据集, 文本生成, 多模态 数据概述: 该数据集包含图片及其对应的描述文本,旨在用于图像描述生成任务。主要特征如下: 时间跨度:数据未标明具体时间,视作静态数据集使用。...