-
社交问答网站匿名用户去匿名化研究数据集-tianbaojie
社交问答网站匿名用户去匿名化研究数据集-tianbaojie 数据来源:互联网公开数据 标签:社交问答,匿名用户,去匿名化,Zhihu,Quora,用户行为,文本分析,隐私保护,数据挖掘 数据概述:... -
网络钓鱼网址检测数据集PhishingURLDetectionDataset-xuanthantsbd
网络钓鱼网址检测数据集PhishingURLDetectionDataset-xuanthantsbd 数据来源:互联网公开数据 标签:网络钓鱼, 网址检测, 恶意网址, 机器学习, 文本分析, 安全防护, 数据标注, 二分类 数据概述: 该数据集包含来自网络安全研究和公开数据集的网址信息,记录了用于识别网络钓鱼攻击的URL样本。主要特征如下:... -
新闻真伪识别文本数据集NewsArticleTruthfulnessIdentificationDataset-engsaiedali
新闻真伪识别文本数据集NewsArticleTruthfulnessIdentificationDataset-engsaiedali 数据来源:互联网公开数据 标签:新闻真伪, 文本分类, 假新闻, 真实新闻, 自然语言处理, 机器学习, 文本分析, 新闻报道 数据概述:... -
最终清洗数据集-自然语言处理与情感分类场景
最终清洗数据集-自然语言处理与情感分类场景 数据来源:互联网公开数据 标签:NLP,情感分类,数据清洗,文本分析,机器学习,数据集 数据概述: 本数据集经过最终清洗处理,适用于建模和各种自然语言处理(NLP)任务。数据包含经过预处理的文本信息,适用于情感分类等应用场景。数据集已经完成了必要的清理步骤,确保数据质量和一致性。 数据用途概述:... -
禽类新城疫疫情分析数据集AvianNewcastleDiseaseOutbreakAnalysis-lukebatchelder
禽类新城疫疫情分析数据集AvianNewcastleDiseaseOutbreakAnalysis-lukebatchelder 数据来源:互联网公开数据 标签:新城疫, 禽类疾病, 疫情分析, 动物健康, 疾病传播, 流行病学, 数据挖掘, 文本分析 数据概述:... -
文本质量评估多维度打分数据集TextQualityAssessmentMulti-dimensionalScoringDataset-goldenlock
文本质量评估多维度打分数据集TextQualityAssessmentMulti-dimensionalScoringDataset-goldenlock 数据来源:互联网公开数据 标签:文本评估, 语言模型, 自动评分, 文本分析, 自然语言处理, 机器学习, 写作质量, 多维度评价 数据概述:... -
数据2022年财务报告摘要数据集-aryankashyapnaveen
2022年财务报告摘要数据集-aryankashyapnaveen 数据来源:互联网公开数据 标签:财务报告,摘要,总结,金融数据,文本分析,自然语言处理,FNS 数据概述: 本数据集包含了2022年财务报告摘要挑战赛中第一个黄金标准摘要。该数据集适用于金融报告的自动摘要生成,为研究和开发财务文本分析工具提供了基础数据。 数据用途概述:... -
新闻文章文本数据分析数据集NewsArticlesTextDataAnalysis-phidole
新闻文章文本数据分析数据集NewsArticlesTextDataAnalysis-phidole 数据来源:互联网公开数据 标签:新闻文章, 文本分析, 自然语言处理, 停用词, 词干提取, 文本分类, 情感分析, 数据挖掘 数据概述: 该数据集包含来自新闻文章的数据,记录了新闻标题和文章正文内容。主要特征如下:... -
商品信息哈希值数据集ProductInformationHashValuesDataset-eguhopor
商品信息哈希值数据集ProductInformationHashValuesDataset-eguhopor 数据来源:互联网公开数据 标签:商品信息, 哈希值, 数据比对, 数据清洗, 文本分析, 零售数据, 数据安全, 网页爬取 数据概述: 该数据集包含来自多个电商网站的商品信息,记录了商品的名称、URL链接以及对应的哈希值。主要特征如下:... -
新冠疫情下医学影像数据分析数据集COVID-19MedicalImagingDataAnalysis-alexvargasvalderrama
新冠疫情下医学影像数据分析数据集COVID-19MedicalImagingDataAnalysis-alexvargasvalderrama 数据来源:互联网公开数据 标签:医学影像, 新冠疫情, 影像分析, 数据挖掘, 文本分析, 聚类分析, 临床研究, 疫情影响 数据概述:... -
安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag
安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag 数据来源:互联网公开数据 标签:安然公司, 邮件, 财务报告, 文本分析, 信息检索, 电子邮件, 商业, 数据挖掘 数据概述:... -
美国亚利桑那州Yelp商家与用户评价数据集YelpBusinessandReviewDatainArizona-mobasshir
美国亚利桑那州Yelp商家与用户评价数据集YelpBusinessandReviewDatainArizona-mobasshir 数据来源:互联网公开数据 标签:Yelp, 商家数据, 用户评价, 亚利桑那州, 餐饮, 商业分析, 文本分析, 推荐系统 数据概述:... -
商品图像与描述的多模态数据集MultimodalProductImageandDescriptionDataset-imgremlin
商品图像与描述的多模态数据集MultimodalProductImageandDescriptionDataset-imgremlin 数据来源:互联网公开数据 标签:商品识别, 图像识别, 文本分析, 多模态学习, 商品描述, 图像检索, 计算机视觉, 电商 数据概述:... -
数字序列文本分析数据集DigitalSequenceTextAnalysisDataset-jumiarliu
数字序列文本分析数据集DigitalSequenceTextAnalysisDataset-jumiarliu 数据来源:互联网公开数据 标签:文本分析, 数字序列, 序列预测, 自然语言处理, 数据挖掘, 机器学习, 模式识别, 数据集 数据概述: 该数据集包含来自未知来源的数字序列文本数据,记录了由数字组成的序列。主要特征如下:... -
英语写作质量评估特征数据集EnglishWritingQualityAssessmentFeatures-iitm21f1005087
英语写作质量评估特征数据集EnglishWritingQualityAssessmentFeatures-iitm21f1005087 数据来源:互联网公开数据 标签:写作评估, 文本特征, 英语写作, 可读性, 语言模型, 文本分析, 机器学习, 写作评分 数据概述:... -
医学文献摘要肾脏病研究数据集MedicalLiteratureAbstractKidneyDiseaseResearchDataset-priya1506
医学文献摘要肾脏病研究数据集MedicalLiteratureAbstractKidneyDiseaseResearchDataset-priya1506 数据来源:互联网公开数据 标签:医学研究, 肾脏病学, 生物医学, 文本分析, 摘要, 临床研究, 机器学习, 预后分析 数据概述:... -
语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-buyingniu
语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-buyingniu 数据来源:互联网公开数据 标签:语义相似度, 自然语言处理, 模型评估, 文本分析, 机器学习, 相关性分析, Pearson相关系数, Spearman相关系数 数据概述:... -
越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong
越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong 数据来源:互联网公开数据 标签:越南语, 文本语料库, 文本分析, 自然语言处理, 语料库构建, 文本摘要, 词嵌入, 语言模型 数据概述:... -
文本序列生成与预测提交数据集TextSequenceGenerationandPredictionSubmission-jony12rb
文本序列生成与预测提交数据集TextSequenceGenerationandPredictionSubmission-jony12rb 数据来源:互联网公开数据 标签:文本生成, 序列预测, 自然语言处理, 文本建模, 机器学习, 文本分析, 数据提交, 模型评估 数据概述:... -
文本生成写作质量评估训练数据集TextGenerationWritingQualityEvaluationTrainingDataset-conjuring92
文本生成写作质量评估训练数据集TextGenerationWritingQualityEvaluationTrainingDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作质量, 机器写作, 情感分析, 文本分析, 语料库, 机器学习, 自然语言处理 数据概述:...