-
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源:互联网公开数据 标签:维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集 数据概述: 该数据集包含来自维基百科的文章文本数据,记录了维基百科上收录的各种主题的文章内容。主要特征如下:... -
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集 数据概述:... -
维基百科评论文本毒性分类数据集WikipediaCommentTextToxicityClassificationDataset-zhiyuli000
维基百科评论文本毒性分类数据集WikipediaCommentTextToxicityClassificationDataset-zhiyuli000 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 恶意评论, 文本标注, 维基百科 数据概述:... -
维基百科旅行模板提取数据集-dkayton
维基百科旅行模板提取数据集-dkayton 数据来源:互联网公开数据 标签:维基百科,旅行,模板,文本挖掘,自然语言处理,数据集,信息提取,知识图谱 数据概述: 该数据集包含从维基百科中提取的旅行相关模板数据,记录了旅行相关的结构化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于维基百科数据的更新。... -
维基百科训练数据集Wiki-TrainDataset-victoriasaz
维基百科训练数据集Wiki-TrainDataset-victoriasaz 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,维基百科,文本分类,语言模型,信息检索 数据概述: 该数据集包含来自维基百科的文本数据,主要用于训练自然语言处理模型。主要特征如下:... -
成吉思汗维基百科传记文本数据集GenghisKhanWikipediaBiographyTextDataset-mehmeteminaydin
成吉思汗维基百科传记文本数据集GenghisKhanWikipediaBiographyTextDataset-mehmeteminaydin 数据来源:互联网公开数据 标签:历史人物, 维基百科, 传记文本, 自然语言处理, 文本分析, 蒙古帝国, 历史研究, 数据清洗 数据概述:... -
维基百科评论毒性分类数据集WikipediaCommentsToxicityClassificationDataset-vedanttolia
维基百科评论毒性分类数据集WikipediaCommentsToxicityClassificationDataset-vedanttolia 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 恶意评论, 维基百科, 自然语言处理, 深度学习, 数据标注 数据概述:... -
维基百科页面入度数据集Wiki-LiteIn-degreeDataset-colinsmyth001
维基百科页面入度数据集Wiki-LiteIn-degreeDataset-colinsmyth001 数据来源:互联网公开数据 标签:网络分析,数据集,维基百科,入度分析,图论,数据挖掘,社会科学,网页结构 数据概述: 该数据集包含来自维基百科的页面入度数据,记录了维基百科页面之间的引用关系。主要特征如下: 时间跨度:... -
维基百科评论文本毒性分析数据集WikipediaCommentTextToxicityAnalysis-taishioikawa
维基百科评论文本毒性分析数据集WikipediaCommentTextToxicityAnalysis-taishioikawa 数据来源:互联网公开数据 标签: 文本分析, 毒性检测, 评论分类, 自然语言处理, 机器学习, 情感分析, 维基百科, 数据标注 数据概述:... -
维基百科元数据数据集WikipediaMetadataDataset-chankhavu
维基百科元数据数据集WikipediaMetadataDataset-chankhavu 数据来源:互联网公开数据 标签:元数据,维基百科,数据集,文本挖掘,自然语言处理,机器学习,信息检索,数据科学 数据概述: 该数据集包含来自维基百科的元数据,记录了维基百科条目的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2023年6月1日。... -
维基百科文章摘要数据集WikipediaArticlesSummary-sayedmahmoud
维基百科文章摘要数据集WikipediaArticlesSummary-sayedmahmoud 数据来源:互联网公开数据 标签:维基百科, 文本摘要, 自然语言处理, 文本分析, 信息检索, 知识图谱, 数据挖掘, 语料库 数据概述: 该数据集包含来自维基百科的文章摘要信息,记录了文章标题、正文内容及对应的URL链接。主要特征如下:... -
维基百科摘要数据集WikipediaSummaryDataset-pbhaskar2003
维基百科摘要数据集WikipediaSummaryDataset-pbhaskar2003 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,信息检索,文本分析,维基百科,语义理解 数据概述: 该数据集包含来自维基百科的文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
维基百科页面标题清洗数据集WikipediaPageTitleCleaningDataset-mathurinache
维基百科页面标题清洗数据集WikipediaPageTitleCleaningDataset-mathurinache 数据来源:互联网公开数据 标签:维基百科, 页面标题, 文本清洗, 数据预处理, 自然语言处理, 文本分析, 标题提取, 数据集 数据概述: 该数据集包含来自维基百科的页面标题数据,记录了维基百科页面标题的原始文本。主要特征如下:... -
维基百科评论文本毒性分析数据集WikipediaCommentTextToxicityAnalysis-the7oceans
维基百科评论文本毒性分析数据集WikipediaCommentTextToxicityAnalysis-the7oceans 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 自然语言处理, 情感分析, 恶意评论, 维基百科, 机器学习, 评论分析 数据概述:... -
维基百科词条向量化数据集WikipediaTermVectorizationDataset-darkmistress
维基百科词条向量化数据集WikipediaTermVectorizationDataset-darkmistress 数据来源:互联网公开数据 标签:词向量, 文本分析, 机器学习, 知识图谱, 语义相似度, 降维, 自然语言处理, 维基百科 数据概述:... -
维基百科评论文本毒性检测数据集WikipediaCommentTextToxicityDetection-abhisekseth
维基百科评论文本毒性检测数据集WikipediaCommentTextToxicityDetection-abhisekseth 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 自然语言处理, 机器学习, 负面评论, 维基百科, 数据标注 数据概述:... -
橄榄球运动员佩顿-曼宁维基百科页面访问量时间序列数据集AmericanFootballPlayerPeytonManningWikipediaPageVi...
橄榄球运动员佩顿-曼宁维基百科页面访问量时间序列数据集AmericanFootballPlayerPeytonManningWikipediaPageViewsTimeSeries-softstec 数据来源:互联网公开数据 标签:时间序列分析, 维基百科, 页面访问量, 橄榄球, 数据可视化, 预测模型, 体育数据, 运动员 数据概述:... -
维基百科中文语句数据集-terrychanorg
维基百科中文语句数据集-terrychanorg 数据来源:互联网公开数据 标签:维基百科,中文,语句数据,自然语言处理,文本分析,语言学,数据集 数据概述: 本数据集包含从维基百科中文版提取的1258282句语句数据。这些语句涵盖了广泛的主题和领域,包括但不限于历史、科学、技术、文化和社会。数据集旨在为自然语言处理和文本分析提供丰富的语料库资源。... -
维基百科人物传记文本生成数据集-thedevastator
维基百科人物传记文本生成数据集-thedevastator 数据来源:互联网公开数据 标签:维基百科,人物传记,文本生成,自然语言处理,机器学习,文本摘要,信息抽取 数据概述:... -
健康医疗文本信息数据集HealthMedicalTextInformation-nekuitiefangbiediant
健康医疗文本信息数据集HealthMedicalTextInformation-nekuitiefangbiediant 数据来源:互联网公开数据 标签:医疗健康, 文本分析, 文本挖掘, 自然语言处理, 维基百科, 数据清洗, 知识图谱, 信息检索 数据概述:...