-
德国新闻文章分类数据集-2011-abhishek
德国新闻文章分类数据集-2011-abhishek 数据来源:互联网公开数据 标签:新闻文章,分类,德语,文本分析,自然语言处理,学术研究,工业应用 数据概述: 本数据集包含10,000篇德语新闻文章,适用于主题分类研究。数据来源于Dietmar Schabus, Marcin Skowron和Martin Trapp于2017年在ACM... -
越南语文本语义分析数据集VietnameseTextSemanticAnalysis-trnginhnht
越南语文本语义分析数据集VietnameseTextSemanticAnalysis-trnginhnht 数据来源:互联网公开数据 标签:越南语, 文本分析, 语义理解, 文本嵌入, 词向量, 自然语言处理, 文本分类, 语料库 数据概述: 该数据集包含来自越南语文本的数据,记录了越南语文本片段及其对应的标识符。主要特征如下:... -
电影作品信息及演员关系分析数据集MovieInformation-ActorRelationshipDataset-amrishcareem
电影作品信息及演员关系分析数据集MovieInformation-ActorRelationshipDataset-amrishcareem 数据来源:互联网公开数据 标签:电影, 演员, 作品, 票房, 电影产业, 文本分析, 数据挖掘, 关联分析 数据概述: 该数据集包含电影作品的相关信息,以及演员在电影中的角色关系。主要特征如下:... -
新闻网站地图链接数据分析数据集-BBC-BuzzFeed-CNBC-经济学人-半岛电视台-纽约时报-eliasdabbas
新闻网站地图链接数据分析数据集-BBC-BuzzFeed-CNBC-经济学人-半岛电视台-纽约时报-eliasdabbas 数据来源:互联网公开数据 标签:新闻,网站地图,链接,URL,出版趋势,文本分析,BBC,BuzzFeed,CNBC,经济学人,半岛电视台,纽约时报 数据概述:... -
YouTube视频趋势分析数据集YouTubeVideoTrendAnalysis-juwonyeo
YouTube视频趋势分析数据集YouTubeVideoTrendAnalysis-juwonyeo 数据来源:互联网公开数据 标签:YouTube, 视频分析, 趋势分析, 社交媒体, 流行文化, 数据挖掘, 文本分析, 机器学习 数据概述:... -
技能需求分析数据集SkillDemandAnalysis-dmitryvoznesensky
技能需求分析数据集SkillDemandAnalysis-dmitryvoznesensky 数据来源:互联网公开数据 标签:技能分析, 招聘数据, 职业发展, 数据挖掘, 自然语言处理, 文本分析, 行业趋势, 市场调研 数据概述: 该数据集包含来自招聘网站的技能需求信息,记录了不同职位对所需技能的描述。主要特征如下:... -
乌克兰战争社交媒体文本分析数据集UkraineWarSocialMediaTextAnalysis-deepusingla
乌克兰战争社交媒体文本分析数据集UkraineWarSocialMediaTextAnalysis-deepusingla 数据来源:互联网公开数据 标签:乌克兰战争, 社交媒体, 文本分析, 自然语言处理, 舆情分析, 情感分析, 战争冲突, 文本预处理 数据概述:... -
文本摘要生成批处理任务数据集TextSummarizationBatchTaskDataset-nathanfernandes
文本摘要生成批处理任务数据集TextSummarizationBatchTaskDataset-nathanfernandes 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 批处理任务, 文本分析, 数据标注, 机器学习, 语料库, 评估指标 数据概述:... -
青年就业赋能ICT技能分析数据集YouthEmploymentEmpowermentICTSkillsAnalysis-leylahelin1
青年就业赋能ICT技能分析数据集YouthEmploymentEmpowermentICTSkillsAnalysis-leylahelin1 数据来源:互联网公开数据 标签:青年就业, ICT技能, 文本分析, 机器学习, 赋能, 收入提升, 自然语言处理, 政策研究 数据概述: 该数据集包含来自研究报告的数据,记录了DOT... -
FCC网络中立性评论向量化样本文档2023-jeffkao
FCC网络中立性评论向量化样本文档2023-jeffkao 数据来源:互联网公开数据 标签:FCC,网络中立性,评论,向量化,数据样本,HDBSCAN,文本分析,政策制定,公众意见 数据概述:... -
人脸识别技术伦理与数据集分析数据集FacialRecognitionEthicsandDatasetAnalysis-heavu1
人脸识别技术伦理与数据集分析数据集FacialRecognitionEthicsandDatasetAnalysis-heavu1 数据来源:互联网公开数据 标签:人脸识别, 数据集, 伦理问题, 隐私保护, 数据分析, 机器学习, 文本分析, 深度学习 数据概述:... -
中文谣言检测数据集ChineseRumorDetectionDataset-ramoliyafenil
中文谣言检测数据集ChineseRumorDetectionDataset-ramoliyafenil 数据来源:互联网公开数据 标签:谣言检测, 文本分析, 自然语言处理, 情感分析, 社交媒体, 信息安全, 数据挖掘, 机器学习 数据概述: 该数据集包含来自社交媒体的中文文本数据,记录了各类信息,用于谣言的识别与分析。主要特征如下:... -
文本摘要生成语料数据集TextSummarizationCorpus-rutamrisaldar
文本摘要生成语料数据集TextSummarizationCorpus-rutamrisaldar 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语料库, 文本分析, 机器翻译, 深度学习, 文本生成, 数据集 数据概述: 该数据集包含来自多个来源的文本数据,记录了用于文本摘要任务的语料。主要特征如下:... -
商品分类树结构与训练数据集ProductCategoryTreeandTrainingData-saspav
商品分类树结构与训练数据集ProductCategoryTreeandTrainingData-saspav 数据来源:互联网公开数据 标签:商品分类, 类别树, 机器学习, 数据标注, 文本分析, 推荐系统, 电商, 商品理解 数据概述: 该数据集包含来自电商平台的数据,记录了商品类别树结构以及用于训练和评估的商品数据。主要特征如下:... -
学生写作质量评估文本数据集StudentWritingQualityAssessmentTextDataset-abdulkadirguner
学生写作质量评估文本数据集StudentWritingQualityAssessmentTextDataset-abdulkadirguner 数据来源:互联网公开数据 标签:文本分析, 写作评估, 情感分析, 文本分类, 教育, 机器学习, 数据标注, 语料库 数据概述:... -
医患对话问答数据集Doctor-PatientDialogueQuestionAnsweringDataset-ahmedammar24
医患对话问答数据集Doctor-PatientDialogueQuestionAnsweringDataset-ahmedammar24 数据来源:互联网公开数据 标签:医患对话, 自然语言处理, 问答系统, 医疗健康, 文本分析, 语义理解, 信息抽取, 数据标注 数据概述:... -
电影评分数据集MovieRatingDataset-ranumadz
电影评分数据集MovieRatingDataset-ranumadz 数据来源:互联网公开数据 标签:电影推荐, 评分数据, 用户行为分析, 电影信息, 协同过滤, 数据挖掘, 机器学习, 文本分析 数据概述: 该数据集包含来自电影评分网站的电影评分数据,记录了用户对电影的评分以及电影的基本信息。主要特征如下:... -
手写字符识别TMNIST数据集HandwrittenCharacterRecognitionTMNIST-sajirigokak
手写字符识别TMNIST数据集HandwrittenCharacterRecognitionTMNIST-sajirigokak 数据来源:互联网公开数据 标签:手写字符, 字符识别, 图像识别, 机器学习, MNIST, 文本分析, 数据集, 计算机视觉 数据概述: 该数据集包含来自TMNIST(Traffic-... -
法国说唱音乐歌词文本分析数据集-说唱歌手歌词-2024
法国说唱音乐歌词文本分析数据集-说唱歌手歌词-2024 数据来源:互联网公开数据 标签:法国说唱,歌词,文本分析,音乐,语言学,文化研究,RapGenius,嘻哈 数据概述:... -
文本连贯性分析语料库数据集TextCohesionAnalysisCorpus-abdulkadirguner
文本连贯性分析语料库数据集TextCohesionAnalysisCorpus-abdulkadirguner 数据来源:互联网公开数据 标签:文本分析, 连贯性, 语篇分析, 自然语言处理, 文本挖掘, 语义理解, 语料库, 机器学习 数据概述: 该数据集包含来自公开来源的文本片段,记录了用于评估文本连贯性的结构化语料。主要特征如下:...