找到11,721个数据集

标签: 自然语言处理

过滤结果
  • 土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin

    2025年4月23日   

    土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin 数据来源:互联网公开数据 标签:土耳其新闻,健康,数据集,文本分析,自然语言处理,新闻媒体,医疗健康,舆情分析 数据概述: 该数据集包含来自土耳其新闻媒体的健康相关文章,旨在为研究者提供一个用于文本分析和自然语言处理的资源。主要特征如下:...
    packageimg
  • 医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq

    2025年4月23日   

    医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,医学研究,健康咨询,机器学习,信息检索,文本分析 数据概述:该数据集包含来自MedQuad项目的医疗问答数据,记录了患者与医疗专业人员之间的问答互动。主要特征如下:...
    packageimg
  • 政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23

    2025年4月23日   

    政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23 数据来源:互联网公开数据 标签:文本分析,词汇频率,社交媒体,数据集,政治研究,自然语言处理,机器学习,论坛分析...
    packageimg
  • 网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe

    2025年4月23日   

    网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,社交网络,内容审核,有害言论 数据概述: 该数据集来源于Jigsaw组织提供的网络评论数据,记录了互联网平台上的用户评论,并标注了评论的情绪和毒性程度。主要特征如下:...
    packageimg
  • 情感分析与评论数据集

    2025年4月23日   

    标题:情感分析与评论数据集 数据内容:该数据集包含两个主要字段,分别是“评论”和“情感”。其中,“评论”字段包含17,872种不同的值,代表了不同的用户评论内容;“情感”字段包含3种不同的值,表示评论的情感倾向(如正面、负面和中性)。 数据来源:互联网公开数据 数据用途: 1. 电子商务:可用于分析用户对产品或服务的评价,帮助企业优化产品和服务。 2....
    packageimg
  • 情感分析与情绪分类数据集

    2025年4月23日   

    标题:情感分析与情绪分类数据集 数据内容:本数据集包含了3289个不同的句子,每个句子都标注了相应的情绪和情感。情绪字段有6种不同的值,情感字段有2种不同的值。 数据来源:互联网公开数据...
    packageimg
  • 阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr

    2025年4月23日   

    阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,语言模型,机器翻译,阿拉伯语 数据概述: 该数据集包含阿拉伯语文本数据,记录了不同主题和类别的阿拉伯语文章,评论或文档。主要特征如下:...
    packageimg
  • 情感与文本数据集

    2025年4月23日   

    标题:情感与文本数据集 数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id)...
    packageimg
  • 美国数据科学就业市场分析数据集-manish131186

    2025年4月23日   

    美国数据科学就业市场分析数据集-manish131186 数据来源:互联网公开数据 标签:数据科学,就业市场,职位分析,美国,招聘信息,自然语言处理,机器学习,行业分析 数据概述: 该数据集包含了来自美国数据科学领域的招聘信息,旨在为分析就业市场趋势提供数据支持。主要特征如下: 时间跨度: 数据记录的时间范围从2020年初至2023年末。 地理范围:...
    packageimg
  • 挪威语评论情感分析数据集-文本情感分类-2024-ravaghi

    2025年4月23日   

    挪威语评论情感分析数据集-文本情感分类-2024-ravaghi 数据来源:互联网公开数据 标签:情感分析,文本分类,挪威语,自然语言处理,机器学习,评论,NoReC,情感极性 数据概述:...
    packageimg
  • Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui

    2025年4月23日   

    Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui 数据来源:互联网公开数据 标签:图像,斯瓦希里语,多模态,自然语言处理,图像描述,数据集,机器翻译,计算机视觉 数据概述:...
    packageimg
  • 垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar

    2025年4月23日   

    垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar 数据来源:互联网公开数据 标签:垃圾评论,数据集,文本分类,自然语言处理,机器学习,恶意内容检测,社交媒体,内容审核 数据概述: 该数据集包含来自社交媒体平台的评论数据,用于训练和评估垃圾评论检测模型。主要特征如下:...
    packageimg
  • 诗歌-议论文及散文文本数据集-huosiyuan

    2025年4月23日   

    诗歌-议论文及散文文本数据集-huosiyuan 数据来源:互联网公开数据 标签:诗歌,议论文,散文,文本分析,自然语言处理,写作风格,文本分类,教育 数据概述:...
    packageimg
  • 新闻批次文章与图像描述数据集TheBatchArticlesandImageDescriptionsDataset-ivanhusarov

    2025年4月23日   

    新闻批次文章与图像描述数据集TheBatchArticlesandImageDescriptionsDataset-ivanhusarov 数据来源:互联网公开数据 标签:新闻文章,图像描述,数据集,自然语言处理,计算机视觉,机器学习,内容分析,多媒体 数据概述: 该数据集包含来自新闻批次(The...
    packageimg
  • 越南大学情感分析数据集BinaryAspect-BasedSentimentAnalysisDataset-phngnguynvit

    2025年4月23日   

    越南大学情感分析数据集BinaryAspect-BasedSentimentAnalysisDataset-phngnguynvit 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,越南语,深度学习,观点挖掘,情感分类 数据概述: 该数据集包含来自越南大学的文本数据,主要用于情感分析研究,侧重于方面级情感分析。主要特征如下:...
    packageimg
  • 聊天用语数据集ChatSlangDataset-muhammadbilal6305

    2025年4月23日   

    聊天用语数据集ChatSlangDataset-muhammadbilal6305 数据来源:互联网公开数据 标签:聊天用语,社交媒体,数据集,自然语言处理,机器学习,文本分析,语言学,沟通研究 数据概述:该数据集包含来自社交媒体平台的聊天用语数据,记录了人们在聊天中使用的非正式语言,缩写和俚语。主要特征如下:...
    packageimg
  • 数据科学方向2020年文章元数据集TowardsDataScience2020PostsMetadataDataset-kevinndietrich

    2025年4月23日   

    数据科学方向2020年文章元数据集TowardsDataScience2020PostsMetadataDataset-kevinndietrich 数据来源:互联网公开数据 标签:数据科学,文章元数据,数据集,内容分析,机器学习,自然语言处理,出版分析,教育研究 数据概述: 该数据集包含来自数据科学方向(Towards Data...
    packageimg
  • 维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez

    2025年4月23日   

    维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez 数据来源:互联网公开数据 标签:电影,剧情,数据集,文本分析,自然语言处理,信息检索,机器学习,电影研究 数据概述: 该数据集包含来自维基百科的电影剧情摘要数据,记录了大量电影的剧情概要信息。主要特征如下:...
    packageimg
  • 罗马乌尔都语文本数据集-akarami

    2025年4月23日   

    罗马乌尔都语文本数据集-akarami 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,文本数据,自然语言处理,语言学,数据集,机器学习,文本分析 数据概述: 该数据集包含了用罗马字母书写的乌尔都语文本。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代乌尔都语的使用。...
    packageimg
  • 英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar

    2025年4月23日   

    英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar 数据来源:互联网公开数据 标签:机器翻译,英语,西班牙语,数据集,自然语言处理,文本翻译,双语资源,语言技术 数据概述: 该数据集包含英语到西班牙语的平行文本数据,主要记录了双语句子对,适用于机器翻译和自然语言处理任务。主要特征如下:...
    packageimg