找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 人工智能术语数据集

    2025年4月14日   

    人工智能术语数据集 数据来源:互联网公开数据 标签:人工智能,术语,知识图谱,教育,技术文档,术语标准化,领域分析 数据概述:...
    packageimg
  • 电影评论NLTK数据集

    2025年4月14日   

    电影评论NLTK数据集 数据来源:互联网公开数据 标签:电影评论,自然语言处理,情感分析,词性标注,观众影响,故事描述,电影电视系列 数据概述: 本数据集包含了电影评论的相关信息,数据来源于之前的movie.csv数据集。数据集涵盖了电影名称、句子、词性标注、单个单词以及评论对观众的影响等内容,为电影评论的情感分析和自然语言处理提供了基础。...
    packageimg
  • 梵语文本生成与摘要研究数据集

    2025年4月14日   

    梵语文本生成与摘要研究数据集 数据来源:互联网公开数据 标签:梵语,文本生成,新闻摘要,语言学,数据增强,文本处理 数据概述:...
    packageimg
  • JavaPresse手动咖啡研磨机亚马逊用户评论情感分析数据集

    2025年4月14日   

    JavaPresse手动咖啡研磨机亚马逊用户评论情感分析数据集 数据来源:互联网公开数据 标签:咖啡研磨机,亚马逊,用户评论,情感分析,文本分类,产品评价,JavaPresse 数据概述:...
    packageimg
  • 西班牙诗歌数据集

    2025年4月14日   

    西班牙诗歌数据集 数据来源:互联网公开数据 标签:西班牙诗歌,NLP,文学分析,自然语言处理,诗歌爬虫,文学结构,文本挖掘 数据概述: 本数据集收录了从1960年代至今的大量西班牙诗歌作品,数据来源于2020年7月从诗歌网站www.poemas-del-...
    packageimg
  • 基于语言工具的AI生成文本错误分析数据集

    2025年4月14日   

    基于语言工具的AI生成文本错误分析数据集 数据来源:互联网公开数据 标签:AI检测,文本分析,语言工具,错误分析,生成文本,写作风格,自然语言处理,教育,评估 数据概述:...
    packageimg
  • Shopee商品检测竞赛OCR文本识别数据集

    2025年4月14日   

    Shopee商品检测竞赛OCR文本识别数据集 数据来源:互联网公开数据 标签:OCR,文本识别,商品检测,Shopee,图像处理,深度学习,竞赛数据 数据概述: 本数据集包含了从Shopee Code League(SCL)商品检测竞赛中提取的OCR(光学字符识别)文本数据。这些数据是利用Keras-...
    packageimg
  • 无政府主义书籍-PM出版社数据集

    2025年4月14日   

    无政府主义书籍-PM出版社数据集 数据来源:互联网公开数据 标签:无政府主义,书籍,左翼书店,PM出版社,文学分析,主题分类,文本分析 数据概述:...
    packageimg
  • 波兰圣诞颂歌数据集

    2025年4月14日   

    波兰圣诞颂歌数据集 数据来源:互联网公开数据 标签:圣诞颂歌,波兰,节日歌曲,宗教音乐,文化传承,歌词,文本分析 数据概述: 本数据集收录了Karol...
    packageimg
  • 在线赌博检测数据集

    2025年4月14日   

    在线赌博检测数据集 数据来源:互联网公开数据 标签:在线赌博,社交媒体,内容检测,自然语言处理,公共事件,实时分析 数据概述: 本数据集包含来自“Yogyakarta夜 carnival 9”实时直播的评论数据,该活动是为了庆祝Yogyakarta市成立268周年。数据集收集了直播期间的用户评论,用于分析和检测在线赌博的推广行为。数据集包含以下字段:...
    packageimg
  • 印度社交媒体情感分析推特数据集2022

    2025年4月14日   

    印度社交媒体情感分析推特数据集2022 数据来源:互联网公开数据 标签:社交媒体分析,推特数据,情感分析,公众意见,社会议题,政治,消费者产品,社会问题,梅西,FIFA世界杯,删除Facebook,Me Too,Black Lives Matter,Never Again,BarCamp 数据概述: 本数据集收录了通过Twitter...
    packageimg
  • 电影评论与评分数据集

    2025年4月14日   

    电影评论与评分数据集 数据来源:互联网公开数据 标签:电影评论,电影评分,自然语言处理,观众评价,电影分析,预测模型 数据概述: 本数据集来源于Rotten Tomatoes网站上观众(非专业评论家)的评论和评分。数据集包含了网站上各种电影的少量评论,旨在为自然语言处理分析提供基础,并构建一个能够根据观众评论预测评分的模型。所有数据的信用归Rotten...
    packageimg
  • DatabricksDolly-15k指令数据集

    2025年4月14日   

    DatabricksDolly-15k指令数据集 数据来源:互联网公开数据 标签:大型语言模型,指令微调,自然语言处理,数据集,开源,问答,文本生成,数据增强,Databricks 数据概述: Databricks Dolly-15k...
    packageimg
  • 复旦大学电影评论情感分析比赛数据集-电影评论-情感分析-文本数据

    2025年4月14日   

    复旦大学电影评论情感分析比赛数据集-电影评论-情感分析-文本数据 数据来源:互联网公开数据 标签:情感分析,电影评论,文本数据,自然语言处理,复旦大学,机器学习,情感分类,Kaggle 数据概述: 本数据集是复旦大学自然语言处理实验室(FDU-...
    packageimg
  • 推特评论情感分析数据集

    2025年4月14日   

    推特评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本数据,情绪分类,自然语言处理,机器学习 数据概述:...
    packageimg
  • 圣经葡萄牙文版数据集

    2025年4月14日   

    圣经葡萄牙文版数据集 数据来源:互联网公开数据 标签:圣经,葡萄牙文,文本挖掘,自然语言处理,聚类分析,分类分析,情感分析,神学研究 数据概述: 本数据集包含《圣经》的葡萄牙文版,主要源于Almeida Corrigida e Revisada...
    packageimg
  • 数据2022年10月美国原住民推文数据集

    2025年4月14日   

    数据2022年10月美国原住民推文数据集 数据来源:互联网公开数据 标签:美国原住民,推文,社交媒体分析,文化研究,社会趋势 数据概述: 本数据集收录了2022年10月14日至10月23日期间从Twitter上抓取的2,962条推文,内容围绕美国原住民/美洲原住民/土著美国人展开。数据集使用了“American Indian”、“Native...
    packageimg
  • 快乐原因文本分类数据集

    2025年4月14日   

    快乐原因文本分类数据集 数据来源:互联网公开数据 标签:文本分类,情感分析,快乐原因,数据科学,机器学习,自然语言处理 数据概述: 本数据集来源于一次在HackerEarth上进行的数据科学家职位挑战赛,包含了一系列文本数据,每条文本表达了个体感到快乐的原因。数据集旨在通过文本分类技术,识别并归类出个体快乐的原因,从而为情感分析和用户行为研究提供支持。...
    packageimg
  • 战棋游戏规则库与派系特性数据集第九版

    2025年4月14日   

    战棋游戏规则库与派系特性数据集第九版 数据来源:互联网公开数据 标签:40k,第9版,战争hammer,规则, factions,游戏数据,策略分析 数据集简介: 本数据集收录了桌上战棋游戏《Warhammer 40,000》第九版(9th...
    packageimg
  • 诗歌分类数据集2023

    2025年4月14日   

    诗歌分类数据集2023 数据来源:互联网公开数据 标签:诗歌,分类,文学,主题分析,自然,艺术,科学,爱情,关系,宗教 数据概述: 本数据集是从 Poetry Foundation 网站抓取的,包含超过5000首诗歌,涵盖了五个主要主题:自然、艺术与科学、爱情、关系和宗教。每个主题的诗歌数量分布较为均衡,为诗歌分类研究提供了丰富且多样化的数据资源。...
    packageimg