找到11,708个数据集

标签: 自然语言处理

过滤结果
  • Flickr8k图像日语翻译数据集

    2025年4月19日   

    Flickr8k图像日语翻译数据集 数据来源:互联网公开数据 标签:图像标注,日语翻译,机器翻译,图像识别,自然语言处理,图像描述,Flickr8k,多模态,文本数据 数据概述:...
    packageimg
  • 电影评论情感预测数据集

    2025年4月19日   

    电影评论情感预测数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,机器学习,自然语言处理,NLP,数据分析,电影元数据 数据概述:...
    packageimg
  • 新闻情感分析数据集2008-2024

    2025年4月19日   

    新闻情感分析数据集2008-2024 数据来源:互联网公开数据 标签:新闻,情感分析,股票市场预测,自然语言处理,NLTK VADER,NLTK RoBERTa,Hugging Face DistilBERT,时间序列,金融分析,文本挖掘 数据概述: 本数据集涵盖2008年6月8日至2024年8月3日期间来自三大新闻来源的新闻文章,包括Reddit...
    packageimg
  • 土耳其图书数据集

    2025年4月19日   

    土耳其图书数据集 数据来源:互联网公开数据 标签:土耳其文学,书籍信息,数据挖掘,分类分析,推荐系统,自然语言处理,NLP 数据概述:...
    packageimg
  • GlaivePython代码质量保证问答数据集

    2025年4月19日   

    GlaivePython代码质量保证问答数据集 数据来源:互联网公开数据 标签:Python, 代码质量, 问答, 自然语言处理, 机器学习, 代码助手, 代码生成, 编程学习, 开发工具 数据概述: 本数据集由Hugging Face Hub...
    packageimg
  • Jigsaw多语言有毒评论分类预处理数据集

    2025年4月19日   

    Jigsaw多语言有毒评论分类预处理数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,有毒评论,多语言,预处理,机器学习,XLM-RoBERTa,Jigsaw 数据概述: 本数据集包含Jigsaw多语言有毒评论分类任务的预处理后的CSV文件。数据使用Hugging Face...
    packageimg
  • 自然语言处理数据集-缩略语与表情符号

    2025年4月18日   

    自然语言处理数据集-缩略语与表情符号 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,缩略语,标点符号,表情符号,情感分析,数据清洗,文本挖掘,NLP 数据概述: 本数据集为自然语言处理(NLP)和文本挖掘任务提供了丰富的资源支持,包含多个关键文件,用于文本预处理过程中的数据清洗和特征提取。数据集主要组成部分包括:...
    packageimg
  • 耶鲁大学SParC数据集-上下文语义解析数据集

    2025年4月19日   

    耶鲁大学SParC数据集-上下文语义解析数据集 数据来源:互联网公开数据 标签:自然语言处理,语义解析,文本转SQL,数据集,上下文理解,数据库,机器学习,人工智能 数据概述: SParC(Semantic Parsing in...
    packageimg
  • 文本情感分析研究数据集-社交媒体评论与新闻文本-通用

    2025年4月19日   

    文本情感分析研究数据集-社交媒体评论与新闻文本-通用 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本挖掘,社交媒体,新闻文本,情感分类,观点挖掘,机器学习 数据概述:...
    packageimg
  • Steam游戏评论文本特征及用户偏好数据集-2023年

    2025年4月19日   

    Steam游戏评论文本特征及用户偏好数据集-2023年 数据来源:互联网公开数据 标签:Steam,游戏,评论,文本分析,用户偏好,机器学习,自然语言处理,推荐系统 数据概述:...
    packageimg
  • 法语词典数据集

    2025年4月19日   

    法语词典数据集 数据来源:互联网公开数据 标签:法语,词汇,词典,定义,自然语言处理,语言学习 数据概述:...
    packageimg
  • Vox媒体新闻文章内容数据集-2017年3月21日前

    2025年4月19日   

    Vox媒体新闻文章内容数据集-2017年3月21日前 数据来源:互联网公开数据 标签:新闻文章,媒体,内容分析,自然语言处理,文本数据,数据科学,Vox,文章,新闻,传播学 数据概述: 本数据集由Vox Media提供,是KDD...
    packageimg
  • 公开财报电话会议数据集

    2025年4月19日   

    公开财报电话会议数据集 数据来源:互联网公开数据 标签:财报电话会议,金融分析,自然语言处理,问答系统,实体提取,对话生成 数据概述:...
    packageimg
  • 塔斯尼姆新闻数据集

    2025年4月19日   

    塔斯尼姆新闻数据集 数据来源:互联网公开数据 标签:新闻分类,文本分类,媒体分析,自然语言处理,数据爬取 数据概述: 本数据集是从Tasnim新闻网站爬取的公开新闻数据,涵盖了多个类别的新闻内容。数据集旨在提供一个均衡分布的多类别新闻数据集,适用于文本分类任务。 数据用途概述:...
    packageimg
  • 动漫综合数据集

    2025年4月19日   

    动漫综合数据集 数据来源:互联网公开数据 标签:动漫,日本动漫,排行榜,推荐系统,数据分析,图像数据,自然语言处理 数据概述:...
    packageimg
  • 邮件垃圾信息数据集

    2025年4月19日   

    邮件垃圾信息数据集 数据来源:互联网公开数据 标签:垃圾邮件识别,邮件分类,机器学习,自然语言处理,数据挖掘,反垃圾邮件,文本分析 数据概述:...
    packageimg
  • 亚马逊客户评论数据集

    2025年4月19日   

    亚马逊客户评论数据集 数据来源:互联网公开数据 标签:电商平台,用户评论,情感分析,自然语言处理,信息检索,机器学习,产品体验,地域差异,促销意图 数据概述:...
    packageimg
  • 英文无大小写BERT模型单字词数据集

    2025年4月19日   

    英文无大小写BERT模型单字词数据集 数据来源:互联网公开数据 标签:BERT,自然语言处理,英文,词频分析,预训练模型,词汇分布,子词分割 数据概述:...
    packageimg
  • 德国300万句子数据集

    2025年4月19日   

    德国300万句子数据集 数据来源:互联网公开数据 标签:德语,句子,语料库,语言学研究,自然语言处理,文本分析,频率统计 数据概述:...
    packageimg
  • 文本分析与数据挖掘课程数据集

    2025年4月19日   

    文本分析与数据挖掘课程数据集 数据来源:互联网公开数据 标签:文本分析,数据挖掘,课程资源,教学研究,文本处理,机器学习,自然语言处理 数据概述:...
    packageimg