找到11,702个数据集

标签: 自然语言处理

过滤结果
  • 不明飞行物UFO目击记录数据集

    2025年4月16日   

    不明飞行物UFO目击记录数据集 数据来源:互联网公开数据 标签:不明飞行物, UFO目击记录, 地理编码, 时间序列分析, 空中现象, 数据可视化, 自然语言处理 数据概述:...
    packageimg
  • Kickstarter项目描述文本与项目成功状态数据集-2017年

    2025年4月16日   

    Kickstarter项目描述文本与项目成功状态数据集-2017年 数据来源:互联网公开数据 标签:众筹项目,Kickstarter,自然语言处理,项目成功预测,文本分析,机器学习,项目描述,文本分类 数据概述:...
    packageimg
  • TED演讲数据集含演讲稿-LIWC和MFT分析

    2025年4月16日   

    TED演讲数据集含演讲稿-LIWC和MFT分析 数据来源:互联网公开数据 标签:TED演讲,公共演讲,语言分析,道德基础理论,数据可视化,文本挖掘,自然语言处理,心理语言学 数据概述:...
    packageimg
  • 阿拉伯语哮喘情感分析数据集

    2025年4月16日   

    阿拉伯语哮喘情感分析数据集 数据来源:互联网公开数据 标签:哮喘,情感分析,阿拉伯语,社交媒体,健康话题,文本数据,自然语言处理 数据概述:...
    packageimg
  • 全球352种语言形态标注数据集

    2025年4月16日   

    全球352种语言形态标注数据集 数据来源:互联网公开数据 标签:语言学,形态学,词形变化,多语种,自然语言处理,Unimorph,特征标注 数据概述:...
    packageimg
  • 斯瓦希里语新闻分类数据集

    2025年4月16日   

    斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
    packageimg
  • H-M个性化时尚数据集

    2025年4月16日   

    H-M个性化时尚数据集 数据来源:互联网公开数据 标签:个性化推荐,时尚产业,客户行为,产品元数据,图像处理,自然语言处理 数据概述:...
    packageimg
  • TED演讲文本数据集-演讲内容与结构分析-2024年9月12日

    2025年4月16日   

    TED演讲文本数据集-演讲内容与结构分析-2024年9月12日 数据来源:互联网公开数据 标签:TED演讲,文本,转录,演讲稿,自然语言处理,文本分析,主题分割,内容分析 数据概述:...
    packageimg
  • Twitter社交媒体情感分析数据集

    2025年4月16日   

    Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:...
    packageimg
  • Jigsaw多语言恶意评论翻译测试数据集-多语言-英语

    2025年4月16日   

    Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:...
    packageimg
  • ChatGPT话题推特情感分析数据集-2022年11月至2023年2月

    2025年4月16日   

    ChatGPT话题推特情感分析数据集-2022年11月至2023年2月 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,情感分析,自然语言处理,人工智能,用户行为,话题讨论 数据概述:...
    packageimg
  • 俄罗斯幽默笑话主题分类数据集

    2025年4月16日   

    俄罗斯幽默笑话主题分类数据集 数据来源:互联网公开数据 标签:笑话,俄罗斯,幽默,文本分类,自然语言处理,情感分析,语言文化,喜剧 数据概述: 本数据集包含大量俄罗斯幽默笑话的文本内容,旨在为文本分类任务提供训练和测试数据。数据集中的每个笑话都附带了文本信息,可用于预测笑话的主题或进行情感分析。 数据用途概述:...
    packageimg
  • Reddit百万笑话语料库数据集-2020年4月1日前

    2025年4月16日   

    Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:...
    packageimg
  • IWSLT2017英语-中文翻译数据集

    2025年4月15日   

    IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging...
    packageimg
  • 多语言毒性评论检测数据集

    2025年4月15日   

    多语言毒性评论检测数据集 数据来源:互联网公开数据 标签:毒性评论,多语言,自然语言处理,机器学习,文本分类,跨语言学习 数据概述:...
    packageimg
  • 汉字与汉语拼音转换训练数据集

    2025年4月15日   

    汉字与汉语拼音转换训练数据集 数据来源:互联网公开数据 标签:汉字,汉语拼音,文本数据,语言处理,机器学习,自然语言处理,数据转换 数据概述: 本数据集包含了多领域文本数据,包括汉字语句序列及其对应的汉语拼音序列。这些数据适用于训练汉字与汉语拼音之间的互转模型,支持多种自然语言处理任务。 数据用途概述: 该数据集适用于汉字-...
    packageimg
  • 韩国语翻译数据集

    2025年4月15日   

    韩国语翻译数据集 数据来源:互联网公开数据 标签:韩国语,翻译,NLP模型,机器翻译,自然语言处理,DeepL API,英译韩,语言学习 数据概述: 本数据集提供了一组从英语翻译成韩国语的文本数据,适用于GPT4ALL、Dolly、Vicuna等NLP模型的训练与研究。数据集由nlpai-lab团队整理,通过DeepL...
    packageimg
  • Reddit社区情感分析-帖子情感倾向数据集-2024

    2025年4月15日   

    Reddit社区情感分析-帖子情感倾向数据集-2024 数据来源:互联网公开数据 标签:情感分析, Reddit, 文本数据, 社交媒体, 自然语言处理, 情感分类, 机器学习, 文本情感, 帖子, 2024 数据概述:...
    packageimg
  • WebGL模型问答数据集

    2025年4月15日   

    WebGL模型问答数据集 数据来源:互联网公开数据 标签:WebGL,模型,问答,自然语言处理,机器学习,计算机图形学,数据集,QA 数据概述: 本数据集由THUDM团队在Hugging...
    packageimg
  • 新型冠状病毒推文趋势数据集

    2025年4月15日   

    新型冠状病毒推文趋势数据集 数据来源:互联网公开数据 标签:推文,新冠,疫情分析,社交媒体,时间序列分析,文本挖掘,自然语言处理 数据概述:...
    packageimg