找到373个数据集

标签: 多语言

过滤结果
  • 多语言大规模多任务语言理解数据集

    2025年4月22日   

    多语言大规模多任务语言理解数据集 数据来源:互联网公开数据 标签:多语言,任务理解,人工智能,评测,翻译,低资源语言 数据概述:...
    packageimg
  • 世界各国国歌歌词与旗帜数据集合集-wricheekadhikari

    2025年4月22日   

    世界各国国歌歌词与旗帜数据集合集-wricheekadhikari 数据来源:互联网公开数据 标签:国歌,歌词,音乐,文化,国家,旗帜,YouTube,视听,多语言 数据概述:...
    packageimg
  • Open-Assistant多轮对话波斯语翻译数据集

    2025年4月22日   

    Open-Assistant多轮对话波斯语翻译数据集 数据来源:互联网公开数据 数据集简介: 本数据集为 Open-Assistant...
    packageimg
  • 英语-马拉雅拉姆语言翻译数据集-nihalthomas15

    2025年4月22日   

    英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:...
    packageimg
  • ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir

    2025年4月21日   

    ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir 数据来源:互联网公开数据 标签:ChatGPT, 评论, 用户反馈, 情感分析, 自然语言处理, 应用评估, Play Store, 移动应用, 多语言, 市场调研 数据概述: 本数据集包含100,000条来自Google Play...
    packageimg
  • 林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak

    2025年4月21日   

    林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:...
    packageimg
  • RSS订阅内容主题分类数据集-brobear1995

    2025年4月21日   

    RSS订阅内容主题分类数据集-brobear1995 数据来源:互联网公开数据 标签:RSS,订阅,内容分类,主题,自然语言处理,机器学习,文本分析,多语言,数据清洗,嵌入模型 数据概述:...
    packageimg
  • Jigsaw毒性评论多语言分类数据集

    2025年4月20日   

    Jigsaw毒性评论多语言分类数据集 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 自然语言处理, 多语言, 评论, 社交媒体, 文本分析, 机器学习 数据概述: 本数据集由Pavel Ostyakov创建,旨在支持多语言环境下的毒性评论分类任务。 数据集包含了多种语言的文本评论,并标注了毒性标签。...
    packageimg
  • 全球民间故事数据集1963-2021

    2025年4月20日   

    全球民间故事数据集1963-2021 数据来源:互联网公开数据 标签:民间故事,全球,文化研究,文学分析,民族学,故事文本,多语言 数据概述: 本数据集包含了来自57个国家的2838个民间故事,涵盖了亚洲、欧洲、北美洲、南美洲、非洲等多个地区的丰富文化资源。数据集中的故事文本主要用于研究全球民间故事的文化背景、文学特征和民族学价值。 数据用途概述:...
    packageimg
  • 阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用

    2025年4月20日   

    阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用 数据来源:互联网公开数据 标签:阿拉伯语,作文评分,自然语言处理,机器学习,数据集,文本分类,多语言,Open Orca, GPT-3.5, GPT-4, RAG, 翻译 数据概述:...
    packageimg
  • 艾尔登法环Steam游戏评价多语言月度更新数据集

    2025年4月19日   

    艾尔登法环Steam游戏评价多语言月度更新数据集 数据来源:互联网公开数据 标签:艾尔登法环,Steam,游戏评价,玩家评论,多语言,意大利语,英语,法语,西班牙语,德语,游戏数据,用户反馈 数据概述: 本数据集包含艾尔登法环(Elden...
    packageimg
  • Jigsaw多语言有毒评论分类预处理数据集

    2025年4月19日   

    Jigsaw多语言有毒评论分类预处理数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,有毒评论,多语言,预处理,机器学习,XLM-RoBERTa,Jigsaw 数据概述: 本数据集包含Jigsaw多语言有毒评论分类任务的预处理后的CSV文件。数据使用Hugging Face...
    packageimg
  • 多语言平行语料库数据集

    2025年4月19日   

    多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-...
    packageimg
  • AI4Privacy个人身份信息PII掩蔽数据集-200K样本

    2025年4月17日   

    AI4Privacy个人身份信息PII掩蔽数据集-200K样本 数据来源:互联网公开数据 标签:AI4Privacy, PII, 个人身份信息, 数据掩蔽, 隐私保护, 自然语言处理, 人工智能, 合成数据, 多语言, Hugging Face 数据概述: 本数据集由 AI4Privacy 开发,是隐私保护与人工智能领域的一项开创性工作。该数据集托管于...
    packageimg
  • 日本报纸新闻数据集

    2025年4月16日   

    日本报纸新闻数据集 数据来源:互联网公开数据 标签:日本媒体,新闻文本,时间序列,多语言 corpus,新闻分析,文本挖掘,语言研究 数据概述: 本数据集收录了2005年7月至2021年10月期间日本主流报纸网站及历史报纸 dataset...
    packageimg
  • Jigsaw多语言恶意评论翻译测试数据集-多语言-英语

    2025年4月16日   

    Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:...
    packageimg
  • 多语言毒性评论检测数据集

    2025年4月15日   

    多语言毒性评论检测数据集 数据来源:互联网公开数据 标签:毒性评论,多语言,自然语言处理,机器学习,文本分类,跨语言学习 数据概述:...
    packageimg
  • 领英行业列表数据集

    2025年4月15日   

    领英行业列表数据集 数据来源:互联网公开数据 标签:领英,行业列表,多语言,职业数据,市场研究 数据概述: 本数据集包含了领英平台上所有可用的行业分类列表,覆盖了多种语言。数据集不仅适用于英语,还收录了其他多种语言的行业描述,为跨语言的职业分析和市场研究提供了全面的参考。 数据用途概述:...
    packageimg
  • 维基百科关于谷歌的页面浏览量统计数据集-2023

    2025年4月15日   

    维基百科关于谷歌的页面浏览量统计数据集-2023 数据来源:互联网公开数据 标签:维基百科,谷歌,页面浏览量,搜索,互联网,信息检索,数据分析,多语言 数据概述:...
    packageimg
  • 多语言软件缺陷报告及其翻译数据集1963-2025

    2025年4月15日   

    多语言软件缺陷报告及其翻译数据集1963-2025 数据来源:互联网公开数据 标签:多语言,软件缺陷报告,翻译,自然语言处理,机器翻译,跨语言分析 数据概述:...
    packageimg