找到29个数据集

标签: 多语言数据

过滤结果
  • Basalam产品实体分类数据集

    2025年4月19日   

    Basalam产品实体分类数据集 数据来源:互联网公开数据 标签:实体分类,产品分类,波斯语文本,电子商务,多语言数据,市场分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 多语言命名实体识别数据集

    2025年4月19日   

    多语言命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,多语言数据,自然语言处理,语言模型,数据标注,机器学习,深度学习 数据概述:...
    packageimg
  • 语言切换数据集

    2025年4月18日   

    语言切换数据集 数据来源:互联网公开数据 标签:语言翻译,多语言数据,机器学习,NLP,跨语言分析,语言对应关系 数据概述: 本数据集包含了多种语言之间的翻译记录,主要针对源语言(language)与目标语言(language_t)之间的对应关系。通过Google...
    packageimg
  • 土耳其-英语翻译数据集

    2025年4月16日   

    土耳其-英语翻译数据集 数据来源:互联网公开数据 标签:语言翻译,土耳其语,英语,多语言数据,文本翻译 数据概述: 本数据集来源于Tatoeba网站,包含了土耳其语与英语之间的翻译对。数据集主要由三列组成: Turkish:土耳其语单词或短语。 English:对应土耳其语单词或短语的英语翻译。...
    packageimg
  • 斯瓦希里语新闻分类数据集

    2025年4月16日   

    斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:...
    packageimg
  • 西班牙语有毒评论分析数据集

    2025年4月15日   

    西班牙语有毒评论分析数据集 数据来源:互联网公开数据 标签:有毒评论,文本分析,自然语言处理,机器学习,多语言数据,情感分析,社交媒体分析 数据概述: 本数据集由两个原始数据集合并并翻译成西班牙语而成。第一个数据集来自Kaggle的Jigsaw有毒评论分类挑战赛,包含标记为有毒或非有毒的英语评论。第二个数据集来自PAN 21...
    packageimg
  • 即时通讯应用评价数据集

    2025年4月15日   

    即时通讯应用评价数据集 数据来源:互联网公开数据 标签:即时通讯应用,客户评价,多语言数据,谷歌Play商店,文本分析,情感分析,自然语言处理 数据概述...
    packageimg
  • 印尼术语词汇表数据集

    2025年4月14日   

    印尼术语词汇表数据集 数据来源:互联网公开数据 标签:印尼语,词汇表,术语翻译,语言学习,知识领域,多语言数据,教育工具 数据概述: 本数据集包含从互联网公开来源抓取的182,410条外语词汇及其印尼语等价词和相关知识领域的信息。数据集以CSV格式存储,包含以下三个字段: 1. 外语词汇(foreign):外语术语。 2....
    packageimg
  • 一带一路倡议情感分析数据集

    2025年4月14日   

    一带一路倡议情感分析数据集 数据来源:互联网公开数据 标签:一带一路, 情感分析, 新闻文本, 社交媒体, 多语言数据, 舆论监测, 数据挖掘 数据概述:...
    packageimg