找到60个数据集

标签: 中文

过滤结果
  • 中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui

    2025年5月1日   

    中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui 数据来源:互联网公开数据 标签:机器翻译, 语言学, 中文, 越南语, 翻译对齐, 双语语料库, 自然语言处理, 文本数据 数据概述: 该数据集包含来自互联网的中文与越南语双语对照文本,记录了中文句子及其对应的越南语翻译。主要特征如下:...
    packageimg
  • 命名实体识别文本标注数据集NamedEntityRecognitionTextAnnotationDataset-terencenlp

    2025年4月30日   

    命名实体识别文本标注数据集NamedEntityRecognitionTextAnnotationDataset-terencenlp 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 数据集, 机器学习, 实体识别, 语料库, 中文 数据概述:...
    packageimg
  • 动漫图片标签中文数据集AnimeImageTagChineseDataset-bingyongai

    2025年4月29日   

    动漫图片标签中文数据集AnimeImageTagChineseDataset-bingyongai 数据来源:互联网公开数据 标签:动漫, 图片, 标签, 中文, 标注, 图像识别, 自然语言处理, 数据集 数据概述: 该数据集包含来自动漫图片的标签数据,记录了与动漫图片相关的中文标签信息。主要特征如下:...
    packageimg
  • 文本相似度匹配训练数据集TextSimilarityMatchingTrainingDataset-axiaox

    2025年4月29日   

    文本相似度匹配训练数据集TextSimilarityMatchingTrainingDataset-axiaox 数据来源:互联网公开数据 标签:文本匹配, 相似度计算, 自然语言处理, 数据集, 文本分类, 机器翻译, 深度学习, 中文 数据概述: 该数据集包含用于训练文本相似度匹配模型的数据,记录了文本对之间的相似性关系。主要特征如下:...
    packageimg
  • 医疗健康问答文本数据集MedicalHealthQuestionAnsweringTextDataset-huchenjiang

    2025年4月29日   

    医疗健康问答文本数据集MedicalHealthQuestionAnsweringTextDataset-huchenjiang 数据来源:互联网公开数据 标签:医疗健康, 问答系统, 自然语言处理, 文本分类, 语义理解, 知识图谱, 医疗咨询, 中文 数据概述:...
    packageimg
  • 中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123

    2025年4月29日   

    中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 中文, 英文, 翻译模型, 双语语料库, 自然语言处理 数据概述: 该数据集包含中英双语的短语句对,记录了英文短语及其对应的中文翻译。主要特征如下:...
    packageimg
  • 中文新闻文本分类数据集-liuw159

    2025年4月26日   

    中文新闻文本分类数据集-liuw159 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,中文,数据集,情感分析,主题建模 数据概述:该数据集包含来自多个中文新闻网站的文本数据,记录了新闻文章的内容和分类标签。主要特征如下: 时间跨度:数据记录的时间范围为2020年至2023年。...
    packageimg
  • 常见拼写错误纠正数据集-therahasya00

    2025年4月26日   

    常见拼写错误纠正数据集-therahasya00 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校正,语言学,机器学习,文本处理,中文 数据概述: 该数据集包含常见的中文拼写错误及其对应的正确词汇。主要特征如下: 时间跨度:数据记录的时间范围无明确限定,持续更新和维护。 地理范围:数据主要涵盖中国大陆地区常用的中文词汇和表达。...
    packageimg
  • 中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777

    2025年4月26日   

    中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777 数据来源:互联网公开数据 标签:自然语言处理,词向量,关系抽取,数据集,PyTorch,深度学习,中文,大数据分析 数据概述:...
    packageimg
  • 社交媒体情感分析测试数据集SODIC-NLPTestLabelvDataset-yaomllu

    2025年4月26日   

    社交媒体情感分析测试数据集SODIC-NLPTestLabelvDataset-yaomllu 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,社交媒体,机器学习,NLP,中文 数据概述: 该数据集是SODIC-NLP项目的一部分,旨在测试和评估中文情感分析模型的性能。主要特征如下:...
    packageimg
  • 汉字笔画顺序数据集-dreamitpossible

    2025年4月26日   

    汉字笔画顺序数据集-dreamitpossible 数据来源:互联网公开数据 标签:汉字,笔画顺序,数据集,书写,中文,教育,语言学,汉字结构 数据概述: 该数据集包含汉字的笔画顺序数据,记录了汉字书写时笔画的正确顺序。主要特征如下: 时间跨度:数据记录的时间范围为现代。 地理范围:数据主要涵盖中国大陆地区使用的汉字。...
    packageimg
  • 大规模中文文本情感分析训练数据集25万条-konstantinognev

    2025年4月26日   

    大规模中文文本情感分析训练数据集25万条-konstantinognev 数据来源:互联网公开数据 标签:情感分析,文本挖掘,中文,数据集,自然语言处理,机器学习,情感分类,NLP 数据概述: 该数据集包含25万条中文文本数据,主要用于情感分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但数据收集时间集中在近期。...
    packageimg
  • Qwen大模型微调问答数据集-martintura

    2025年4月26日   

    Qwen大模型微调问答数据集-martintura 数据来源:互联网公开数据 标签:大模型,微调,问答,自然语言处理,人工智能,数据集,模型训练,中文 数据概述:该数据集包含基于Qwen大模型微调的问答数据,记录了用户提出的问题和模型生成的回答。主要特征如下: 时间跨度:数据记录的时间范围为近期。 地理范围:数据主要针对中文用户,覆盖全球范围。...
    packageimg
  • CCF金融文本情感分析数据集-danielfme

    2025年4月25日   

    CCF金融文本情感分析数据集-danielfme 数据来源:互联网公开数据 标签:金融,文本分析,情感分析,自然语言处理,机器学习,数据集,中文,金融科技 数据概述: 该数据集包含来自CCF(中国计算机学会)金融领域的文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但主要反映金融领域相关的文本信息。...
    packageimg
  • 新闻文章情感分析数据集NewsArticlesSentimentAnalysisDataset-saigopal36

    2025年4月25日   

    新闻文章情感分析数据集NewsArticlesSentimentAnalysisDataset-saigopal36 数据来源:互联网公开数据 标签:新闻,情感分析,数据集,自然语言处理,文本挖掘,机器学习,舆情分析,中文 数据概述: 该数据集包含从各类新闻网站提取的新闻文章数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 文本摘要与主题分类数据集LCSTS数据集-yojn710

    2025年4月25日   

    文本摘要与主题分类数据集LCSTS数据集-yojn710 数据来源:互联网公开数据 标签:文本摘要,主题分类,自然语言处理,机器学习,数据集,中文,深度学习,NLP 数据概述: 该数据集包含来自新浪微博的中文文本数据,主要用于文本摘要和主题分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但主要来源于社交媒体平台。...
    packageimg
  • 新闻文本分类数据集-oussemahedri

    2025年4月25日   

    新闻文本分类数据集-oussemahedri 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,文本分析,数据集,新闻报道,中文 数据概述:该数据集包含来自互联网新闻网站的新闻文本数据,记录了不同类别新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta

    2025年4月25日   

    语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta 数据来源:互联网公开数据 标签:语音识别,情感识别,数据集,中文,深度学习,自然语言处理,音频分析,机器学习 数据概述:...
    packageimg
  • 情感分析二元分类数据集-chathushkajeewantha

    2025年4月25日   

    情感分析二元分类数据集-chathushkajeewantha 数据来源:互联网公开数据 标签:情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性,数据集,中文 数据概述: 该数据集包含用于情感分析的文本数据,主要用于二元情感分类任务。主要特征如下: 时间跨度:数据记录的时间范围未明确,但包含各类文本数据。...
    packageimg
  • 中文维基百科词向量模型训练数据集-文本语料-2023年

    2025年4月25日   

    中文维基百科词向量模型训练数据集-文本语料-2023年 数据来源:互联网公开数据 标签:自然语言处理, 词向量, word2vec, 文本语料, 中文, 维基百科, 机器学习, 深度学习, 训练数据 数据概述:...
    packageimg