找到1,302个数据集

标签: 语料库

过滤结果
  • 多语言文本嵌入与翻译数据集

    2025年10月3日   

    多语言文本嵌入与翻译数据集_Multilingual_Text_Embedding_and_Translation_Dataset 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 机器翻译, 英语, 西班牙语, 语料库, 自然语言处理, 数据集 数据概述:...
    packageimg
  • 闽南语语音词汇及发音数据集

    2025年9月27日   

    闽南语语音词汇及发音数据集_Min_Nan_Language_Speech_Vocabulary_and_Pronunciation_Dataset 数据来源:互联网公开数据 标签:闽南语,语音识别,语言学,发音,词汇,语音,语料库,声学模型 数据概述:...
    packageimg
  • 邮件文本内容分析数据集

    2025年9月26日   

    邮件文本内容分析数据集_Email_Text_Content_Analysis 数据来源:互联网公开数据 标签:邮件内容, 文本分析, 自然语言处理, 文本挖掘, 数据清洗, 信息提取, 邮件安全, 语料库 数据概述: 该数据集包含来自邮件文本的数据,记录了邮件的原始内容。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料库。...
    packageimg
  • 图书文本语料库预训练数据集

    2025年9月25日   

    图书文本语料库预训练数据集_Book_Text_Corpus_Pre_training_Dataset 数据来源:互联网公开数据 标签:文本预训练, 自然语言处理, 语料库, 文本数据, BERT, 对比学习, 语言模型, 机器学习 数据概述: 该数据集包含从书籍文本中提取的语料,记录了用于自然语言处理模型预训练的文本内容。主要特征如下:...
    packageimg
  • 生物医学文献摘要生成数据集

    2025年9月23日   

    生物医学文献摘要生成数据集_Biomedical_Literature_Abstract_Generation_Dataset 数据来源:互联网公开数据 标签:生物医学, 文本摘要, 自然语言处理, 蛋白质相互作用, 机器翻译, 摘要生成, 深度学习, 语料库 数据概述:...
    packageimg
  • 学术论文写作结构要素识别数据集

    2025年9月18日   

    学术论文写作结构要素识别数据集_Academic_Paper_Writing_Structure_Elements_Recognition 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 论文写作, 结构识别, 文本标注, 机器学习, 深度学习, 语料库 数据概述:...
    packageimg
  • 二战原子弹项目文本数据集

    2025年9月21日   

    二战原子弹项目文本数据集_World_War_II_Atomic_Bomb_Project_Text_Dataset 数据来源:互联网公开数据 标签:曼哈顿计划, 原子弹, 二战, 历史事件, 文本分析, 语料库, 自然语言处理, 历史研究 数据概述:...
    packageimg
  • 多源知识问答推理数据集

    2025年9月18日   

    多源知识问答推理数据集_Multi_source_Knowledge_Question_Answering_Reasoning_Dataset 数据来源:互联网公开数据 标签:问答系统, 知识推理, 自然语言处理, 多选题, 文本理解, 机器学习, 数据集构建, 语料库 数据概述:...
    packageimg
  • 开源聊天对话Ubuntu系统数据集

    2025年9月18日   

    开源聊天对话Ubuntu系统数据集_Open_Source_Chat_Dialogue_Ubuntu_System_Dataset 数据来源:互联网公开数据 标签:聊天对话, Ubuntu, 开源, 自然语言处理, 文本数据, 对话分析, 机器学习, 语料库 数据概述:...
    packageimg
  • 自然语言处理训练情感分析数据集

    2025年9月16日   

    自然语言处理训练情感分析数据集_Natural_Language_Processing_Sentiment_Analysis_Training_Data 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感标注, 深度学习, 语料库, 情感极性 数据概述:...
    packageimg
  • 代码文档与文本匹配数据集

    2025年9月11日   

    代码文档与文本匹配数据集_Code_Documentation_and_Text_Matching_Dataset 数据来源:互联网公开数据 标签:代码文档, 文本匹配, 自然语言处理, 数据标注, 机器学习, 代码分析, 知识检索, 语料库 数据概述:...
    packageimg
  • 俄语语音情感分析数据集

    2025年9月8日   

    俄语语音情感分析数据集_Russian_Speech_Emotion_Analysis_Dataset 数据来源:互联网公开数据 标签:语音识别, 情感分析, 俄语, 文本分析, 深度学习, CNN-LSTM模型, 语料库, 音频处理 数据概述: 该数据集包含来自公共广播和演讲的俄语语音数据,记录了语音片段及其对应的情感倾向。主要特征如下:...
    packageimg
  • 文本生成训练数据集

    2025年9月5日   

    文本生成训练数据集_Text_Generation_Training_Dataset 数据来源:互联网公开数据 标签:文本生成, 机器翻译, 自然语言处理, 深度学习, 文本校正, 语料库, 模型训练, 数据集 数据概述:...
    packageimg
  • 学术论文写作结构预测数据集

    2025年9月3日   

    学术论文写作结构预测数据集_Academic_Paper_Structure_Prediction_Dataset 数据来源:互联网公开数据 标签:文本分析, 论文结构, 自然语言处理, 结构预测, 文本分类, 深度学习, 语料库, 模型训练 数据概述: 该数据集包含从学术论文中提取的结构化数据,用于训练和评估文本结构预测模型。主要特征如下:...
    packageimg
  • 文学作品文本分类数据集

    2025年9月2日   

    文学作品文本分类数据集_Literary_Works_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 情感分析, 多标签分类, 文学作品, 摘要分析, 机器学习, 语料库 数据概述: 该数据集包含来自文学作品的文本数据,记录了不同作品的标题、流派、摘要及其对应的分类标签。主要特征如下:...
    packageimg
  • 越南语文本语义相似度数据集

    2025年8月30日   

    越南语文本语义相似度数据集_Vietnamese_Text_Semantic_Similarity_Dataset 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 自然语言处理, 越南语, 文本数据, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自越南语文本的多种类型数据,主要用于训练和评估语义相似度模型。主要特征如下:...
    packageimg
  • 中文维基百科2019年文本数据集

    2025年8月25日   

    中文维基百科2019年文本数据集_Chinese_Wikipedia_2019_Text_Dataset 数据来源:互联网公开数据 标签:维基百科, 中文, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 知识图谱 数据概述: 该数据集包含来自2019年中文维基百科的文本数据,记录了维基百科上各种主题的中文文章内容。主要特征如下:...
    packageimg
  • 社交媒体评论文本预处理数据集

    2025年8月21日   

    社交媒体评论文本预处理数据集_Social_Media_Comment_Text_Preprocessed_Dataset 数据来源:互联网公开数据 标签:文本预处理, 社交媒体, 评论分析, 自然语言处理, 文本挖掘, 数据清洗, 情感分析, 语料库 数据概述:...
    packageimg
  • 学术论文写作结构要素识别预测数据集

    2025年8月17日   

    学术论文写作结构要素识别预测数据集_Academic_Paper_Writing_Structure_Element_Recognition_Prediction 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 论文写作, 结构分析, 机器学习, BERT模型, 语料库, 数据标注 数据概述:...
    packageimg
  • 越南语文本情感分析数据集

    2025年8月13日   

    越南语文本情感分析数据集_Vietnamese_Text_Sentiment_Analysis_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 越南语, 机器学习, 情感极性, 数据集, 语料库 数据概述: 该数据集包含来自互联网的越南语文本数据,记录了用于情感分析的文本内容及其对应的情感标签。主要特征如下:...
    packageimg