找到639个数据集

分类: 互联网数据 标签: 机器翻译

过滤结果
  • 文本改写与生成数据集

    2025年7月16日 30 23 9

    文本改写与生成数据集_Text_Rewriting_and_Generation_Dataset 数据来源:互联网公开数据 标签:文本生成, 文本改写, 自然语言处理, 机器翻译, 语料库, 深度学习, 提示工程, 案例分析 数据概述: 该数据集包含文本改写和生成的数据,记录了原始文本、改写提示、改写后的文本以及相关信息。主要特征如下:...
    packageimg
  • 多语言问答预测结果数据集

    2025年7月12日 30 12 3

    多语言问答预测结果数据集_Multilingual_Question_Answering_Prediction_Results 数据来源:互联网公开数据 标签:问答系统, 机器翻译, 自然语言处理, 文本分析, 预测结果, 相似度计算, 多语言, 机器学习 数据概述:...
    packageimg
  • 爱尔兰语_英语平行语料库数据集

    2025年7月10日 30 14 9

    爱尔兰语_英语平行语料库数据集_Irish_English_Parallel_Corpus 数据来源:互联网公开数据 标签:机器翻译, 语言学, 平行语料库, 爱尔兰语, 英语, 自然语言处理, 文本翻译, 数据集构建 数据概述: 该数据集包含来自多个来源的爱尔兰语-英语平行语料,旨在促进爱尔兰语和英语之间的机器翻译研究与应用。主要特征如下:...
    packageimg
  • Transformer模型训练与测试数据集

    2025年7月9日 30 10 4

    Transformer模型训练与测试数据集_Transformer_Model_Training_and_Testing_Dataset 数据来源:互联网公开数据 标签:Transformer, 深度学习, 自然语言处理, 模型训练, 预训练模型, 文本生成, 机器翻译, 代码库 数据概述:...
    packageimg
  • 文本摘要生成数据集

    2025年7月8日 30 21 1

    文本摘要生成数据集_Text_Summarization_Generation_Dataset 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 数据集构建, 语料分析, 对话生成 数据概述: 该数据集包含用于文本摘要生成的语料,记录了原始文本与对应的摘要。主要特征如下:...
    packageimg
  • 相机使用手册生成文本真伪检测数据集

    2025年7月7日 30 16 9

    相机使用手册生成文本真伪检测数据集_Camera_Manual_Text_Generation_Verification 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 机器翻译, 文本分类, 真伪检测, 对抗样本, 数据清洗, 深度学习 数据概述: 该数据集包含相机用户手册相关文本,记录了原始文本及其对应的生成文本。主要特征如下:...
    packageimg
  • 多语言指令微调问答数据集

    2025年7月7日 30 22 7

    多语言指令微调问答数据集_Multilingual_Instruction_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 多语言, 指令微调, 机器翻译, 文本生成, 模型训练, 大语言模型 数据概述:...
    packageimg
  • 多语言维基百科评论毒性分析数据集

    2025年7月5日 30 22 9

    多语言维基百科评论毒性分析数据集_Multilingual_Wikipedia_Comments_Toxicity_Analysis 数据来源:互联网公开数据 标签:毒性检测, 多语言, 文本分类, 自然语言处理, 机器学习, 评论分析, 情感分析, 机器翻译 数据概述:...
    packageimg
  • 自然语言处理长文本序列数据集

    2025年6月29日 30 27 7

    自然语言处理长文本序列数据集_Natural_Language_Processing_Long_Text_Sequence_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 长文本, 序列数据, 文本编码, 深度学习, 机器翻译, 文本生成, 模型训练 数据概述:...
    packageimg
  • 文本向量化词嵌入矩阵数据集_Text_Vectorization_Word_Embedding_Matrix

    2025年6月28日 30 18 3

    文本向量化词嵌入矩阵数据集_Text_Vectorization_Word_Embedding_Matrix 数据来源:互联网公开数据 标签:词嵌入, 文本向量化, 自然语言处理, 深度学习, 机器翻译, 文本分析, 词汇表, 嵌入矩阵 数据概述: 该数据集包含用于自然语言处理任务的词嵌入矩阵和词汇索引信息。主要特征如下:...
    packageimg
  • 机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison

    2025年6月24日 30 21 10

    机器翻译模型生成文本对比数据集_Machine_Translation_Model_Generated_Text_Comparison 数据来源:互联网公开数据 标签:机器翻译, 文本生成, 语言模型, 文本对比, 模型评估, 自然语言处理, 文本校对, 对比分析 数据概述:...
    packageimg
  • 欧洲议会议事录说话者性别与年龄注释数据集

    2025年6月4日 30 17 4

    欧洲议会议事录说话者性别与年龄注释数据集 数据来源:互联网公开数据 标签:欧洲议会,说话者属性,性别,年龄,机器翻译,个性化翻译,平行语料库,自然语言处理 数据概述: 本数据集是对欧洲议会议事录的注释版本,标注了说话者的性别和年龄信息,注释粒度为句子级别。数据集包含英语-法语和英语-德语两个平行语料库,为研究个性化机器翻译提供了高质量的数据基础。...
    packageimg
  • 越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi

    2025年6月4日 30 19 7

    越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi 数据来源:互联网公开数据 标签:图表问答,越南语,图像理解,自然语言处理,机器翻译,数据集,多模态,人工智能,ChartQA,Viet-ShareGPT-4o-Text-VQA 数据概述:...
    packageimg
  • 圣经多语言平行语料库

    2025年5月31日 30 30 7

    圣经多语言平行语料库 数据来源:互联网公开数据 标签:多语言,平行语料库,圣经翻译,语言对比,机器翻译,语言学研究,跨文化交流 数据概述: 本数据集是一个多语言平行语料库,由Christos Christodoulopoulos和Mark...
    packageimg
  • 孟加拉语机器翻译数据集

    2025年5月31日 30 12 6

    孟加拉语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,孟加拉语,英文,自然语言处理,双语数据,文本分析,语言模型,翻译模型 数据概述:...
    packageimg
  • 宇宙学论文摘要生成数据集CosmologyPaperAbstractGeneration-mridul3301

    2025年5月31日 30 29 4

    宇宙学论文摘要生成数据集CosmologyPaperAbstractGeneration-mridul3301 数据来源:互联网公开数据 标签:宇宙学, 论文摘要, 文本生成, 自然语言处理, 机器翻译, 深度学习, 学术研究, 数据集 数据概述: 该数据集包含来自宇宙学领域学术论文的文本数据,用于训练和评估摘要生成模型。主要特征如下:...
    packageimg
  • 多语言平行文本翻译质量评估数据集MultilingualParallelTextTranslationQualityAssessment-danghoan...

    2025年5月31日 30 17 3

    多语言平行文本翻译质量评估数据集MultilingualParallelTextTranslationQualityAssessment-danghoangthai1507 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 质量评估, 语料库, 翻译质量, 自然语言处理, 文本对齐, 深度学习 数据概述:...
    packageimg
  • 国际新闻文本分类数据集InternationalNewsTextClassificationDataset-bahodirmaydonov

    2025年5月31日 30 18 10

    国际新闻文本分类数据集InternationalNewsTextClassificationDataset-bahodirmaydonov 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 国际新闻, 自然语言处理, 乌克兰冲突, 地缘政治, 情感分析, 机器翻译 数据概述:...
    packageimg
  • 老挝语-越南语机器翻译语料库越南语文本数据集-zuydang

    2025年5月31日 30 25 4

    老挝语-越南语机器翻译语料库越南语文本数据集-zuydang 数据来源:互联网公开数据 标签:机器翻译,语料库,老挝语,越南语,文本,语言学,自然语言处理,ALT 数据概述: 本数据集是从ALT(亚洲语言技术)项目中提取的老挝语-...
    packageimg
  • 文本摘要生成语料数据集TextSummarizationCorpus-rutamrisaldar

    2025年5月31日 30 17 3

    文本摘要生成语料数据集TextSummarizationCorpus-rutamrisaldar 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语料库, 文本分析, 机器翻译, 深度学习, 文本生成, 数据集 数据概述: 该数据集包含来自多个来源的文本数据,记录了用于文本摘要任务的语料。主要特征如下:...
    packageimg