-
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431 数据来源:互联网公开数据 标签:文本转录, 多语言, 印度语言, 机器翻译, 自然语言处理, 语料库, 语言学, 深度学习 数据概述:... -
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007 数据来源:互联网公开数据 标签:跨语言, 文本理解, 多任务学习, 机器翻译, 文本分类, 问答系统, 数据集, 自然语言处理 数据概述:... -
英语语法纠错对比数据集EnglishGrammarErrorCorrectionComparison-austuvarki
英语语法纠错对比数据集EnglishGrammarErrorCorrectionComparison-austuvarki 数据来源:互联网公开数据 标签:语法纠错, 文本校对, 语言模型, 自然语言处理, 机器翻译, 数据增强, 错误检测, 文本生成 数据概述:... -
天体物理文本摘要生成数据集AstrophysicsTextSummarizationDataset-mridul3301
天体物理文本摘要生成数据集AstrophysicsTextSummarizationDataset-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 天体物理, 自然语言处理, 深度学习, 论文摘要, 机器翻译, 摘要生成, 数据集构建 数据概述:... -
微软大规模多模态多语言模型升级数据集5ms-upgradeDataset-danicoronado00
微软大规模多模态多语言模型升级数据集5ms-upgradeDataset-danicoronado00 数据来源:互联网公开数据 标签:多模态,多语言,数据集,图像理解,文本生成,机器翻译,人工智能,深度学习 数据概述: 该数据集旨在提升微软大规模多模态多语言模型(5ms)的性能,涵盖了多种模态的数据和多种语言的文本。主要特征如下:... -
印度新闻摘要与文章文本数据集IndiaNewsSummaryandArticleText-aryanringshia
印度新闻摘要与文章文本数据集IndiaNewsSummaryandArticleText-aryanringshia 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 印度新闻, 文本摘要, 语义理解, 机器翻译, 印度文化 数据概述: 该数据集包含来自印度新闻网站的文章及其对应的摘要。主要特征如下:... -
文本检索与自然语言处理Zalo数据集TextRetrievalandNLPZaloDataset2021-anhbuivuongtam
文本检索与自然语言处理Zalo数据集TextRetrievalandNLPZaloDataset2021-anhbuivuongtam 数据来源:互联网公开数据 标签:文本检索, 自然语言处理, 机器学习, 深度学习, 语料库, 文本分类, 机器翻译, 数据集 数据概述:... -
英语-印地语新闻摘要数据集English-HindiNewsSummaryDataset-prajwal600
英语-印地语新闻摘要数据集English-HindiNewsSummaryDataset-prajwal600 数据来源:互联网公开数据 标签:新闻摘要, 机器翻译, 文本摘要, 多语言, 文本分析, 自然语言处理, 英语, 印地语 数据概述: 该数据集包含来自新闻报道的英语和印地语摘要,记录了不同新闻内容的中英双语摘要信息。主要特征如下:... -
法律文本摘要生成数据集LegalTextSummarization-shurahbeelpeerzada
法律文本摘要生成数据集LegalTextSummarization-shurahbeelpeerzada 数据来源:互联网公开数据 标签:文本摘要, 法律文本, 自然语言处理, 文本生成, 机器翻译, 深度学习, 数据集, 法律 数据概述: 该数据集包含来自美国法律文件的数据,记录了法律条文的原文和对应的摘要。主要特征如下:... -
探索金星危险性分析文本数据集VenusExplorationDangerAnalysisTextData-mehrotraaditya
探索金星危险性分析文本数据集VenusExplorationDangerAnalysisTextData-mehrotraaditya 数据来源:互联网公开数据 标签:金星探索, 文本分析, 科学研究, 地理学, 危险评估, 文本向量化, 机器翻译, 宇宙探索 数据概述:... -
骨骼解剖与问答数据集SkeletalAnatomyQuestionAnsweringDataset-gokulkarthik
骨骼解剖与问答数据集SkeletalAnatomyQuestionAnsweringDataset-gokulkarthik 数据来源:互联网公开数据 标签:解剖学, 问答系统, 文本生成, 机器翻译, 知识图谱, 自然语言处理, 多语言, 数据集 数据概述:... -
CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych
CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,机器翻译,数据集,文本分析,NLP 数据概述: 该数据集包含来自CNN新闻的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了新闻发布的时间段,具体时间范围未明确。... -
科技进步对人类生活影响分析数据集TechnologyImpactonHumanLifeAnalysisDataset-umgeeyo
科技进步对人类生活影响分析数据集TechnologyImpactonHumanLifeAnalysisDataset-umgeeyo 数据来源:互联网公开数据 标签:科技, 人工智能, 文本分析, 情感分析, 机器翻译, 论文写作, 教育, 社会影响 数据概述:... -
数据3000本翻译成俄语的书籍数据集-dmitrybarsu
3000本翻译成俄语的书籍数据集-dmitrybarsu 数据来源:互联网公开数据 标签:书籍,翻译,俄语,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含3000本已翻译成俄语的书籍文本,涵盖了多种主题和文学体裁。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同年代的翻译作品。... -
印地语-英语新闻摘要数据集MediaSumHindi-EnglishDataset-gautamil
印地语-英语新闻摘要数据集MediaSumHindi-EnglishDataset-gautamil 数据来源:互联网公开数据 标签:新闻摘要,多语言,印地语,英语,自然语言处理,机器翻译,文本摘要,数据集 数据概述: 该数据集包含来自MediaSum项目的新闻摘要数据,主要记录了印地语和英语新闻文章及其对应的摘要。主要特征如下:... -
文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg
文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg 数据来源:互联网公开数据 标签:文本生成, 对话系统, 语料库, 自然语言处理, 文本摘要, 机器翻译, 语言模型, 数据集 数据概述: 该数据集包含多个CSV文件,记录了用于文本生成和对话系统训练的语料。主要特征如下:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 语言模型, 文本校对, 数据清洗, 机器翻译, 拼写纠错 数据概述: 该数据集包含越南语文本的错误文本及其对应的正确文本,用于越南语文本的纠错任务。主要特征如下:... -
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy
机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy 数据来源:互联网公开数据 标签:机器翻译, 越南语, 英语, 平行语料库, 自然语言处理, 文本翻译, 数据集, 语言学 数据概述: 该数据集包含越南语-...