-
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi 数据来源:互联网公开数据 标签:孟加拉语, 文本转换, 语言模型, 机器翻译, 自然语言处理, 数据集, 文本分析, 句子生成 数据概述:... -
Transformer初始模型子集数据集-tatsumicrub
Transformer初始模型子集数据集-tatsumicrub 数据来源:互联网公开数据 标签:Transformer,自然语言处理,数据集,模型训练,文本生成,机器翻译,语言模型,深度学习 数据概述: 该数据集包含用于Transformer初始模型训练和评估的文本数据子集。主要特征如下:... -
LLM文本重写数据集LLMTextRewritingDataset-adrienriaux
LLM文本重写数据集LLMTextRewritingDataset-adrienriaux 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 文本重写, 提示工程, 机器学习, 数据标注, 文本转换, 语言模型 数据概述: 该数据集包含来自文本重写任务的数据,记录了使用大型语言模型(LLM)对原始文本进行重写的结果。主要特征如下:... -
Medium文章内容预测数据集Next-Sents-base-on-Medium-ArticlesDataset-terrychanorg
Medium文章内容预测数据集Next-Sents-base-on-Medium-ArticlesDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,内容预测,文章续写,深度学习 数据概述:... -
多语言数据集Multy-LangDatasets-embarkiomar
多语言数据集Multy-LangDatasets-embarkiomar 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分类,语言模型,人工智能,计算机科学 数据概述: 该数据集包含来自多个语言的数据,记录了不同语言之间的文本对齐和文本分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
写作评估与提示数据集WritingAssessment-PromptsDataset-giovanniiannuzzi
写作评估与提示数据集WritingAssessment-PromptsDataset-giovanniiannuzzi 数据来源:互联网公开数据 标签:写作评估, 文本生成, 论文写作, 自然语言处理, 文本分析, 语言模型, 创作提示, 写作辅助 数据概述: 该数据集包含用于写作评估与提示的数据,记录了学生写作的文本以及对应的写作提示。主要特征如下:... -
语言模型偏好对比评测数据集LanguageModelPreferenceComparisonEvaluationDataset-mbaiornommbaihodji
语言模型偏好对比评测数据集LanguageModelPreferenceComparisonEvaluationDataset-mbaiornommbaihodji 数据来源:互联网公开数据 标签:语言模型, 对比评测, 自然语言处理, 文本生成, 模型评估, 偏好排序, 人工智能, 文本分析 数据概述:... -
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 问答系统, 孟加拉语, 对比学习, 文本生成, 语言模型, 数据集 数据概述: 该数据集包含用于训练和评估孟加拉语指令问答模型的结构化数据。主要特征如下:... -
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan
孟加拉语文本语料库数据集BengaliTextCorpusDataset-mdshahriarkhan 数据来源:互联网公开数据 标签:孟加拉语, 文本语料库, 自然语言处理, 文本分析, 语言模型, 文本挖掘, 语料库构建, 文本数据 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种来源的孟加拉语文本片段。主要特征如下:... -
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 词性标注, 语言模型, 语料库, 机器学习 数据概述:... -
土耳其新闻文本分析数据集TurkishNewsTextAnalysisDataset-ahmetelgn
土耳其新闻文本分析数据集TurkishNewsTextAnalysisDataset-ahmetelgn 数据来源:互联网公开数据 标签:新闻文本, 土耳其, 文本分析, 自然语言处理, 时序分析, 舆情分析, 政治新闻, 语言模型 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityEvaluation-tianyihuang0224
英语写作质量评估数据集EnglishWritingQualityEvaluation-tianyihuang0224 数据来源:互联网公开数据 标签:英语写作, 文本评估, 语言模型, 语法分析, 文本分析, 写作质量, 自动评分, 自然语言处理 数据概述: 该数据集包含用于评估英语写作质量的结构化数据,记录了不同文本的多个维度评估分数。主要特征如下:... -
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung
尼泊尔语-英语机器翻译训练数据集Nepali-EnglishMachineTranslationTrainingDataset-prashimagurung 数据来源:互联网公开数据 标签:机器翻译, 尼泊尔语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 数据集 数据概述: 该数据集包含来自多种来源的尼泊尔语-... -
孟加拉语语音识别数据集BengaliSpeechRecognitionDataset-ttahara
孟加拉语语音识别数据集BengaliSpeechRecognitionDataset-ttahara 数据来源:互联网公开数据 标签:语音识别,孟加拉语,数据集,深度学习,自然语言处理,声学模型,语言模型,语音信号处理 数据概述: 该数据集包含孟加拉语语音数据,主要用于语音识别模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围为未知。... -
英法平行语料库翻译数据集English-FrenchParallelCorpusTranslationDataset-phrasy
英法平行语料库翻译数据集English-FrenchParallelCorpusTranslationDataset-phrasy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本翻译, 英法翻译, 数据集, 语言模型, 双语对照 数据概述: 该数据集包含英法双语平行语料,用于机器翻译模型的训练和评估。主要特征如下:... -
写作能力评估与生成文本分析数据集EssayWritingSkillAssessmentandGeneratedTextAnalysis-krishanup
写作能力评估与生成文本分析数据集EssayWritingSkillAssessmentandGeneratedTextAnalysis-krishanup 数据来源:互联网公开数据 标签:写作评估, 文本生成, 自然语言处理, 论文写作, 语言模型, 机器学习, 文本分析, 语料库 数据概述:... -
英文文本可读性评估训练数据集EnglishTextReadabilityAssessmentTrainingDataset-adiyev
英文文本可读性评估训练数据集EnglishTextReadabilityAssessmentTrainingDataset-adiyev 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本难度, 语言模型, 语料库, 教育 数据概述:... -
百万笑话数据集MillionJokesDataset-avneets2103
百万笑话数据集MillionJokesDataset-avneets2103 数据来源:互联网公开数据 标签:笑话,文本数据,自然语言处理,情感分析,语言模型,喜剧,幽默,娱乐 数据概述: 该数据集包含了来自互联网的大量笑话文本。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期收集的笑话。 地理范围:... -
阿拉伯新闻摘要数据集ArabicNewsSummarizationDataset-abdelbassetdjamai
阿拉伯新闻摘要数据集ArabicNewsSummarizationDataset-abdelbassetdjamai 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 文本分析, 自然语言处理, 机器翻译, 语料库, 语言模型 数据概述: 该数据集包含来自阿拉伯新闻报道的摘要信息,旨在为阿拉伯语文本摘要任务提供数据支持。主要特征如下:...