-
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation... -
讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad
讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本分类,语言模型,人工智能,文本挖掘 数据概述: 该数据集专注于包含讽刺语气的文本数据,记录了不同来源的文本内容,适用于讽刺文本识别和情感分析等任务。主要特征如下:... -
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:... -
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:... -
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi
PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:嵌入向量,数据集,自然语言处理,机器学习,文本分析,深度学习,语言模型,语义理解 数据概述:该数据集包含来自PSPV5C模型的嵌入向量数据,记录了大量文本数据的语义表示。主要特征如下:... -
大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13
大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,人工智能,语言模型,模型微调 数据概述: 该数据集专注于大型语言模型(Large Language Model,... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 文本摘要, 语言模型, 数据集 数据概述: 该数据集包含来自阿拉伯语新闻文章及其对应的摘要。主要特征如下:... -
大规模语言模型超反馈平衡数据集LMSYSUltraFeedbackDataset-Balanced-sethmoudry
大规模语言模型超反馈平衡数据集LMSYSUltraFeedbackDataset-Balanced-sethmoudry 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,模型训练,情感分析,文本分类,人工智能 数据概述:... -
写作质量评估论文数据集EssayQualityAssessmentEssays-laurensprast
写作质量评估论文数据集EssayQualityAssessmentEssays-laurensprast 数据来源:互联网公开数据 标签:写作评估, 文本分析, 情感分析, 论文写作, 语言模型, 机器学习, 文本分类, 写作技巧 数据概述: 该数据集包含来自多个来源的英文论文,记录了不同来源的论文文本及其对应的质量标签。主要特征如下:... -
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie 数据来源:互联网公开数据 标签:语言校对, 文本处理, 词汇纠错, 语法检查, 自然语言处理, 语言模型, 词典, 数据集 数据概述:... -
越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree
越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 语料库, 信息检索, 语言模型, 数据集 数据概述: 该数据集包含来自越南语问答系统的数据,记录了越南语问题及其对应的标识符。主要特征如下:... -
文本可读性评估训练数据集TextReadabilityAssessmentTrainingDataset-siminrao
文本可读性评估训练数据集TextReadabilityAssessmentTrainingDataset-siminrao 数据来源:互联网公开数据 标签:文本可读性, 自然语言处理, 文本分析, 机器学习, 文本难度, 语言模型, 数据集, 训练数据 数据概述:... -
越南语自然语言处理NLP数据集-minhhieuhuynh
越南语自然语言处理NLP数据集-minhhieuhuynh 数据来源:互联网公开数据 标签:自然语言处理,越南语,文本分析,机器翻译,情感分析,数据集,语言模型,文本挖掘 数据概述: 该数据集包含来自越南语文本的数据,用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体子数据集,可能涵盖多年。... -
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:... -
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,机器翻译,情感分析,语言模型,韩国语 数据概述: 该数据集包含来自世宗人工智能挑战赛的竞赛数据,主要涉及韩国语的文本处理任务。主要特征如下: 时间跨度:数据记录的时间范围为挑战赛期间。... -
基尼亚卢旺达语预训练与微调数据集-kclaude
基尼亚卢旺达语预训练与微调数据集-kclaude 数据来源:互联网公开数据 标签:基尼亚卢旺达语,自然语言处理,数据集,预训练,微调,语言模型,文本数据,非洲语言 数据概述: 该数据集包含了用于基尼亚卢旺达语自然语言处理任务的预训练和微调数据。主要特征如下: 时间跨度:数据记录的时间范围没有明确限制,数据集持续更新,涵盖不同时期的文本资料。... -
阿拉伯语新闻真伪识别数据集ArabicNewsCredibilityAssessment-nahlayasmine
阿拉伯语新闻真伪识别数据集ArabicNewsCredibilityAssessment-nahlayasmine 数据来源:互联网公开数据 标签:新闻真伪, 阿拉伯语, 文本分类, 自然语言处理, 政治新闻, 舆情分析, 机器学习, 语言模型 数据概述:... -
新闻摘要生成深度学习数据集NewsSummarizationDatasetforDeepLearning-luisllll
新闻摘要生成深度学习数据集NewsSummarizationDatasetforDeepLearning-luisllll 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,深度学习,文本生成,机器学习,语言模型,人工智能 数据概述:该数据集包含来自多个新闻平台的新闻文章及其对应的摘要,记录了新闻内容的文本信息和精简摘要。主要特征如下:... -
教育领域学生写作质量评估数据集EducationStudentWritingQualityAssessment-jay12332
教育领域学生写作质量评估数据集EducationStudentWritingQualityAssessment-jay12332 数据来源:互联网公开数据 标签:文本分析, 写作评估, 机器学习, 自然语言处理, 教育, 情感分析, 文本分类, 语言模型 数据概述:... -
大型新闻语料库数据集GigawordCorpusDataset-arngowda
大型新闻语料库数据集GigawordCorpusDataset-arngowda 数据来源:互联网公开数据 标签:新闻语料,数据集,自然语言处理,文本分析,机器学习,语言模型,人工智能,信息提取 数据概述: 该数据集包含来自全球各大新闻机构的新闻报道文本,记录了海量新闻文章的全文内容。主要特征如下:...