-
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan 数据来源:互联网公开数据 标签:文本嵌入,深度学习,自然语言处理,数据集,机器学习,人工智能,文本分析,语言模型 数据概述:该数据集包含来自CLIP(Contrastive Language-Image Pre-... -
阅读理解数据集ReadingComprehensionDatasets-parthplc
阅读理解数据集ReadingComprehensionDatasets-parthplc 数据来源:互联网公开数据 标签:阅读理解, 自然语言处理, 文本分析, 问答系统, 机器阅读, 文本挖掘, 数据集, 语言模型 数据概述: 该数据集包含来自多个公开阅读理解项目的数据,旨在评估和训练模型在理解文本、回答问题以及进行推理方面的能力。主要特征如下:... -
土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19
土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19 数据来源:互联网公开数据 标签:文本分类, 土耳其语, 语料库, 自然语言处理, 机器学习, 文本嵌入, 语言模型, 类别标注 数据概述: 该数据集包含来自不同来源的土耳其语文本,记录了用于文本分类任务的句子及对应的类别信息。主要特征如下:... -
机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku
机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku 数据来源:互联网公开数据 标签:机器翻译,反译,数据集,自然语言处理,深度学习,文本编码,语言模型,数据增强 数据概述:... -
思考队列标记化数据集ThinkqueTokenisedDataset-priyagulati
思考队列标记化数据集ThinkqueTokenisedDataset-priyagulati 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,数据处理,文本标记化,人工智能 数据概述: 该数据集包含来自“思考队列”项目的标记化文本数据,记录了文本内容的标记化处理结果。主要特征如下:... -
语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001
语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001 数据来源:互联网公开数据 标签:自然语言处理,NLP,推理,数据集,机器学习,文本分析,语言模型,人工智能 数据概述:... -
文本可读性评估数据集TextReadabilityAssessmentDataset-goldenlock
文本可读性评估数据集TextReadabilityAssessmentDataset-goldenlock 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本质量, 语言模型, 多维度评分, 情感分析 数据概述: 该数据集包含用于评估文本可读性的相关数据,主要用于训练和测试文本可读性评估模型。主要特征如下:... -
乌尔都语GPT对话数据集-laibaasmatullah
乌尔都语GPT对话数据集-laibaasmatullah 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,对话,GPT,语言模型,文本生成,数据集,人工智能 数据概述:该数据集包含基于GPT模型的乌尔都语对话数据,记录了用户与模型之间的交互内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,持续更新。... -
长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-sohammhatre112
长短期记忆网络情感分析数据集LSTMSentimentAnalysisDataset-sohammhatre112 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,深度学习,文本挖掘,情感计算,语言模型 数据概述: 该数据集包含来自网络公开平台的文本评论数据,记录了用户对不同产品或服务的情感倾向。主要特征如下:... -
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii 数据来源:互联网公开数据 标签:人工智能, 文本生成, 角色扮演, 语言模型, 文本分析, 数据标注, 机器学习, 自然语言处理 数据概述:... -
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:文本校对,拼写检查,自然语言处理,数据集,机器学习,语言模型,文本纠错,数据清洗 数据概述: 该数据集包含用于文本校对和拼写检查的文本数据,记录了包含拼写错误和对应正确拼写的文本对。主要特征如下:... -
人工智能领域引用语数据集VyomAIQuotesDataset-ajax0564
人工智能领域引用语数据集VyomAIQuotesDataset-ajax0564 数据来源:互联网公开数据 标签:人工智能,引用语,数据集,自然语言处理,文本分析,机器学习,语言模型,知识图谱 数据概述: 该数据集包含来自人工智能领域的重要引用语和言论,记录了行业专家、学者和从业者的观点和见解。主要特征如下:... -
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 印度语, 英语, Hinglish, 语料库, 语言模型 数据概述:... -
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler 数据来源:互联网公开数据 标签:自然语言处理,文本生成,机器学习,数据集,语言模型,序列到序列,文本重述,人工智能 数据概述:该数据集包含用于优化下一句生成和同义改写的文本数据,记录了成对的原始句子和优化后的改写句子。主要特征如下:... -
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:... -
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集 数据概述:... -
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal 数据来源:互联网公开数据 标签:论文作文,数据集,自然语言处理,机器学习,文本分析,教育研究,学术写作,语言模型 数据概述:该数据集包含来自不同学生和大型语言模型(LLM)生成的论文作文,记录了作文的文本内容和评估分数。主要特征如下:... -
垃圾文本与有意义指令数据集Gibberishvs-MeaningfulPromptwithLabelsDataset-circuitovertime
垃圾文本与有意义指令数据集Gibberishvs-MeaningfulPromptwithLabelsDataset-circuitovertime 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,文本分析,人工智能,语言模型,数据标注 数据概述:... -
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin
大型语言模型系统预处理数据集LMSYSPreprocessedDataset-a5hvin 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,语言模型,数据预处理,文本分析,人工智能 数据概述:...