-
西班牙国会发言标点检测数据集
西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1.... -
CrowS-Pairs社会偏见评估挑战数据集-thedevastator
CrowS-Pairs社会偏见评估挑战数据集-thedevastator 数据来源:互联网公开数据 标签:社会偏见,MLM,语言模型,机器学习,数据集,教育,研究,公平性 数据概述: CrowS-... -
组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet
组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:... -
问答数据集QuestionAnsweringDataset-namphmquang
问答数据集QuestionAnsweringDataset-namphmquang 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,语言模型,知识库,信息检索,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
维基百科句子数据集WikiSentencesV2-ranjitp20
维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:... -
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:... -
自然语言处理数据集NLP数据集-mkmanoj353
自然语言处理数据集NLP数据集-mkmanoj353 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述:该数据集包含来自多个来源的自然语言处理数据,记录了大量文本数据以支持各种NLP任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
文本分析工具数据集TextAnalysisToolDataset-jaynadkarni
文本分析工具数据集TextAnalysisToolDataset-jaynadkarni 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,语言模型,数据科学 数据概述: 该数据集包含来自多个公开来源的文本数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。... -
孟加拉语维基百科文本数据集
孟加拉语维基百科文本数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,机器学习,语言模型,文本挖掘 数据概述:... -
大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen
大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,上下文理解,文本分析,机器学习,人工智能,语义分析 数据概述:... -
常识评估数据集CommonSenseEvaluationData-hassam361
常识评估数据集CommonSenseEvaluationData-hassam361 数据来源:互联网公开数据 标签:常识推理,自然语言处理,数据集,文本理解,人工智能,语义分析,知识图谱,语言模型 数据概述: 该数据集包含用于评估常识推理能力的数据,旨在测试模型在理解和应用常识方面的表现。主要特征如下:... -
自然语言处理示例数据集NLPSampleData-fishercht
自然语言处理示例数据集NLPSampleData-fishercht 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,文本挖掘,语言模型,情感分析,语料库 数据概述: 该数据集包含多种用于自然语言处理任务的示例数据,旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下:... -
性别中立与包容性文本数据集-pravinkalse
性别中立与包容性文本数据集-pravinkalse 数据来源:互联网公开数据 标签:性别中立,包容性,文本分析,自然语言处理,社会科学,语言模型,数据集,文本生成 数据概述: 该数据集包含来自互联网的文本数据,旨在促进对性别中立和包容性语言的研究与应用。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的文本。... -
问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat
问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,命令识别,问题分析,语言模型,智能问答 数据概述:... -
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:... -
CommonLit阅读理解文本摘要数据集-shinomoriaoshi
CommonLit阅读理解文本摘要数据集-shinomoriaoshi 数据来源:互联网公开数据 标签:阅读理解,文本摘要,自然语言处理,机器学习,教育,数据集,文本分析,语言模型 数据概述:该数据集包含来自CommonLit网站的阅读理解文章及其对应的文本摘要。主要特征如下:... -
对话摘要生成数据集DialogSummarizationDataset-sukalp1899
对话摘要生成数据集DialogSummarizationDataset-sukalp1899 数据来源:互联网公开数据 标签:对话摘要,数据集,自然语言处理,机器学习,文本分析,人工智能,语言模型,对话系统 数据概述:该数据集包含来自多个来源的对话记录及其对应的摘要,适用于对话摘要生成任务。主要特征如下:... -
BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad
BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分析,深度学习,语言模型,AI研究,文本分类 数据概述:该数据集包含通过BERT模型处理后的文本数据结果,记录了BERT模型对输入文本的分析和处理输出。主要特征如下:... -
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips
PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips 数据来源:互联网公开数据 标签:自然语言处理,文本增强,数据集,机器学习,深度学习,文本挖掘,语言模型,信息检索 数据概述:... -
GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek
GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,模型评估,语言模型,深度学习,算法研究 数据概述:...