-
AI4D_Based法语至丰贝埃维神经机器翻译平行文本数据集
2026年1月29日 30 210 51
数据集概述 本数据集是面向神经机器翻译任务的多语言平行文本集合,包含从法语到丰贝语(多哥语言)、法语到埃维语(贝宁语言)的平行句子对,总计七万余条标注数据,适用于机器翻译和句子分类任务,由AI4D倡议贡献。 文件详解 文件名称:French_to_fongbe.csv 文件格式:CSV...
-
ACL_cite_Based_学术句子引用价值预测标注数据集
2026年1月29日 30 122 94
数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...
-
Cross_Domain_Propaganda_Detection_印度社交媒体CAA抗议活动宣传检测数据集
2025年12月29日 30 115 111
数据集概述 本数据集聚焦印度2019年CAA抗议活动相关的社交媒体内容,包含464篇新闻文章(按句子分类为宣传或非宣传)和597条手动标注18种宣传技术的推文,用于跨域宣传检测任务,为相关研究提供结构化标注数据。 文件详解 文件名称:Dataset.zip 文件格式:ZIP...
-
海明威_老人与海_中的多成分复合句分析文档
2025年12月11日 30 12 10
数据集概述 该数据集为一份PDF文档,核心内容是对海明威小说《老人与海》中多成分复合句的语言学分析,聚焦句子结构特征与文学表达的关联。 文件详解 文件名称: A.A.Latibjonov.pdf 文件格式: PDF 内容说明: 文档围绕海明威《老人与海》中的多成分复合句展开分析,可能包含句子结构分类、语法特征提取、文学功能解读等内容 适用场景...
-
虚假新闻标题与句子分类数据集FakeNewsTitlesandSentencesClassificationDataset-luizfkcunhautfpr
2025年4月29日 30 33 16
虚假新闻标题与句子分类数据集FakeNewsTitlesandSentencesClassificationDataset-luizfkcunhautfpr 数据来源:互联网公开数据 标签:虚假新闻, 标题分类, 句子分类, 文本分析, 情感分析, 机器学习, 自然语言处理, 语料库 数据概述:...
-
句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05
2025年4月24日 30 53 28
句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05 数据来源:互联网公开数据 标签:自然语言处理,句法分析,数据集,文本分类,机器学习,语言学研究,人工智能,教育技术 数据概述:...
-
句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista
2025年4月24日 30 22 11
句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,语言模型,数据分析,人工智能,教育技术 数据概述:...
-
福特职位描述句子分类数据集-2023年-gaveshjain
2025年4月23日 30 64 48
福特职位描述句子分类数据集-2023年-gaveshjain 数据来源:互联网公开数据 标签:职位描述,句子分类,招聘,CRM,机器学习,技能评分,匹配评分 数据概述:...
-
问答句分类数据集-SQuAD与SPAADIA融合数据集-shahrukhkhan
2025年4月21日 30 150 138
问答句分类数据集-SQuAD与SPAADIA融合数据集-shahrukhkhan 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问答,句子类型,SQuAD,SPAADIA,语句,疑问句 数据概述: 本数据集旨在对句子进行分类,区分其类型为:陈述句(声明句)或疑问句(提问句)。数据集由SQuAD数据集和SPAADIA数据集解析并融合而成。...
-
英语时态分类数据集
2025年4月15日 30 134 30
英语时态分类数据集 数据来源:互联网公开数据 标签:英语时态,自然语言处理,机器学习,句子分类,语法分析 数据概述: 本数据集包含标注了相应时态类别的英文句子,适用于自然语言处理(NLP)和机器学习项目中的时态分类任务。每个条目包括一个句子及其对应的时态数值标签,覆盖了多种时态类型,为研究和开发提供了丰富的数据资源。 数据用途概述:...
-
跨语言文本蕴含关系分类数据集
2025年4月14日 30 72 0
跨语言文本蕴含关系分类数据集 数据来源:互联网公开数据 标签:自然语言处理,跨语言分析,文本蕴含,机器学习,句子分类,逻辑推理,多语言支持 数据概述:...



