-
维基百科页面数据集
维基百科页面数据集 数据来源:互联网公开数据 标签:维基百科,文本内容,自然语言处理,嵌入模型,信息检索,知识图谱,数据挖掘 数据概述: 本数据集基于Wikipedia页面内容构建,包含从原始竞赛数据集中提取的问答数据。数据集主要字段包括问题ID、维基百科页面建议、页面内容等。此外,数据集中还包含了通过Sentence-... -
维基百科关于谷歌的页面浏览量统计数据集-2023
维基百科关于谷歌的页面浏览量统计数据集-2023 数据来源:互联网公开数据 标签:维基百科,谷歌,页面浏览量,搜索,互联网,信息检索,数据分析,多语言 数据概述:... -
-
WikiQA开放域问答数据集-问题与句子对-开放域问答研究
WikiQA开放域问答数据集-问题与句子对-开放域问答研究 数据来源:互联网公开数据 标签:问答系统,自然语言处理,文本匹配,信息检索,知识库,开放域问答,WikiQA,机器学习,数据集 数据概述:... -
-
安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002
安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻 数据概述:... -
IEEE研究论文数据集1963-2021
IEEE研究论文数据集1963-2021 数据来源:互联网公开数据 标签:IEEE,研究论文,工程技术,推荐系统,信息检索,NLP任务 数据概述:... -
问答一致性研究与文本理解数据集
问答一致性研究与文本理解数据集 数据来源:互联网公开数据 标签:问答任务,一致性评估,自然语言处理,机器学习,问答系统,文本理解,信息检索 数据概述: 本数据集专注于问答一致性研究,包含训练集和验证集两个部分。每个数据样本由三个关键字段组成: 1. 问题(question):用户提出的具体问题。 2. 答案(answer):对应问题的标准答案。 3.... -
马拉维公共卫生疾病监测与应对问答数据集2020
马拉维公共卫生疾病监测与应对问答数据集2020 数据来源:互联网公开数据 标签:马拉维,公共卫生,疾病监测,问答数据,文本分类,机器学习,信息检索,培训材料 数据概述:... -
跨领域多模态问答任务数据集2023
跨领域多模态问答任务数据集2023 数据来源:互联网公开数据 标签:问答系统,多模态数据,自然语言处理,机器学习,信息检索,HTML页面,跨领域 数据概述:... -
机器学习概率视角主题建模数据集
机器学习概率视角主题建模数据集 数据来源:互联网公开数据 标签:机器学习,概率视角,主题建模,内容识别,信息检索,文本聚类,教育资料 数据概述: 本数据集来源于《机器学习:概率视角》一书,收录了书中各个章节的标题及其对应的段落内容。该数据集为研究和应用机器学习技术提供了宝贵的文字资源,涵盖了广泛的机器学习主题。 数据用途概述:... -
比利时法定条款检索数据集BSARD
比利时法定条款检索数据集BSARD 数据来源:互联网公开数据 标签:法律问答,比利时,信息检索,自然语言处理,机器学习,法律研究 数据概述:... -
洪水信息检索系统数据集
洪水信息检索系统数据集 数据来源:互联网公开数据 标签:洪水,信息检索,机器学习,灾害分析,数据训练测试,二分类模型,网页内容分析 数据概述: 本数据集用于训练和测试一个二分类机器学习模型,旨在开发一个信息检索系统,用于检索包含美国过去洪水事件相关信息的网页。数据集涵盖了与洪水相关的网页内容,为研究和分析洪水现象提供了基础支持。 数据用途概述:... -
WebMD健康问答平台问题与解答数据集
WebMD健康问答平台问题与解答数据集 数据来源:互联网公开数据 标签:健康,医疗,问答,WebMD,医学,文本数据,自然语言处理,信息检索 数据概述:...