-
BM25文档检索与信息提取数据集BM25DocumentRetrievalandInformationExtractionDataset-dinhnhattruong
2025年5月30日 30 91 39
BM25文档检索与信息提取数据集BM25DocumentRetrievalandInformationExtractionDataset-dinhnhattruong 数据来源:互联网公开数据 标签:文档检索,信息提取,数据集,信息检索,自然语言处理,机器学习,文本挖掘,数据科学 数据概述:... -
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers
2025年5月29日 30 180 69
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers 数据来源:互联网公开数据 标签:法律,文档检索,数据集,信息检索,自然语言处理,文本分类,法律科技,机器学习 数据概述: 该数据集包含来自德国联邦刑事警察局(BKA)的法律文档检索数据,记录了法律文档的检索和分类信息。主要特征如下:... -
文档检索数据集Retrieval-DocumentDataset-hlv305
2025年5月28日 30 137 34
文档检索数据集Retrieval-DocumentDataset-hlv305 数据来源:互联网公开数据 标签:文档检索,数据集,信息检索,自然语言处理,机器学习,文本分析,人工智能,搜索引擎 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档内容及其相关检索信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25
2025年5月13日 30 48 40
BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25 数据来源:互联网公开数据 标签:法律,文档检索,数据集,自然语言处理,文本分类,机器学习,信息检索,人工智能 数据概述: 该数据集由BKAI(BKAV人工智能研究院)提供,专注于法律文档的检索任务。主要特征如下:... -
局部敏感哈希LSH文档数据集-massivedatamining
2025年4月25日 30 180 58
局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。... -
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806
2025年4月23日 30 206 138
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806 数据来源:互联网公开数据 标签:机器阅读理解,文档检索,数据集,自然语言处理,信息检索,深度学习,文本匹配,问答系统 数据概述: 该数据集由微软发布,旨在促进机器阅读理解和文档检索领域的研究。数据集的核心是查询-... -
非监督学习自然语言处理数据集
2025年4月15日 30 200 145
非监督学习自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,非监督学习,问答系统,TF-IDF,文档检索 数据概述: 本数据集用于非监督学习中的问答系统训练。数据集中的每一行代表一个文档,适用于通过向量模型和TF-IDF方法检索用户查询的答案。该数据集包含大量的文本信息,为构建有效的问答系统提供了丰富的训练素材。 数据用途概述:... -
单主题RAG评估数据集
2025年4月14日 30 65 16
单主题RAG评估数据集 数据来源:互联网公开数据 标签:RAG,自然语言处理,文本查询,评估数据集,机器学习,文档检索,问答系统 数据概述: 本数据集旨在评估单主题文档中RAG(Retrieval-Augmented...