找到699个数据集

分类: 互联网数据 标签: 信息检索

过滤结果
  • 科研论文引用关系数据集

    2025年11月22日 30 10 1

    科研论文引用关系数据集_Research_Paper_Citation_Relation 数据来源:互联网公开数据 标签:论文引用, 学术研究, 文本分析, 自然语言处理, 知识图谱, 数据挖掘, 文本匹配, 数据集构建 数据概述: 该数据集包含来自学术研究领域的文本数据,记录了科研论文的标题、摘要以及它们之间的引用关系。主要特征如下:...
    packageimg
  • 文本语义相似度分析嵌入向量数据集

    2025年11月2日 30 118 4

    文本语义相似度分析嵌入向量数据集_Text_Semantic_Similarity_Analysis_Embedding_Vectors 数据来源:互联网公开数据 标签:文本分析, 语义相似度, 嵌入向量, 机器学习, 自然语言处理, 文本表示, 模型训练, 数据集 数据概述:...
    packageimg
  • 法律文本检索模型评估数据集

    2025年10月30日 30 93 33

    法律文本检索模型评估数据集_Legal_Text_Retrieval_Model_Evaluation 数据来源:互联网公开数据 标签:法律文本, 信息检索, 自然语言处理, 模型评估, BERT, 文本相似度, 机器学习, 法律科技 数据概述: 该数据集包含用于评估法律文本检索模型的各类数据,主要来源于COLIEE...
    packageimg
  • 政府PDF文档元数据分析数据集

    2025年10月30日 30 202 190

    政府PDF文档元数据分析数据集_Government_PDF_Document_Metadata_Analysis_Dataset 数据来源:互联网公开数据 标签:PDF文档, 元数据分析, 政府文件, 数据挖掘, 文件分析, 文档处理, 文本信息提取, 信息检索 数据概述:...
    packageimg
  • 金融合规问答数据集

    2025年10月26日 30 25 5

    金融合规问答数据集_Financial_Compliance_Question_Answering_Dataset 数据来源:互联网公开数据 标签:金融合规, 问答系统, 自然语言处理, 文本匹配, 信息检索, 知识图谱, 机器学习, 语料库 数据概述:...
    packageimg
  • 问答文本分类数据集

    2025年10月21日 30 5 2

    问答文本分类数据集_Question_Answering_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 问答系统, 自然语言处理, 语料库, 机器学习, 知识挖掘, 语义分析, 情感分析 数据概述: 该数据集包含来自雅虎问答的数据,记录了用户提出的问题、对应的答案以及问题所属的类别。主要特征如下:...
    packageimg
  • 新闻文本分类数据集-priyabratapanda

    2025年4月23日 60 182 109

    新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。...
    packageimg
  • 维基百科文章段落文本数据集

    2025年10月17日 30 19 16

    维基百科文章段落文本数据集_Wikipedia_Article_Paragraphs_Text 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 语料库, 文本挖掘, 维基百科, 文本语料, 语义分析, 信息检索 数据概述:...
    packageimg
  • 金融领域问答与文本摘要数据集

    2025年10月16日 30 153 149

    金融领域问答与文本摘要数据集_Financial_Question_Answering_and_Text_Summarization 数据来源:互联网公开数据 标签:金融, 问答系统, 文本摘要, 知识检索, 信息抽取, 机器学习, 自然语言处理, 文本分析 数据概述:...
    packageimg
  • 医疗健康问答数据集

    2025年10月14日 30 68 36

    医疗健康问答数据集_E_Health_Question_Answering_Dataset 数据来源:互联网公开数据 标签:医疗健康, 问答系统, 自然语言处理, 文本分析, 信息检索, 知识图谱, 医疗咨询, 数据挖掘 数据概述: 该数据集包含来自医疗健康问答平台的数据,记录了用户提出的医疗问题及其对应的专业解答。主要特征如下:...
    packageimg
  • 检索排序模型训练评估数据集

    2025年10月14日 30 144 65

    检索排序模型训练评估数据集_Retrieval_Ranking_Model_Training_and_Evaluation_Dataset 数据来源:互联网公开数据 标签:信息检索, 排序学习, 模型评估, 机器学习, 深度学习, 自然语言处理, 文本检索, MRR 数据概述:...
    packageimg
  • 文本语义向量嵌入数据集

    2025年10月13日 30 199 36

    文本语义向量嵌入数据集_Text_Semantic_Vector_Embeddings 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 向量数据库, 文本检索, 语义相似度, 机器学习, 自然语言处理, 知识图谱 数据概述: 该数据集包含基于Multi-QA-MPNet-Base-v1模型生成的文本语义向量嵌入。主要特征如下:...
    packageimg
  • 维基百科页面信息数据集

    2025年10月10日 30 59 14

    维基百科页面信息数据集_Wikipedia_Page_Information_Dataset 数据来源:互联网公开数据 标签:维基百科, 页面信息, 文本数据, 网页抓取, 数据分析, 泰语, 知识图谱, 数据集 数据概述: 该数据集包含来自维基百科的页面信息,记录了维基百科页面相关的元数据,主要特征如下:...
    packageimg
  • 哈萨克斯坦公共服务问答数据集

    2025年10月3日 30 123 98

    哈萨克斯坦公共服务问答数据集_Kazakhstan_Public_Service_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 公共服务, 文本处理, 信息检索, 机器翻译, 语料库, 知识图谱, 自然语言处理 数据概述:...
    packageimg
  • 越南语问答文本数据集

    2025年9月23日 30 57 37

    越南语问答文本数据集_Vietnamese_Question_Answering_Text_Dataset 数据来源:互联网公开数据 标签:问答系统, 文本匹配, 自然语言处理, 机器阅读理解, 文本分类, 越南语, 数据集, 信息检索 数据概述: 该数据集包含来自越南语文本的问答对,旨在用于训练和评估越南语问答系统。主要特征如下:...
    packageimg
  • 编程问答知识库问题分类数据集

    2025年9月23日 30 209 46

    编程问答知识库问题分类数据集_Programming_Q_A_Knowledge_Base_Question_Classification_Dataset 数据来源:互联网公开数据 标签:编程问答, 文本分类, 自然语言处理, 机器学习, 问题分类, 知识库, 文本挖掘, 代码片段 数据概述:...
    packageimg
  • 代码文档与文本匹配数据集

    2025年9月11日 30 63 32

    代码文档与文本匹配数据集_Code_Documentation_and_Text_Matching_Dataset 数据来源:互联网公开数据 标签:代码文档, 文本匹配, 自然语言处理, 数据标注, 机器学习, 代码分析, 知识检索, 语料库 数据概述:...
    packageimg
  • 法律文本分类与嵌入数据集

    2025年9月7日 30 162 133

    法律文本分类与嵌入数据集_Legal_Text_Classification_and_Embedding_Dataset 数据来源:互联网公开数据 标签:法律文本, 文本分类, 嵌入模型, 自然语言处理, 机器学习, 法律案例, 文本分析, 语义理解 数据概述:...
    packageimg
  • 问答匹配与答案推荐数据集

    2025年9月6日 30 16 8

    问答匹配与答案推荐数据集_Question_Answering_Matching_and_Answer_Recommendation_Dataset 数据来源:互联网公开数据 标签:问答系统, 文本匹配, 答案推荐, 自然语言处理, 机器学习, 信息检索, 数据标注, 关系抽取 数据概述:...
    packageimg
  • 文本检索模型评估结果数据集

    2025年9月3日 30 163 29

    文本检索模型评估结果数据集_Text_Retrieval_Model_Evaluation_Results 数据来源:互联网公开数据 标签:文本检索, 信息检索, 模型评估, 语义相似度, 深度学习, 机器翻译, 知识图谱, 性能分析 数据概述:...
    packageimg