-
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:... -
arXiv计算机科学论文多标签分类数据集-约20万篇-v1
arXiv计算机科学论文多标签分类数据集-约20万篇-v1 数据来源:互联网公开数据 标签:arXiv,计算机科学,论文,多标签分类,文本分类,自然语言处理,机器学习,主题建模,信息检索 数据概述:... -
网页链接失效检测数据集-abdelazizfaramawy
网页链接失效检测数据集-abdelazizfaramawy 数据来源:互联网公开数据 标签:网页链接,失效检测,数据集,网络爬虫,数据清洗,网络安全,信息检索,数据分析 数据概述: 该数据集包含了从互联网上抓取的网页链接,并记录了它们的有效性状态。主要特征如下: 时间跨度: 数据记录的时间跨度不固定,取决于网页抓取的时间。 地理范围:... -
主题分类数据集TopicsClassificationDataset-luisfredgs
主题分类数据集TopicsClassificationDataset-luisfredgs 数据来源:互联网公开数据 标签:主题分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,数据分析 数据概述:该数据集包含来自多个来源的文本数据,记录了不同主题的文档或文本片段。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:... -
关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788
关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源:互联网公开数据 标签:自然语言处理,URL匹配,数据集,关键词提取,文本分析,机器学习,信息检索,数据挖掘 数据概述:... -
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:... -
项目文件分析数据集FilestoUseforProjectDataset-justingrima
项目文件分析数据集FilestoUseforProjectDataset-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文本处理,数据挖掘,信息检索,文档管理,软件工程 数据概述: 该数据集包含了用于项目的文件信息,旨在支持项目管理,文件分析和相关研究。主要特征如下:... -
数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666
2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。... -
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:... -
参数数据-参数信息数据集ParamsDataDataset-phamkhacduy
参数数据-参数信息数据集ParamsDataDataset-phamkhacduy 数据来源:互联网公开数据 标签:参数数据,数据集,数据分析,机器学习,特征工程,模型训练,数据挖掘,信息检索 数据概述: 该数据集包含了各种参数的数据,记录了不同类型参数的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体参数的更新频率。... -
图书信息与描述数据集BookswithDescriptionDataset-fakhriabbas
图书信息与描述数据集BookswithDescriptionDataset-fakhriabbas 数据来源:互联网公开数据 标签:图书信息,数据集,文本分析,自然语言处理,信息检索,教育研究,出版行业 数据概述:该数据集包含来自公开图书信息库的数据,记录了各类图书的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi
用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi 数据来源:互联网公开数据 标签:用户问题,数据集,数据分析,机器学习,自然语言处理,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自用户问题的数据,记录了用户提出的问题及相关信息。主要特征如下:... -
元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata
元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus
自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,深度学习,人工智能,信息检索 数据概述: 该数据集来源于ChAIi问答任务竞赛,专注于自然语言处理领域的问答系统研究。主要特征如下:... -
谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530
谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,人工智能,语义理解,信息检索 数据概述: 该数据集是谷歌问答数据集的扩展版本,包含来自谷歌问答社区的问答数据,记录了用户提交的问题及其对应的回答内容。主要特征如下:... -
多模态文本摘要数据集MT-SummDataset-gsaichaitanya
多模态文本摘要数据集MT-SummDataset-gsaichaitanya 数据来源:互联网公开数据 标签:多模态数据,文本摘要,数据集,自然语言处理,深度学习,机器学习,多媒体分析,信息检索 数据概述: 该数据集包含来自多个来源的多模态文本摘要数据,记录了图像和相应文本的摘要信息。主要特征如下:... -
地区报纸可视化元数据数据集-nikhilwani
地区报纸可视化元数据数据集-nikhilwani 数据来源:互联网公开数据 标签:新闻,可视化,数据集,文本分析,自然语言处理,信息检索,媒体研究,出版物 数据概述: 该数据集包含来自地区报纸的可视化元数据,记录了报纸文章中可视元素的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为未知,具体时间跨度取决于数据集的原始来源。... -
科学BERT数据集SciBERTDataset-cse006kongkanbora
科学BERT数据集SciBERTDataset-cse006kongkanbora 数据来源:互联网公开数据 标签:科学文献,自然语言处理,数据集,机器学习,深度学习,文本分类,学术研究,信息检索 数据概述:该数据集包含来自多个科学文献的数据,记录了大量科学论文的摘要,文本和相关元数据。主要特征如下:... -
文本分类数据集TextClassificationDataset-albellna
文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:...