数据集 - 海数据

好书推荐集1960-2022

2025年4月25日

好书推荐集1960-2022 数据来源：互联网公开数据标签：好书推荐,书籍描述,书籍封面,书籍分类,书籍评分,文本分析,图像分析数据概述：本数据集收录了1960年至2022年间在Goodreads网站上被广泛推荐的书籍信息，包括书籍的封面图片、书籍描述、书籍分类和评分等关键要素。数据集旨在为研究书籍描述和封面与其分类及评分之间的关系提供基础数据。...

ZIP

跨站脚本攻击XSS数据集-abdulrahmanalhendi

2025年4月25日

跨站脚本攻击XSS数据集-abdulrahmanalhendi 数据来源：互联网公开数据标签：网络安全，XSS攻击，数据集，机器学习，文本分析，恶意代码，安全研究，自然语言处理数据概述：该数据集包含了用于检测和分析跨站脚本攻击（XSS）的恶意代码样本和正常网页内容。主要特征如下：...

ZIP

文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj

2025年4月25日

文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj 数据来源：互联网公开数据标签：文档摘要，摘要生成，自然语言处理，机器学习，文本分析，问答系统，数据集，信息检索数据概述：该数据集包含来自多个来源的文档及其对应的摘要，适用于基于查询的文档摘要生成任务。主要特征如下：...

ZIP

人机交互兴趣与道德偏好数据集PromptandResponsesInterestsandMoralsDataset-arunsensei

2025年4月25日

人机交互兴趣与道德偏好数据集PromptandResponsesInterestsandMoralsDataset-arunsensei 数据来源：互联网公开数据标签：人机交互，兴趣，道德，自然语言处理，数据集，情感分析，机器学习，文本分析...

ZIP

BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13

2025年4月25日

BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13 数据来源：互联网公开数据标签：自然语言处理，文本分析，机器学习，深度学习，BERT模型，语言模型，数据集，AI应用数据概述：...

ZIP

自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07

2025年4月25日

自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07 数据来源：互联网公开数据标签：自然语言处理，生成答案，数据集，机器学习，文本分析，人工智能，信息检索，语言模型数据概述：该数据集包含由自然语言处理技术生成的答案，适用于对话系统，问答系统等任务。主要特征如下：...

ZIP

产品文件评论数据集Files-Reviews-ProductsDataset-yashshir7

2025年4月25日

产品文件评论数据集Files-Reviews-ProductsDataset-yashshir7 数据来源：互联网公开数据标签：产品评论，数据集，文本分析，自然语言处理，消费者行为，机器学习，商业智能，市场研究数据概述：该数据集包含来自多个电商平台的消费者产品评论数据，记录了用户对各类产品的评价和反馈。主要特征如下：...

ZIP

印尼电商平台评分与评论数据集

2025年4月25日

印尼电商平台评分与评论数据集数据来源：互联网公开数据标签：电商平台,印尼语,用户评论,评分,文本分析,情感分析,用户体验数据概述：本数据集包含从Google Play...

ZIP

柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung

2025年4月25日

柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung 数据来源：互联网公开数据标签：诗歌，文本分析，自然语言处理，伪标签，机器学习，情感分析，诗歌风格，语料库数据概述：该数据集包含由柯勒律治诗歌生成的伪标签数据，旨在用于训练文本分析和自然语言处理模型。主要特征如下：...

ZIP

古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit

2025年4月25日

古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit 数据来源：互联网公开数据标签：自然语言处理，词性标注，古吉拉特语，数据集，语言技术，机器学习，文本分析，多语言处理数据概述：...

ZIP

LLM模型验证数据集ValidationLLMDataset-arunsensei

2025年4月25日

LLM模型验证数据集ValidationLLMDataset-arunsensei 数据来源：互联网公开数据标签：LLM，大语言模型，验证，评估，自然语言处理，NLP，文本分析，机器学习数据概述：该数据集包含用于验证和评估大型语言模型（LLM）性能的数据，记录了各种类型的文本数据和相应的评估指标。主要特征如下：...

ZIP

自然语言处理与Twitter文本分析数据集NLP-TwitterTextAnalysisDataset-moeshiro

2025年4月25日

自然语言处理与Twitter文本分析数据集NLP-TwitterTextAnalysisDataset-moeshiro 数据来源：互联网公开数据标签：自然语言处理，社交媒体，数据集，文本分析，情感分析，机器学习，数据挖掘，舆情监控数据概述：该数据集包含来自Twitter平台的文本数据，记录了用户在特定时间段内的推文内容及相关信息。主要特征如下：...

ZIP

统一多源数据集-DAIGT竞赛数据集

2025年4月25日

统一多源数据集-DAIGT竞赛数据集数据来源：互联网公开数据标签：DAIGT竞赛,LLM生成文本,数据增强,训练数据,文本分析,自然语言处理,NLP,Kaggle数据集数据概述：...

ZIP

古兰经阿拉伯语章节数据集-haykelbargougui

2025年4月25日

古兰经阿拉伯语章节数据集-haykelbargougui 数据来源：互联网公开数据标签：古兰经，阿拉伯语，文本数据，宗教，伊斯兰教，自然语言处理，文本分析，语言学数据概述：该数据集包含古兰经的阿拉伯语文本数据，记录了古兰经的各个章节及其对应的经文。主要特征如下：时间跨度：数据涵盖了古兰经的全部内容，即从古兰经的创作时期至今。...

ZIP

MindHack心理健康数据集MindHackMentalHealthDataset-menuwanwalpita

2025年4月25日

MindHack心理健康数据集MindHackMentalHealthDataset-menuwanwalpita 数据来源：互联网公开数据标签：心理健康，数据集，情绪识别，自然语言处理，机器学习，文本分析，社交媒体，情感分析数据概述：该数据集包含来自社交媒体平台的数据，记录了用户关于心理健康的话题讨论和相关内容。主要特征如下：...

ZIP

古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id

2025年4月25日

古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id 数据来源：互联网公开数据标签：古兰经，数据集，文本分析，伊斯兰教，自然语言处理，语义分析，宗教研究，文本挖掘数据概述：该数据集包含经过分段处理的古兰经文本，旨在为文本分析和自然语言处理研究提供支持。主要特征如下：...

ZIP

假新闻检测数据集FakeNewsDetectionDataset-hubblemind

2025年4月25日

假新闻检测数据集FakeNewsDetectionDataset-hubblemind 数据来源：互联网公开数据标签：假新闻，数据集，信息验证，文本分析，机器学习，自然语言处理，社交媒体，新闻研究数据概述：该数据集来自HubbleMind平台，记录了大量假新闻与真实新闻的样本，适用于假新闻检测与信息验证任务。主要特征如下：...

ZIP

仇恨和冒犯性言论检测数据集HateOffensiveSpeechDetectionDataset-alternacx

2025年4月25日

仇恨和冒犯性言论检测数据集HateOffensiveSpeechDetectionDataset-alternacx 数据来源：互联网公开数据标签：仇恨言论，冒犯性言论，数据集，文本分析，自然语言处理，机器学习，社交媒体，情感分析数据概述：该数据集包含来自多个来源的文本数据，记录了不同语境下的言论文本，旨在用于仇恨和冒犯性言论的检测。主要特征如下：...

ZIP

文档分类数据集DocClassificationDataset-aryangaikwad

2025年4月25日

文档分类数据集DocClassificationDataset-aryangaikwad 数据来源：互联网公开数据标签：文档分类，数据集，自然语言处理，机器学习，文本分析，信息检索，文本分类，人工智能数据概述：该数据集包含来自多个来源的文档数据，记录了各类文档的文本内容和类别标签。主要特征如下：时间跨度：数据记录的时间范围从近年到现代。...

ZIP

股市预测日常新闻数据集DailyNewsforStockMarketPredictionDataset-osamajamalnayfeh

2025年4月25日

股市预测日常新闻数据集DailyNewsforStockMarketPredictionDataset-osamajamalnayfeh 数据来源：互联网公开数据标签：股市预测，新闻数据，数据集，文本分析，机器学习，金融分析，投资决策，经济新闻数据概述：该数据集包含来自互联网的日常新闻数据，主要用于股票市场预测。主要特征如下：...

ZIP

找到5,740个数据集

注册成功！