-
好书推荐集1960-2022
好书推荐集1960-2022 数据来源:互联网公开数据 标签:好书推荐,书籍描述,书籍封面,书籍分类,书籍评分,文本分析,图像分析 数据概述: 本数据集收录了1960年至2022年间在Goodreads网站上被广泛推荐的书籍信息,包括书籍的封面图片、书籍描述、书籍分类和评分等关键要素。数据集旨在为研究书籍描述和封面与其分类及评分之间的关系提供基础数据。... -
跨站脚本攻击XSS数据集-abdulrahmanalhendi
跨站脚本攻击XSS数据集-abdulrahmanalhendi 数据来源:互联网公开数据 标签:网络安全,XSS攻击,数据集,机器学习,文本分析,恶意代码,安全研究,自然语言处理 数据概述:该数据集包含了用于检测和分析跨站脚本攻击(XSS)的恶意代码样本和正常网页内容。主要特征如下:... -
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj 数据来源:互联网公开数据 标签:文档摘要,摘要生成,自然语言处理,机器学习,文本分析,问答系统,数据集,信息检索 数据概述:该数据集包含来自多个来源的文档及其对应的摘要,适用于基于查询的文档摘要生成任务。主要特征如下:... -
人机交互兴趣与道德偏好数据集PromptandResponsesInterestsandMoralsDataset-arunsensei
人机交互兴趣与道德偏好数据集PromptandResponsesInterestsandMoralsDataset-arunsensei 数据来源:互联网公开数据 标签:人机交互,兴趣,道德,自然语言处理,数据集,情感分析,机器学习,文本分析... -
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13
BERT基础模型未分大小写文本处理数据集BERT-base-uncased-fresh-ep1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,BERT模型,语言模型,数据集,AI应用 数据概述:... -
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07 数据来源:互联网公开数据 标签:自然语言处理,生成答案,数据集,机器学习,文本分析,人工智能,信息检索,语言模型 数据概述: 该数据集包含由自然语言处理技术生成的答案,适用于对话系统,问答系统等任务。主要特征如下:... -
产品文件评论数据集Files-Reviews-ProductsDataset-yashshir7
产品文件评论数据集Files-Reviews-ProductsDataset-yashshir7 数据来源:互联网公开数据 标签:产品评论,数据集,文本分析,自然语言处理,消费者行为,机器学习,商业智能,市场研究 数据概述: 该数据集包含来自多个电商平台的消费者产品评论数据,记录了用户对各类产品的评价和反馈。主要特征如下:... -
印尼电商平台评分与评论数据集
印尼电商平台评分与评论数据集 数据来源:互联网公开数据 标签:电商平台,印尼语,用户评论,评分,文本分析,情感分析,用户体验 数据概述: 本数据集包含从Google Play... -
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung 数据来源:互联网公开数据 标签:诗歌,文本分析,自然语言处理,伪标签,机器学习,情感分析,诗歌风格,语料库 数据概述: 该数据集包含由柯勒律治诗歌生成的伪标签数据,旨在用于训练文本分析和自然语言处理模型。主要特征如下:... -
古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit
古吉拉特语词性标注数据集POSTaggingforGujaratiLanguageDataset-vedantrajpurohit 数据来源:互联网公开数据 标签:自然语言处理,词性标注,古吉拉特语,数据集,语言技术,机器学习,文本分析,多语言处理 数据概述:... -
LLM模型验证数据集ValidationLLMDataset-arunsensei
LLM模型验证数据集ValidationLLMDataset-arunsensei 数据来源:互联网公开数据 标签:LLM,大语言模型,验证,评估,自然语言处理,NLP,文本分析,机器学习 数据概述:该数据集包含用于验证和评估大型语言模型(LLM)性能的数据,记录了各种类型的文本数据和相应的评估指标。主要特征如下:... -
自然语言处理与Twitter文本分析数据集NLP-TwitterTextAnalysisDataset-moeshiro
自然语言处理与Twitter文本分析数据集NLP-TwitterTextAnalysisDataset-moeshiro 数据来源:互联网公开数据 标签:自然语言处理,社交媒体,数据集,文本分析,情感分析,机器学习,数据挖掘,舆情监控 数据概述: 该数据集包含来自Twitter平台的文本数据,记录了用户在特定时间段内的推文内容及相关信息。主要特征如下:... -
统一多源数据集-DAIGT竞赛数据集
统一多源数据集-DAIGT竞赛数据集 数据来源:互联网公开数据 标签:DAIGT竞赛,LLM生成文本,数据增强,训练数据,文本分析,自然语言处理,NLP,Kaggle数据集 数据概述:... -
古兰经阿拉伯语章节数据集-haykelbargougui
古兰经阿拉伯语章节数据集-haykelbargougui 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,文本数据,宗教,伊斯兰教,自然语言处理,文本分析,语言学 数据概述: 该数据集包含古兰经的阿拉伯语文本数据,记录了古兰经的各个章节及其对应的经文。主要特征如下: 时间跨度:数据涵盖了古兰经的全部内容,即从古兰经的创作时期至今。... -
MindHack心理健康数据集MindHackMentalHealthDataset-menuwanwalpita
MindHack心理健康数据集MindHackMentalHealthDataset-menuwanwalpita 数据来源:互联网公开数据 标签:心理健康,数据集,情绪识别,自然语言处理,机器学习,文本分析,社交媒体,情感分析 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户关于心理健康的话题讨论和相关内容。主要特征如下:... -
古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id
古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id 数据来源:互联网公开数据 标签:古兰经,数据集,文本分析,伊斯兰教,自然语言处理,语义分析,宗教研究,文本挖掘 数据概述: 该数据集包含经过分段处理的古兰经文本,旨在为文本分析和自然语言处理研究提供支持。主要特征如下:... -
假新闻检测数据集FakeNewsDetectionDataset-hubblemind
假新闻检测数据集FakeNewsDetectionDataset-hubblemind 数据来源:互联网公开数据 标签:假新闻,数据集,信息验证,文本分析,机器学习,自然语言处理,社交媒体,新闻研究 数据概述:该数据集来自HubbleMind平台,记录了大量假新闻与真实新闻的样本,适用于假新闻检测与信息验证任务。主要特征如下:... -
仇恨和冒犯性言论检测数据集HateOffensiveSpeechDetectionDataset-alternacx
仇恨和冒犯性言论检测数据集HateOffensiveSpeechDetectionDataset-alternacx 数据来源:互联网公开数据 标签:仇恨言论,冒犯性言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,情感分析 数据概述:该数据集包含来自多个来源的文本数据,记录了不同语境下的言论文本,旨在用于仇恨和冒犯性言论的检测。主要特征如下:... -
文档分类数据集DocClassificationDataset-aryangaikwad
文档分类数据集DocClassificationDataset-aryangaikwad 数据来源:互联网公开数据 标签:文档分类,数据集,自然语言处理,机器学习,文本分析,信息检索,文本分类,人工智能 数据概述: 该数据集包含来自多个来源的文档数据,记录了各类文档的文本内容和类别标签。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
股市预测日常新闻数据集DailyNewsforStockMarketPredictionDataset-osamajamalnayfeh
股市预测日常新闻数据集DailyNewsforStockMarketPredictionDataset-osamajamalnayfeh 数据来源:互联网公开数据 标签:股市预测,新闻数据,数据集,文本分析,机器学习,金融分析,投资决策,经济新闻 数据概述:该数据集包含来自互联网的日常新闻数据,主要用于股票市场预测。主要特征如下:...