-
社交媒体评论数据集VKCommentsDataset-yanayakubovich
社交媒体评论数据集VKCommentsDataset-yanayakubovich 数据来源:互联网公开数据 标签:社交媒体,用户评论,数据集,文本分析,情感分析,自然语言处理,网络行为,大数据 数据概述: 该数据集包含来自VK社交平台的用户评论数据,记录了用户在平台上的互动言论。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
卡通图像字幕数据集CartoonImageCaptionDataset-hamzabousalih
卡通图像字幕数据集CartoonImageCaptionDataset-hamzabousalih 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,机器学习,图像理解,视觉识别,人工智能 数据概述: 该数据集包含来自卡通图像的字幕数据,记录了卡通图像与其对应的文字描述。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-divanshu22
电影评论情感分析数据集MovieReviewSentimentAnalysis-divanshu22 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 电影评论, 二元分类, 深度学习, 数据集 数据概述: 该数据集包含来自电影评论网站的评论文本,记录了用户对电影的情感倾向。主要特征如下:... -
BERT嵌入测试数据集-khushigupta1605
BERT嵌入测试数据集-khushigupta1605 数据来源:互联网公开数据 标签:自然语言处理,文本嵌入,数据集,BERT,语义分析,机器学习,文本分类,情感分析 数据概述: 该数据集包含用于测试BERT模型生成的文本嵌入的数据,旨在评估BERT模型在不同文本任务中的表现。主要特征如下:... -
图书评论与评分数据集GoodreadsBookReviewsandRatingsDataset-malakajayakodi
图书评论与评分数据集GoodreadsBookReviewsandRatingsDataset-malakajayakodi 数据来源:互联网公开数据 标签:图书评论,用户评分,数据集,图书推荐,情感分析,自然语言处理,数据挖掘,用户行为 数据概述:... -
COVID-19疫情下医学文献分析数据集MedicalLiteratureAnalysisDatasetDuringCOVID-19Pandemic-al...
COVID-19疫情下医学文献分析数据集MedicalLiteratureAnalysisDatasetDuringCOVID-19Pandemic-alexvargasvalderrama 数据来源:互联网公开数据 标签:COVID-19, 医学研究, 学术论文, 文本挖掘, 自然语言处理, 疫情影响, 影像学, 数据分析 数据概述:... -
图像描述生成数据集ImageCaptioningDataset-linaali
图像描述生成数据集ImageCaptioningDataset-linaali 数据来源:互联网公开数据 标签:图像识别, 图像描述, 计算机视觉, 自然语言处理, 文本生成, 数据标注, 图像标注, 深度学习 数据概述: 该数据集包含图像文件及其对应的文本描述,用于训练和评估图像描述生成模型。主要特征如下:... -
葡萄酒评论数据集WineReviewsDataset-tlefever
葡萄酒评论数据集WineReviewsDataset-tlefever 数据来源:互联网公开数据 标签:葡萄酒,评论,数据集,品鉴,酿酒,消费者行为,市场分析,自然语言处理 数据概述: 该数据集包含来自多个葡萄酒评论网站的葡萄酒评论数据,记录了不同年份、产地、品种和价格的葡萄酒的详细评价信息。主要特征如下:... -
新闻文章内容分析数据集NewsArticleContentAnalysisDataset-vinishuchiha
新闻文章内容分析数据集NewsArticleContentAnalysisDataset-vinishuchiha 数据来源:互联网公开数据 标签:新闻文章, 文本分析, 内容摘要, 自然语言处理, 新闻媒体, 事件分类, 关键词提取, 舆情分析 数据概述: 该数据集包含来自Manorama... -
Aditi1024文本转录数据集-donutkashvi
Aditi1024文本转录数据集-donutkashvi 数据来源:互联网公开数据 标签:文本转录,语音识别,数据集,印度语,转录质量,自然语言处理,音频分析,机器学习 数据概述: 该数据集包含来自Aditi 1024项目收集的印度语音频及其相应的文本转录。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了不同时间段的音频数据。... -
带上下文的蜘蛛数据集SpiderDatasetwithContext-npradeep357
带上下文的蜘蛛数据集SpiderDatasetwithContext-npradeep357 数据来源:互联网公开数据 标签:自然语言处理,数据库,文本理解,问答系统,数据集,语义解析,关系抽取,机器学习,知识图谱 数据概述:该数据集包含了用于语义解析和文本到SQL(Structured Query... -
医疗诊断笔记特征识别数据集MedicalDiagnosisNotesFeatureRecognition-irenecampillopereda
医疗诊断笔记特征识别数据集MedicalDiagnosisNotesFeatureRecognition-irenecampillopereda 数据来源:互联网公开数据 标签:医疗诊断, 自然语言处理, 文本标注, 特征识别, 病例分析, 机器学习, 医疗健康, 临床笔记 数据概述:... -
数据2020年人工智能竞赛最终数据集AIFinal2020Dataset-nthuhellgod
2020年人工智能竞赛最终数据集AIFinal2020Dataset-nthuhellgod 数据来源:互联网公开数据 标签:人工智能,竞赛数据集,机器学习,图像识别,自然语言处理,计算机视觉,深度学习,数据集 数据概述: 该数据集来自2020年的人工智能竞赛,旨在推动人工智能技术的进步。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
学生学习表现与大型语言模型辅助数据集-alvaromendizabal
学生学习表现与大型语言模型辅助数据集-alvaromendizabal 数据来源:互联网公开数据 标签:学生学习,LLM辅助,教育,数据集,学习分析,自然语言处理,人工智能,学习效果 数据概述:该数据集包含了学生在学习过程中产生的各种数据,并结合了大型语言模型(LLM)的辅助。主要特征如下: 时间跨度:数据记录的时间范围从2023年至今。... -
越南土地纠纷新闻摘要数据集VietnamLandDisputeNewsSummarization-valleyy
越南土地纠纷新闻摘要数据集VietnamLandDisputeNewsSummarization-valleyy 数据来源:互联网公开数据 标签:土地纠纷, 新闻摘要, 文本分析, 自然语言处理, 越南, 法律, 摘要生成, 数据标注 数据概述: 该数据集包含来自越南新闻媒体的土地纠纷相关报道,记录了土地纠纷事件的详细描述及其对应的摘要。主要特征如下:... -
大规模文本生成模型检测数据集Large-scaleTextGenerationModelDetectionDataset-mercankuscu
大规模文本生成模型检测数据集Large-scaleTextGenerationModelDetectionDataset-mercankuscu 数据来源:互联网公开数据 标签:文本生成, 模型检测, 自然语言处理, 机器学习, 虚假文本, 对抗样本, 文本分类, 预训练模型 数据概述:... -
专利文本相似度预测训练数据集PatentTextSimilarityPredictionTrainingDataset-shobhitupadhyaya
专利文本相似度预测训练数据集PatentTextSimilarityPredictionTrainingDataset-shobhitupadhyaya 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义匹配, 机器学习, 专利检索, 文本分类, 深度学习 数据概述:... -
大规模语言模型LLM上下文学习数据集V4-ranchantan
大规模语言模型LLM上下文学习数据集V4-ranchantan 数据来源:互联网公开数据 标签:大规模语言模型,上下文学习,数据集,自然语言处理,机器学习,文本生成,模型评估,人工智能 数据概述: 该数据集是 LLM-SE 项目的第四个版本,专注于评估和提升大规模语言模型在上下文学习方面的能力。主要特征如下:... -
文本生成模型创作文章真伪辨别数据集TextGenerationModelArticleAuthenticityDetection-scarlet390625
文本生成模型创作文章真伪辨别数据集TextGenerationModelArticleAuthenticityDetection-scarlet390625 数据来源:互联网公开数据 标签:文本生成, 机器生成文本, 真实性检测, 自然语言处理, 文本分类, 深度学习, GPT模型, 伪原创 数据概述:... -
法律文本摘要生成数据集LegalTextSummarization-shurahbeelpeerzada
法律文本摘要生成数据集LegalTextSummarization-shurahbeelpeerzada 数据来源:互联网公开数据 标签:文本摘要, 法律文本, 自然语言处理, 文本生成, 机器翻译, 深度学习, 数据集, 法律 数据概述: 该数据集包含来自美国法律文件的数据,记录了法律条文的原文和对应的摘要。主要特征如下:...