-
测试查询与真实结果数据集TestQueriesGroundtruthDataset-mahnoorabbasi05
测试查询与真实结果数据集TestQueriesGroundtruthDataset-mahnoorabbasi05 数据来源:互联网公开数据 标签:查询分析,数据集,信息检索,机器学习,搜索引擎,自然语言处理,人工智能,数据科学 数据概述:该数据集包含了一系列测试查询及其真实结果,适用于信息检索,搜索引擎优化和自然语言处理等任务。主要特征如下:... -
文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban
文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban 数据来源:互联网公开数据 标签:自然语言处理, 文本标注, 数据集, 机器学习, 深度学习, 语义分析, 语言模型, 计算语言学 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的文本标签信息。主要特征如下:... -
亚马逊图书销售与评论数据集AmazonBooksData-ashishkumar111
亚马逊图书销售与评论数据集AmazonBooksData-ashishkumar111 数据来源:互联网公开数据 标签:图书,亚马逊,销售数据,评论数据,文本分析,自然语言处理,推荐系统,市场分析 数据概述: 该数据集包含来自亚马逊平台上的图书销售和用户评论数据,记录了图书的详细信息和用户反馈。主要特征如下:... -
生成的图像字幕数据集GeneratedCaptionsModel2Dataset-drithidavuluri
生成的图像字幕数据集GeneratedCaptionsModel2Dataset-drithidavuluri 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,人工智能,多媒体 数据概述: 该数据集包含来自Generated Captions Model... -
越南航空顾客评价自然语言处理数据集DatasetNLPReviewVietjet-leekayn
越南航空顾客评价自然语言处理数据集DatasetNLPReviewVietjet-leekayn 数据来源:互联网公开数据 标签:自然语言处理,顾客评价,数据集,情感分析,机器学习,文本挖掘,航空业,用户体验 数据概述: 该数据集包含来自越南航空(Vietjet)的顾客评价数据,涵盖了乘客对航班服务,航班体验,机场设施等多方面的评价。主要特征如下:... -
文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro
文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:... -
公共交通乘客会话记录数据集PSPSessionsinNewTrainsetDataset-steubk
公共交通乘客会话记录数据集PSPSessionsinNewTrainsetDataset-steubk 数据来源:互联网公开数据 标签:公共交通,乘客会话,数据集,自然语言处理,机器学习,语音识别,交通管理,人工智能 数据概述: 该数据集包含来自新列车线路的乘客会话记录,记录了乘客与列车系统的交互对话。主要特征如下:... -
Mercari商品价格预测数据集MercariPriceSuggestionChallengeDataset-hhl028
Mercari商品价格预测数据集MercariPriceSuggestionChallengeDataset-hhl028 数据来源:互联网公开数据 标签:电商,商品价格预测,数据集,机器学习,自然语言处理,文本分析,推荐系统,在线市场 数据概述:... -
自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija
自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,文本挖掘,人工智能 数据概述: 该数据集包含来自各类博客平台的文章数据,记录了不同主题和内容的博客文章信息。主要特征如下:... -
电子邮件数据集合EmailsDataCollection-kirollosashraf
电子邮件数据集合EmailsDataCollection-kirollosashraf 数据来源:互联网公开数据 标签:电子邮件,数据集,通信分析,信息安全,机器学习,自然语言处理,数据挖掘,办公自动化 数据概述: 该数据集包含来自公开来源的电子邮件数据,记录了电子邮件的发送,接收,内容和附件等信息。主要特征如下:... -
Yelp咖啡馆评论数据集-marklillian
Yelp咖啡馆评论数据集-marklillian 数据来源:互联网公开数据 标签:咖啡馆,评论,数据集,情感分析,自然语言处理,文本挖掘,商业分析,客户反馈 数据概述: 该数据集包含来自Yelp网站的咖啡馆评论数据,记录了用户对咖啡馆的评价和相关信息。主要特征如下: 时间跨度:数据记录的时间范围未知,具体时间段取决于数据集的创建时间。... -
Qwen大模型微调问答数据集-martintura
Qwen大模型微调问答数据集-martintura 数据来源:互联网公开数据 标签:大模型,微调,问答,自然语言处理,人工智能,数据集,模型训练,中文 数据概述:该数据集包含基于Qwen大模型微调的问答数据,记录了用户提出的问题和模型生成的回答。主要特征如下: 时间跨度:数据记录的时间范围为近期。 地理范围:数据主要针对中文用户,覆盖全球范围。... -
文本摘要数据集TextSummarizationDataset-cuitengfeui
文本摘要数据集TextSummarizationDataset-cuitengfeui 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,人工智能,语言学,信息提取,文本分析 数据概述:该数据集包含来自多个来源的文本摘要数据,记录了原文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
电影票房与剧情摘要数据集MovieOverviewDataset-nickolashirata
电影票房与剧情摘要数据集MovieOverviewDataset-nickolashirata 数据来源:互联网公开数据 标签:电影,票房,剧情,数据集,自然语言处理,文本分析,机器学习,电影产业 数据概述:该数据集包含来自互联网的电影票房数据与剧情摘要信息,记录了大量电影的详细信息。主要特征如下:... -
Booking-com酒店评论数据集-frogsohyun
Booking-com酒店评论数据集-frogsohyun 数据来源:互联网公开数据 标签:酒店评论,情感分析,自然语言处理,文本挖掘,旅游,用户体验,机器学习,情感分类 数据概述: 该数据集包含来自 Booking.com 平台的酒店评论数据,记录了用户对酒店的评价和相关信息。主要特征如下:... -
Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17
Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述:... -
动物图像描述数据集AnimalCaptionDataset-vhonghoavin
动物图像描述数据集AnimalCaptionDataset-vhonghoavin 数据来源:互联网公开数据 标签:动物,图像描述,数据集,自然语言处理,计算机视觉,图像标注,机器学习,文本生成 数据概述: 该数据集包含了动物图像及其对应的文本描述,旨在用于图像描述生成,图像理解等任务。主要特征如下:... -
拼写校正数据集SpellingCorrectionDataset-antooo511
拼写校正数据集SpellingCorrectionDataset-antooo511 数据来源:互联网公开数据 标签:拼写校正,数据集,自然语言处理,文本分析,机器学习,语言技术,教育技术,数据挖掘 数据概述: 该数据集专注于记录和分析拼写错误的文本,包含大量带有拼写错误的句子及其对应的正确拼写版本。主要特征如下:... -
Reddit评论数据集RedditCommentDataset-lordjay
Reddit评论数据集RedditCommentDataset-lordjay 数据来源:互联网公开数据 标签:社交媒体,评论,数据集,自然语言处理,机器学习,情感分析,社会研究,文本分析 数据概述:该数据集包含来自Reddit平台的用户评论数据,记录了Reddit论坛上用户之间的互动和讨论内容。主要特征如下:... -
英印双语词汇数据集2023英印双语词汇数据集2023-tihsrahly
英印双语词汇数据集2023英印双语词汇数据集2023-tihsrahly 数据来源:互联网公开数据 标签:英印双语,词汇,数据集,语言学,自然语言处理,机器翻译,教育,多语言学习 数据概述:该数据集包含英印双语词汇数据,记录了英语和印地语词汇的对应关系及相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2023年。...