-
歌词生成与自然语言处理数据集LyricsNanogptDataset-razaali10
歌词生成与自然语言处理数据集LyricsNanogptDataset-razaali10 数据来源:互联网公开数据 标签:自然语言处理,歌词生成,数据集,文本分析,机器学习,深度学习,语言模型,文本生成 数据概述: 该数据集包含来自多个来源的歌词数据,记录了不同风格和类型的歌词文本。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
阿拉伯语翻译数据集TranslationtoArabicDataset-elemam
阿拉伯语翻译数据集TranslationtoArabicDataset-elemam 数据来源:互联网公开数据 标签:语言翻译,数据集,机器学习,自然语言处理,多语言,阿拉伯语,文本分析,人工智能 数据概述: 该数据集包含从多种语言翻译到阿拉伯语的文本数据,主要记录了不同语言到阿拉伯语的翻译样本。主要特征如下:... -
电影与相机产品属性关联分析数据集Movie-CameraProductAttributeCorrelationAnalysis-rimasalshehri
电影与相机产品属性关联分析数据集Movie-CameraProductAttributeCorrelationAnalysis-rimasalshehri 数据来源:互联网公开数据 标签:电影数据, 电影属性, 相机数据, 相机参数, 数据关联, 文本分析, 机器学习, 行业分析 数据概述:... -
数学竞赛试题与答案数据集MathCompetitionProblemsandAnswers-konstantinboyko
数学竞赛试题与答案数据集MathCompetitionProblemsandAnswers-konstantinboyko 数据来源:互联网公开数据 标签:数学竞赛, 试题, 答案, AIME, IMO, 文本分析, 数学教育, 数据集 数据概述: 该数据集包含来自数学竞赛的试题及其对应的解答,旨在为研究人员和学生提供学习和分析的资源。主要特征如下:... -
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-sunidhiprakash
学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-sunidhiprakash 数据来源:互联网公开数据 标签:文本分析, 学术研究, 自然语言处理, 论文摘要, 机器学习, 文本摘要, 计算机科学, 金融工程 数据概述:... -
视频字幕过滤数据集SubtitleFilteredDataset-hooong
视频字幕过滤数据集SubtitleFilteredDataset-hooong 数据来源:互联网公开数据 标签:字幕,视频,文本分析,自然语言处理,数据集,内容过滤,机器学习,数据清洗 数据概述: 该数据集包含经过筛选和过滤的视频字幕数据,旨在用于文本分析、内容过滤和自然语言处理任务。主要特征如下:... -
Airbnb房源与评论数据集AirbnbListingsandReviewsDataset-rahimzulfiqarali
Airbnb房源与评论数据集AirbnbListingsandReviewsDataset-rahimzulfiqarali 数据来源:互联网公开数据 标签:住宿服务,旅游行业,数据集,用户评论,机器学习,数据挖掘,文本分析,旅游经济 数据概述:... -
查询扩展技术数据集QueryExpansionDataset-fallzqm
查询扩展技术数据集QueryExpansionDataset-fallzqm 数据来源:互联网公开数据 标签:信息检索,查询扩展,数据集,自然语言处理,机器学习,搜索引擎,文本分析,人工智能 数据概述: 该数据集专注于查询扩展技术,记录了用户查询及其扩展后的相关查询信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
虚假新闻预处理数据集-gongjunmin
虚假新闻预处理数据集-gongjunmin 数据来源:互联网公开数据 标签:虚假新闻,文本分析,自然语言处理,数据集,机器学习,新闻分类,信息检索,舆情分析 数据概述: 该数据集包含了经过预处理的虚假新闻数据,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖近年来新闻报道。... -
学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92
学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器学习, 自然语言处理, 文本分析, 情感分析, 教育, 写作风格 数据概述:... -
维基百科电影数据与互联网电影数据库IMDb信息关联数据集-takanami
维基百科电影数据与互联网电影数据库IMDb信息关联数据集-takanami 数据来源:互联网公开数据 标签:电影,维基百科,IMDb,数据集,文本分析,信息检索,数据挖掘,关联分析 数据概述: 该数据集整合了维基百科电影条目信息和互联网电影数据库(IMDb)数据,记录了电影的详细信息及其关联。主要特征如下: 时间跨度:... -
Reddit问答社区帖子数据集AskRedditDataset-gaganagarwal77
Reddit问答社区帖子数据集AskRedditDataset-gaganagarwal77 数据来源:互联网公开数据 标签:问答社区,数据集,社交媒体,文本分析,自然语言处理,机器学习,网络行为,数据挖掘 数据概述:... -
堤坝巡查与管理文本数据集LeveePatrolandManagementTextDataset-ictworld
堤坝巡查与管理文本数据集LeveePatrolandManagementTextDataset-ictworld 数据来源:互联网公开数据 标签:堤坝, 巡查, 管理, 水利, 文本分析, 自然语言处理, 越南语, 法规文件, 风险管理 数据概述: 该数据集包含来自越南相关法规文件的文本数据,记录了关于堤坝巡查与管理的相关规定和指导方针。主要特征如下:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 摘要生成, 标题生成, 文本摘要, 机器学习, 语料库 数据概述: 该数据集包含来自新闻网站的摘要信息,记录了新闻标题和对应的文本正文。主要特征如下:... -
商品信息描述与价格预测数据集ProductInformationDescription-PricePrediction-yashasvikhandelwal
商品信息描述与价格预测数据集ProductInformationDescription-PricePrediction-yashasvikhandelwal 数据来源:互联网公开数据 标签:商品描述, 价格预测, 文本分析, 机器学习, 电商, 商品分类, 自然语言处理, 数据挖掘 数据概述:... -
主成分分析与词向量数据集PCA与词向量数据集-heitorbaldo
主成分分析与词向量数据集PCA与词向量数据集-heitorbaldo 数据来源:互联网公开数据 标签:主成分分析,词向量,数据集,自然语言处理,机器学习,文本分析,数据降维,人工智能 数据概述: 该数据集来源于公开的自然语言处理资源,主要记录了通过主成分分析(PCA)降维后的词向量数据,适用于词向量的降维分析、文本分类等任务。主要特征如下:... -
BERT模型测试数据集BERTDataTestDataset-vha20020362
BERT模型测试数据集BERTDataTestDataset-vha20020362 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,语言模型,深度学习,人工智能 数据概述: 该数据集包含用于测试BERT模型性能的文本数据,记录了各种类型的文本样本及其标签。主要特征如下: 时间跨度:数据记录的时间范围为当前年份。... -
手机与驾驶安全文本分析数据集MobilePhoneandDrivingSafetyTextAnalysis-gmhost
手机与驾驶安全文本分析数据集MobilePhoneandDrivingSafetyTextAnalysis-gmhost 数据来源:互联网公开数据 标签:手机使用, 驾驶安全, 文本分析, 事故风险, 自然语言处理, 舆情分析, 风险评估, 语料库 数据概述:... -
无监督假新闻与真新闻识别数据集UnsupervisedFakeandRealNewsDataset-soheybfarohe
无监督假新闻与真新闻识别数据集UnsupervisedFakeandRealNewsDataset-soheybfarohe 数据来源:互联网公开数据 标签:假新闻,真新闻,数据集,文本分析,无监督学习,机器学习,新闻学,信息科学 数据概述:该数据集包含来自互联网的假新闻和真新闻文章,适用于无监督学习和新闻真实性检测任务。主要特征如下:... -
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:...