-
孟加拉文图形字符预训练权重数据集BanglaGraphemesPretrainedWeightsDataset-shawon10
孟加拉文图形字符预训练权重数据集BanglaGraphemesPretrainedWeightsDataset-shawon10 数据来源:互联网公开数据 标签:计算机视觉,字符识别,深度学习,预训练模型,自然语言处理,机器学习,Bangla语言,多语种处理 数据概述:... -
YouTube评论训练数据集YouTubeCommentTrainDataset-chintadasrinivasa
YouTube评论训练数据集YouTubeCommentTrainDataset-chintadasrinivasa 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,自然语言处理,情感分析,机器学习,文本挖掘,数据科学 数据概述:该数据集包含来自YouTube平台的评论数据,记录了用户对视频内容的反馈和观点。主要特征如下:... -
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero
社交媒体平台ChatGPT相关话题讨论数据集SocialMediaChatGPTTopicDiscussionDataset-monserratromero 数据来源:互联网公开数据 标签:ChatGPT, 社交媒体, 文本分析, 自然语言处理, 情感分析, 话题挖掘, 人工智能, 机器学习 数据概述:... -
图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj
图像描述文本嵌入数据集ImageDescriptionTextEmbeddingDataset-shrinidhikj 数据来源:互联网公开数据 标签:图像描述, 文本嵌入, 计算机视觉, 自然语言处理, 图像检索, 语义分析, 深度学习, 多模态 数据概述:... -
文本生成与标题创建数据集FLAN-T5-Small512-TitleDatasets-terrychanorg
文本生成与标题创建数据集FLAN-T5-Small512-TitleDatasets-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本生成,标题创建,机器学习,深度学习,数据集,语言模型,人工智能 数据概述:... -
亚马逊手机评论数据集AmazonCellPhonesReviewsDataset-liviovona24
亚马逊手机评论数据集AmazonCellPhonesReviewsDataset-liviovona24 数据来源:互联网公开数据 标签:手机评论,电商,用户评价,情感分析,自然语言处理,文本挖掘,机器学习,产品分析 数据概述: 该数据集包含来自亚马逊平台的手机产品评论数据,记录了用户对手机产品的评价和反馈。主要特征如下:... -
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:... -
电子邮件钓鱼检测数据集-dhruvagarwal433
电子邮件钓鱼检测数据集-dhruvagarwal433 数据来源:互联网公开数据 标签:电子邮件,钓鱼检测,网络安全,机器学习,自然语言处理,文本分析,恶意软件,欺诈 数据概述: 该数据集包含了用于电子邮件钓鱼检测的数据,旨在帮助研究人员和安全专家开发和评估钓鱼邮件的识别技术。主要特征如下:... -
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia
布拉斯-数字图书馆数据集Bolsa-DLDataset-luisandresgarcia 数据来源:互联网公开数据 标签:数字图书馆,数据集,文本分析,信息检索,机器学习,学术资源,自然语言处理,知识管理 数据概述: 该数据集包含来自布拉斯-数字图书馆(Bolsa-DL)的文本数据,记录了该数字图书馆中的学术文献和书籍信息。主要特征如下:... -
魔法提示生成数据集MagicPrompt-1MDataset-leonidkulyk
魔法提示生成数据集MagicPrompt-1MDataset-leonidkulyk 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,人工智能,语言模型,机器学习,文本生成,深度学习 数据概述: 该数据集包含来自多个来源的文本数据,记录了用于生成魔法提示的文本样本。主要特征如下: 时间跨度:数据记录的时间范围为最近一年。... -
医学推文情感分析数据集Tweets-MedDataset-milanezeus
医学推文情感分析数据集Tweets-MedDataset-milanezeus 数据来源:互联网公开数据 标签:医学,推文,情感分析,社交媒体,NLP,自然语言处理,情感识别,文本挖掘 数据概述: 该数据集包含来自Twitter的医学相关推文数据,记录了用户在社交媒体上对医疗健康话题的讨论和观点。主要特征如下:... -
表格转文本生成数据集GoogleTottoDataset-aishikai
表格转文本生成数据集GoogleTottoDataset-aishikai 数据来源:互联网公开数据 标签:自然语言处理,表格数据,文本生成,机器学习,数据集,信息抽取,深度学习,语义理解 数据概述: 该数据集由Google Totto项目提供,专注于表格数据向自然语言文本的转换。主要特征如下:... -
印尼新闻文本数据集IndonesianNewsTextDataset-rizkia14
印尼新闻文本数据集IndonesianNewsTextDataset-rizkia14 数据来源:互联网公开数据 标签:新闻文本,数据集,自然语言处理,印尼语,机器学习,文本分析,数据挖掘,信息处理 数据概述: 该数据集包含来自印尼新闻网站和媒体平台的新闻文本数据,记录了印尼各领域的新闻报道。主要特征如下:... -
比特币及相关论坛帖子数据集Bitcoin和Reddit-rBitcoin帖子数据集-underdog7890
比特币及相关论坛帖子数据集Bitcoin和Reddit-rBitcoin帖子数据集-underdog7890 数据来源:互联网公开数据 标签:比特币,数据集,社交媒体,论坛分析,市场趋势,自然语言处理,区块链,金融分析... -
书籍作者作品信息数据集BookAuthorWorkInformation-nico404
书籍作者作品信息数据集BookAuthorWorkInformation-nico404 数据来源:互联网公开数据 标签:书籍, 作者, 作品, 文学, 文本分析, 自然语言处理, 数据挖掘, 古腾堡项目 数据概述: 该数据集包含来自古腾堡项目的数据,记录了书籍的作者及其作品信息。主要特征如下: 时间跨度:数据未明确时间范围,可视为静态书籍信息。... -
语音转录文本数据分析数据集SpeechTranscriptionTextDataAnalysis-liumail511
语音转录文本数据分析数据集SpeechTranscriptionTextDataAnalysis-liumail511 数据来源:互联网公开数据 标签:语音识别, 文本转录, Whisper模型, 语音分析, 文本校对, 数据清洗, 声学模型, 自然语言处理 数据概述:... -
文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv
文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 嵌入向量, 深度学习, 自然语言处理, 模型训练, 情感分析, 机器学习 数据概述: 该数据集包含用于训练和评估文本毒性分类模型的嵌入向量数据。主要特征如下:... -
电影剧本数据分析集MovieScriptDataset-saurabh502
电影剧本数据分析集MovieScriptDataset-saurabh502 数据来源:互联网公开数据 标签:电影剧本,数据分析,文本挖掘,自然语言处理,电影研究,剧本写作,文学分析,文化产业 数据概述: 该数据集包含来自多个来源的电影剧本数据,记录了多部电影的剧本内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba 数据来源:互联网公开数据 标签:英语写作, 文本分析, 可读性评估, 写作质量, 自然语言处理, 机器学习, 文本特征, 语言模型 数据概述:... -
Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat
Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,恶意内容检测,数据集,Quora,深度学习,情感分析,NLP 数据概述: 该数据集来自Jigsaw...