-
特征BERT嵌入数据集FeatureBERTEmbeddingsDataset-honglyu
特征BERT嵌入数据集FeatureBERTEmbeddingsDataset-honglyu 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,特征嵌入,数据集,深度学习,文本分析,机器学习,语义理解 数据概述: 该数据集包含使用BERT模型生成的文本特征嵌入数据,记录了文本输入在BERT模型中的特征表示。主要特征如下:... -
社交媒体用户个性化描述关键词提取数据集SocialMediaUserBioKeywordExtractionDataset-sagu123
社交媒体用户个性化描述关键词提取数据集SocialMediaUserBioKeywordExtractionDataset-sagu123 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 关键词提取, 自然语言处理, 情感分析, 机器学习, Tinder, 数据标注 数据概述:... -
新闻故事积极内容分析数据集NewsStoriesPositiveContentAnalysis-vitalychait
新闻故事积极内容分析数据集NewsStoriesPositiveContentAnalysis-vitalychait 数据来源:互联网公开数据 标签:新闻, 积极内容, 文本分析, 情感分析, 故事, 爬虫, 文本挖掘, 自然语言处理 数据概述: 该数据集包含来自Good News... -
推特平台政治党派倾向性分析数据集PoliticalPartisanshipTweetsDataset-lingshuhu
推特平台政治党派倾向性分析数据集PoliticalPartisanshipTweetsDataset-lingshuhu 数据来源:互联网公开数据 标签:政治,党派,推特,社交媒体,文本分析,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自推特平台的推文数据,用于分析用户的政治党派倾向性。主要特征如下:... -
博客分类数据集BlogsClassificationDataset-atharvpatawar
博客分类数据集BlogsClassificationDataset-atharvpatawar 数据来源:互联网公开数据 标签:博客,分类,数据集,自然语言处理,文本分析,机器学习,信息检索,文本挖掘 数据概述:该数据集包含来自多个来源的博客文章数据,记录了各类博客的内容及其对应的分类标签。主要特征如下:... -
电商平台商品评论数据集ImportedAllFiles-E-commerceProductReviewsDataset-debdootmanna
电商平台商品评论数据集ImportedAllFiles-E-commerceProductReviewsDataset-debdootmanna 数据来源:互联网公开数据 标签:电商,商品评论,文本分析,情感分析,自然语言处理,机器学习,用户行为,数据挖掘 数据概述:... -
印尼电商平台商品分类数据集TokopediaProductCategoriesDataset-bintangfajarjulio
印尼电商平台商品分类数据集TokopediaProductCategoriesDataset-bintangfajarjulio 数据来源:互联网公开数据 标签:电商,商品分类,数据集,印尼,自然语言处理,机器学习,文本分析,商品推荐 数据概述:... -
药物信息与不良反应数据集DrugInformationandAdverseReactionDataset-wanjinodou
药物信息与不良反应数据集DrugInformationandAdverseReactionDataset-wanjinodou 数据来源:互联网公开数据 标签:药物信息, 不良反应, 药理学, 药物数据库, 临床试验, 安全性评估, 文本分析, 医疗健康 数据概述:... -
假新闻检测新闻数据集FakeNewsDetectionNewsDataset-karthikeyanmsk
假新闻检测新闻数据集FakeNewsDetectionNewsDataset-karthikeyanmsk 数据来源:互联网公开数据 标签:假新闻,新闻检测,数据集,自然语言处理,机器学习,信息验证,文本分析,虚假信息 数据概述:... -
数据2020-2021年Lentaru新闻报道数据集LentaruNewsArticlesDataset2020-2021-nmaria
2020-2021年Lentaru新闻报道数据集LentaruNewsArticlesDataset2020-2021-nmaria 数据来源:互联网公开数据 标签:新闻内容,数据集,文本分析,机器学习,自然语言处理,信息提取,媒体研究,趋势分析 数据概述: 该数据集包含来自 Lentaru... -
Kiva信贷项目文本数据集-antonimendez97
Kiva信贷项目文本数据集-antonimendez97 数据来源:互联网公开数据 标签:普惠金融,信贷,文本分析,自然语言处理,数据集,风险评估,社会影响,机器学习 数据概述: 该数据集包含了Kiva.org平台上信贷项目的文本描述信息,记录了借款人的详细介绍、贷款用途、项目描述等。主要特征如下:... -
大型语言模型性能测试数据集LLMPerformanceInstanceTestDataset-datasontran
大型语言模型性能测试数据集LLMPerformanceInstanceTestDataset-datasontran 数据来源:互联网公开数据 标签:大型语言模型,性能测试,数据集,自然语言处理,机器学习,模型评估,人工智能,文本分析 数据概述:该数据集包含来自公开数据源的测试样本,用于评估大型语言模型的性能。主要特征如下:... -
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:... -
诗歌创作与分析数据集PoemsData-lisaameliewittmann
诗歌创作与分析数据集PoemsData-lisaameliewittmann 数据来源:互联网公开数据 标签:诗歌,数据集,自然语言处理,文本分析,情感分析,文学研究,创作,NLP 数据概述: 该数据集包含了来自互联网的各类诗歌作品,旨在为诗歌创作与分析提供数据支持。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了从古代到现代的诗歌作品。... -
金融市场情绪指标分析数据集FinancialMarketSentimentIndicatorAnalysis-seongyeopchoi
金融市场情绪指标分析数据集FinancialMarketSentimentIndicatorAnalysis-seongyeopchoi 数据来源:互联网公开数据 标签:金融市场, 情绪分析, 市场指标, 文本分析, 情感分析, 市场预测, 数据挖掘, 交易策略 数据概述:... -
Windows系统注释数据集-luckyrxy
Windows系统注释数据集-luckyrxy 数据来源:互联网公开数据 标签:Windows,操作系统,数据集,注释,软件工程,文本分析,自然语言处理,信息检索 数据概述: 该数据集包含Windows操作系统相关的注释信息,旨在提供关于Windows系统功能、代码、API等的详细描述。主要特征如下:... -
电影对白关系数据集FLMPairsDataset-himanshunayal
电影对白关系数据集FLMPairsDataset-himanshunayal 数据来源:互联网公开数据 标签:电影,对白,关系,自然语言处理,文本分析,数据集,语义分析,机器学习 数据概述: 该数据集包含了电影对白配对数据,旨在研究电影对白之间的关系。主要特征如下: 时间跨度:数据涵盖了不同年份上映的电影。 地理范围:数据来源于全球电影作品。... -
虚假与真实新闻分类数据集PreprocessedFakeandRealNewsDataset-bhuvanagayathri
虚假与真实新闻分类数据集PreprocessedFakeandRealNewsDataset-bhuvanagayathri 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息辨别,深度学习,数据分析 数据概述: 该数据集包含经过预处理的虚假与真实新闻文本数据,记录了新闻文章的文本内容及其标签。主要特征如下:... -
句子嵌入模型数据集SBERTModelDataset-piyu2397
句子嵌入模型数据集SBERTModelDataset-piyu2397 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义相似度,深度学习,文本嵌入,语义理解 数据概述: 该数据集包含用于训练和评估句子嵌入模型(SBERT, 句子-BERT)的数据,记录了文本句子的嵌入向量及其相关属性。主要特征如下:... -
加密货币情感分析数据集CleanedCryptoSentimentAnalysisDataset-goddiao
加密货币情感分析数据集CleanedCryptoSentimentAnalysisDataset-goddiao 数据来源:互联网公开数据 标签:加密货币,情感分析,数据集,文本分析,自然语言处理,金融科技,社交媒体,市场情绪 数据概述: 该数据集包含了从社交媒体平台(如Twitter)收集的关于加密货币的文本数据,并进行了情感分析。主要特征如下:...