-
Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi
Kaggle技能评估挑战数据集KaggleSkillAssessmentChallengeDataset-viveksomvanshi 数据来源:互联网公开数据 标签:技能评估,数据集,自然语言处理,文本分析,机器学习,人才评估,职业发展,知识图谱... -
社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala
社交媒体领导推文数据集LeaderTweetsDataset-mariasandalwala 数据来源:互联网公开数据 标签:社交媒体,领导推文,数据集,文本分析,自然语言处理,社会学研究,政治分析,公众意见 数据概述:该数据集包含来自不同社交媒体平台的领导推文,记录了全球各地领导人在社交媒体上的发言内容。主要特征如下:... -
新冠疫情快速响应聊天机器人数据集COVID-19RapidResponseAgentChatbotDataset-nelakurthisudheer
新冠疫情快速响应聊天机器人数据集COVID-19RapidResponseAgentChatbotDataset-nelakurthisudheer 数据来源:互联网公开数据 标签:新冠疫情,聊天机器人,数据集,自然语言处理,问答系统,医疗健康,人工智能,疫情应对 数据概述:... -
NetflixTwitter帖子情感分析与语言模型训练数据集2024年-tomthescientist
NetflixTwitter帖子情感分析与语言模型训练数据集2024年-tomthescientist 数据来源:互联网公开数据 标签:Netflix,推特,情感分析,自然语言处理,公众意见,趋势研究,LLM,数据集 数据概述:... -
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-saimalam 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分析,机器学习,乌尔都语,社交媒体,学术研究 数据概述:该数据集包含来自社交媒体平台的罗马乌尔都语文本数据,记录了用户的评论和意见,适用于情感分析任务。主要特征如下:... -
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin
世界新闻页面数据分析集TRTHaberWorldforNewsPagesData-denizhanahin 数据来源:互联网公开数据 标签:新闻页面,数据集,文本分析,自然语言处理,全球新闻,媒体研究,信息提取,社会学研究 数据概述:该数据集包含来自土耳其广播电视台TRT Haber的全球新闻页面数据,记录了世界范围内的新闻报道内容。主要特征如下:... -
科研文章主题建模分析数据集-独立日机器学习黑客松2020-aswathrao
科研文章主题建模分析数据集-独立日机器学习黑客松2020-aswathrao 数据来源:互联网公开数据 标签:机器学习,自然语言处理,主题建模,科研文章,文本分析,计算机科学,物理学,数学,统计学,生物学,金融学 数据概述:... -
大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer
大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源:互联网公开数据 标签:大语言模型,提示恢复,数据集,自然语言处理,机器学习,人工智能,文本生成,对话系统 数据概述:该数据集包含用于大语言模型提示恢复的文本数据,记录了原始提示和相应的恢复提示。主要特征如下:... -
知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy
知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy 数据来源:互联网公开数据 标签:知识库,数据集,信息检索,自然语言处理,人工智能,机器学习,语义网,知识图谱 数据概述: 该数据集包含用于知识库构建与应用的多领域结构化数据,记录了各类实体,属性及关系信息。主要特征如下: 时间跨度:... -
西班牙国会发言标点检测数据集
西班牙国会发言标点检测数据集 数据来源:互联网公开数据 标签:西班牙国会,标点符号检测,自然语言处理,文本分析,语料库,语法结构,语言模型,文本分类 数据概述: 本数据集收录了2011年至2020年间西班牙国会议员的完整发言记录,按发言人分段整理。每句话被拆分为单个单词,并根据以下标准进行分类: 1.... -
文本处理测试数据集-sandeep100joshi
文本处理测试数据集-sandeep100joshi 数据来源:互联网公开数据 标签:文本处理,测试,数据集,自然语言处理,机器学习,文本分析,数据清洗,模型评估 数据概述: 该数据集包含用于文本处理任务的测试数据,记录了各种文本信息。主要特征如下: 时间跨度: 数据记录的时间范围不限,主要关注文本内容本身。 地理范围:... -
产品关键词生成数据集-sarafrancic
产品关键词生成数据集-sarafrancic 数据来源:互联网公开数据 标签:产品,关键词,生成,文本分析,自然语言处理,机器学习,搜索引擎优化,市场营销 数据概述:该数据集包含从各种来源收集的产品描述和相应的关键词,用于训练和评估关键词生成模型。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。 地理范围:数据来源广泛,涵盖全球市场。... -
情绪文本数据集EmotionsCleanTextDataset-markta186
情绪文本数据集EmotionsCleanTextDataset-markta186 数据来源:互联网公开数据 标签:情绪分析,文本数据,数据集,自然语言处理,情感识别,机器学习,心理学,社会研究 数据概述: 该数据集包含经过清洗和标注的情绪文本数据,记录了不同情绪状态下的文本描述。主要特征如下:... -
邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan
邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。... -
书籍推荐系统数据集BooksRecommendationDataset-vincentkohm
书籍推荐系统数据集BooksRecommendationDataset-vincentkohm 数据来源:互联网公开数据 标签:书籍推荐,数据集,用户行为,机器学习,自然语言处理,用户画像,算法模型,个性化推荐 数据概述:该数据集包含来自多个在线书籍平台的用户行为数据,记录了用户的书籍阅读和推荐历史。主要特征如下:... -
新闻聚合平台用户行为数据集-overvisual
新闻聚合平台用户行为数据集-overvisual 数据来源:互联网公开数据 标签:新闻聚合,用户行为,数据集,推荐系统,自然语言处理,点击预测,用户画像,数据分析 数据概述: 该数据集包含来自新闻聚合平台的用户行为数据,记录了用户在平台上的浏览,点击,分享等交互行为。主要特征如下: 时间跨度:数据记录的时间范围为一段时间,具体起止时间未明确。... -
点击诱饵内容识别数据集ClickbaitDataset-arkyabagchi
点击诱饵内容识别数据集ClickbaitDataset-arkyabagchi 数据来源:互联网公开数据 标签:内容识别,数据集,自然语言处理,文本分类,机器学习,信息传播,媒体分析,广告技术 数据概述: 该数据集包含来自互联网公开渠道的文本内容数据,记录了用于识别和分类“点击诱饵”内容的样本。主要特征如下:... -
食谱生成数据集RecipeGenerationDataset-thakkarhiren
食谱生成数据集RecipeGenerationDataset-thakkarhiren 数据来源:互联网公开数据 标签:食谱,菜谱,烹饪,数据集,自然语言处理,文本生成,机器学习,菜品推荐 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的制作方法和相关信息。主要特征如下: 时间跨度:数据记录的时间范围不限,覆盖了不同年代和地区的菜谱。... -
情绪符号情感分析数据集-2015-thomasseleck
情绪符号情感分析数据集-2015-thomasseleck 数据来源:互联网公开数据 标签:情绪符号,情感分析,社交媒体,机器学习,自然语言处理,多语言,人类标注,科研 数据概述: 本数据集包含751个情绪符号及其自动分配的情感评分。情感评分是基于来自70,000条推文的分析得出的,这些推文由83位人类标注者在13种欧洲语言中进行标注。... -
WebGPT与OpenAI模型性能对比数据集
WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:...