-
Kaggle反馈竞赛修正训练集-文本标注数据集
Kaggle反馈竞赛修正训练集-文本标注数据集 数据来源:互联网公开数据 标签:文本分析,自然语言处理,标注数据,竞赛,反馈,文本纠错,机器学习,NLP 数据概述: 本数据集是针对Kaggle反馈竞赛(Feedback... -
GitHub问题预测挑战赛问题类型预测数据集
GitHub问题预测挑战赛问题类型预测数据集 数据来源:互联网公开数据 标签:GitHub,问题预测,文本分类,自然语言处理,机器学习,代码缺陷,软件开发,NLP,BERT 数据概述:... -
KaggleLLM科学考试-GPT辅助作答数据集
KaggleLLM科学考试-GPT辅助作答数据集 数据来源:互联网公开数据 标签:大型语言模型,LLM,科学考试,自然语言处理,NLP,数据集,Kaggle,考试,竞赛,GPT,人工智能 数据概述: 本数据集专为Kaggle... -
-
患者医生问答土耳其语数据集
患者医生问答土耳其语数据集 数据来源:互联网公开数据 标签:患者医生问答,土耳其语,医学研究,自然语言处理,NLP,医学教育,医疗沟通 数据概述:... -
泰卢固语新闻文本数据集-语言模型训练-合并数据集
泰卢固语新闻文本数据集-语言模型训练-合并数据集 数据来源:互联网公开数据 标签:泰卢固语,新闻,文本,语言模型,自然语言处理,NLP,机器学习,语料库,文本数据 数据概述: 本数据集由原始泰卢固语新闻数据合并的训练集和测试集构成,整合了来自不同来源的泰卢固语新闻文章。数据集包含丰富的新闻文本内容,涵盖了各种主题和风格。 数据用途概述:... -
艾森民歌数据库MIDI转换与标记化数据集
艾森民歌数据库MIDI转换与标记化数据集 数据来源:互联网公开数据 标签:音乐信息检索,民歌,MIDI,标记化,音乐分析,文本生成,NLP,艾森民歌数据库 数据概述: 本数据集包含约8500个.mid音乐文件,这些文件是源自艾森民歌数据库(Essen Folksong Database,KernScores... -
Alpaca编程风格代码生成指令数据集
Alpaca编程风格代码生成指令数据集 数据来源:互联网公开数据 标签:代码生成,编程风格,Alpaca,自然语言处理,机器学习,风格迁移,代码转换,NLP 数据概述:... -
IMDbTop250电视剧用户评论与评分数据集-2024
IMDbTop250电视剧用户评论与评分数据集-2024 数据来源:互联网公开数据 标签:IMDb, 电视剧, 评论, 评分, 用户评价, NLP, 自然语言处理, 情感分析, 文本挖掘 数据概述: 本数据集收录了截至2024年IMDb Top... -
斯瓦希里语新闻分类数据集
斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:... -
Twitter社交媒体情感分析数据集
Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:... -
亚马逊服饰推荐系统数据集
亚马逊服饰推荐系统数据集 数据来源:互联网公开数据 标签:服饰推荐,亚马逊,NLP,深度学习,图像识别,产品推荐,电子商务 数据概述: 本数据集包含了亚马逊平台上服饰产品的详细信息,包括产品描述、用户行为数据、历史推荐记录以及相关文本和图像数据。数据集旨在为研究和开发服饰推荐系统提供基础支持,帮助优化推荐算法,提升用户购物体验。 数据用途概述:... -
IWSLT2017英语-中文翻译数据集
IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging... -
基于GPT-2生成的灾难推文数据集
基于GPT-2生成的灾难推文数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,灾难推文,数据增强,GPT-2,文本生成 数据概述:... -
网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用
网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-... -
印度象棋策略书籍文本与游戏数据集1963-2021
印度象棋策略书籍文本与游戏数据集1963-2021 数据来源:互联网公开数据 标签:国际象棋,策略书籍,NLP,文本分析,游戏分析,主题建模,文档聚类,文本生成 数据概述: 本数据集收录了国际象棋大师Edward... -
开放域问答数据集-问题与答案-2023年
开放域问答数据集-问题与答案-2023年 数据来源:互联网公开数据 标签:问答,自然语言处理,NLP,文本数据,QA,问题解答,知识库,语言模型,机器学习 数据概述: 本数据集包含大量的问题与答案对,旨在为开放域问答(QA, Question... -
动漫数据集适用于NLP项目
动漫数据集适用于NLP项目 数据来源:互联网公开数据 标签:动漫,推荐系统,NLP,文本分析,数据挖掘,自然语言处理,娱乐分析 数据概述: 本数据集主要用于构建著名的动漫推荐系统——Anime Odyssey。数据集涵盖了丰富的动漫信息,包括但不限于动漫名称、简介、类型、评分、评论等内容,为自然语言处理和文本分析提供了宝贵的数据资源。 数据用途概述:... -
Kaggle文本数据竞赛优胜方案分析数据集-2021-2023
Kaggle文本数据竞赛优胜方案分析数据集-2021-2023 数据来源:互联网公开数据 标签:Kaggle,文本数据,竞赛,机器学习,自然语言处理,NLP,解决方案,深度学习,模型,算法,优化器,集成,数据分析 数据概述: 本数据集收录了2021年至2023年间9个Kaggle文本数据竞赛中,每个竞赛前三名优胜方案的详细分析。... -
马鲁蒂铃木员工评价数据集1963-2021
马鲁蒂铃木员工评价数据集1963-2021 数据来源:互联网公开数据 标签:马鲁蒂铃木,员工评价,工作环境,公司文化,职业发展,工作生活平衡,数据分析,情感分析,NLP,人力资源 数据概述: 本数据集汇集了马鲁蒂铃木(印度一家跨国汽车制造公司)员工在Ambition Box平台上分享的宝贵见解。Ambition...