-
印度尼西亚新闻标题数据集1963-2021-ibamibrahim
印度尼西亚新闻标题数据集1963-2021-ibamibrahim 数据来源:互联网公开数据 标签:印尼新闻,新闻标题,数据集,NLP,文本分析,分类,数据科学 数据概述: 本数据集收录了超过90,000条来自印尼最大新闻门户网站detik.com的印尼新闻标题。数据集旨在丰富印尼自然语言处理(NLP)领域的资源,非常适合初学者开始处理真实世界数据。... -
虚假新闻检测文本分类数据集-2023-pnkjgpt
虚假新闻检测文本分类数据集-2023-pnkjgpt 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,数据竞赛,数据集,训练集,测试集,机器学习 数据概述:... -
土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15
土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15 数据来源:互联网公开数据 标签:情感分析,NLP,土耳其语,电影评论,用户反馈,数据集,交叉语言分析,机器翻译,数据科学 数据概述:... -
英语-孟加拉语多元化翻译数据集-2023年-golammostofas
英语-孟加拉语多元化翻译数据集-2023年-golammostofas 数据来源:互联网公开数据 标签:英语,孟加拉语,翻译,自然语言处理,NLP,对话生成,文化分析,机器翻译,多语言研究 数据概述:... -
土耳其社交网站Instela用户内容分析数据集-2023-sukruccc
土耳其社交网站Instela用户内容分析数据集-2023-sukruccc 数据来源:互联网公开数据 标签:社交网络,用户生成内容,NLP,土耳其,数据分析,内容评分,用户行为 数据概述:... -
阿塞拜疆语医学问答数据集-医疗问题分类-m-tibb-az-2024-natigmamishov
阿塞拜疆语医学问答数据集-医疗问题分类-m-tibb-az-2024-natigmamishov 数据来源:互联网公开数据 标签:医学,问答,阿塞拜疆语,医疗分类,自然语言处理,机器学习,医疗健康,NLP,QA,m.tibb.az 数据概述:... -
印度教育与通信数据集-2021-kumar234
印度教育与通信数据集-2021-kumar234 数据来源:互联网公开数据 标签:印度,教育,通讯,数据集,NLP,聊天机器人,数据分析,用户界面 数据概述:... -
女性电商服装评论数据集2021-nhiyen
女性电商服装评论数据集2021-nhiyen 数据来源:互联网公开数据 标签:电商,服装,评论,自然语言处理,特征工程,情感分析,NLP,多变量分析 数据概述:... -
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151 数据来源:互联网公开数据 标签:机器翻译,NLP,自然语言处理,翻译,英语,马拉地语,seq2seq,神经机器翻译,数据集 数据概述:... -
Open-Assistant多轮对话波斯语翻译数据集
Open-Assistant多轮对话波斯语翻译数据集 数据来源:互联网公开数据 数据集简介: 本数据集为 Open-Assistant... -
印度顶尖院校入学考试学生疑问数据集-mrutyunjaybiswal
印度顶尖院校入学考试学生疑问数据集-mrutyunjaybiswal 数据来源:互联网公开数据 标签:IITJEE, NEET, AIIMS, 学生疑问, 教育, 竞争考试, 问题分类, NLP 数据概述: 本数据集包含了印度顶尖院校入学考试(如JEE Advanced, JEE Mains,... -
Reddit以太坊立场评论数据集-malteadrianmeng
Reddit以太坊立场评论数据集-malteadrianmeng 数据来源:互联网公开数据 标签:Reddit,以太坊,立场分析,NLP,清华大学,用户评论,数据标注 数据概述: 本数据集包含从Reddit评论中提取并标注的以太坊相关立场评论。数据集分为两部分: SEthB:包含772条标注的评论,由三名独立的标注者分别进行标注。... -
英语-马拉雅拉姆语言翻译数据集-nihalthomas15
英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:... -
自然语言处理最新基准测试数据集-2023-mauromauro
自然语言处理最新基准测试数据集-2023-mauromauro 数据来源:互联网公开数据 标签:NLP,基准测试,机器学习,数据集,科研,教育,PapersWithCode 数据概述: 本数据集包含自然语言处理任务的基准测试数据集记录,每个记录由模型-指标-日期三元组组成。数据来源于Papers With... -
健康症状与疾病预测数据集-devikshah
健康症状与疾病预测数据集-devikshah 数据来源:互联网公开数据 标签:健康,疾病预测,症状,机器学习,医疗诊断,疾病,数据分析,NLP,医学 数据概述: 本数据集名为“training.csv”,是一个综合性的健康相关症状与潜在疾病的对应集合。数据集旨在帮助构建基于症状的疾病预测机器学习模型,支持健康研究、诊断和应用开发。 字段描述:... -
阿萨姆语新闻文章数据集-新闻标题与正文-新闻18-东北现在--krishnabhdas
阿萨姆语新闻文章数据集-新闻标题与正文-新闻18-东北现在--krishnabhdas 数据来源:互联网公开数据 标签:阿萨姆语,新闻,文章,标题,正文,新闻18,东北现在,文本数据,自然语言处理,NLP 数据概述:... -
车辆保险客户反馈情感分析数据集-2023-stevemartin0
车辆保险客户反馈情感分析数据集-2023-stevemartin0 数据来源:互联网公开数据 标签:车辆保险,客户反馈,情感分析,文本分类,NLP,自然语言处理,意见挖掘,客户服务,保险理赔,政策条款 数据概述:... -
数据2020至2023年英超转会新闻文章数据集-crxxom
2020至2023年英超转会新闻文章数据集-crxxom 数据来源:互联网公开数据 标签:足球,转会市场,新闻,英超,自然语言处理,NLP,90min.com,体育新闻 数据概述:... -
网络攻击事件分析数据集-安全威胁情报-通用-ajaykarthik01
网络攻击事件分析数据集-安全威胁情报-通用-ajaykarthik01 数据来源:互联网公开数据 标签:网络安全, 攻击事件, 威胁情报, 攻击战术, 技术分析, 深度学习, NLP, 机器学习, 数据集, 安全分析 数据概述: 本数据集汇集了来自各类网络安全报告和结构化威胁情报来源的真实世界和模拟网络攻击事件数据。... -
Shopify电商商店描述与分类数据集
Shopify电商商店描述与分类数据集 数据来源:互联网公开数据 标签:Shopify,电商,商店,NLP,文本分析,分类,半监督学习,多标签分类,网页抓取 数据概述: 本数据集包含了61.8万个Shopify在线商店的信息。对于每个商店,我们提供了其标题、描述以及商品集合列表,这些数据均从商店的HTML主页中抓取获得(详见 shopgram.io...