-
LC-QuAD2-0问答数据集-thedevastator
LC-QuAD2-0问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答系统,SPARQL查询,Wikidata,DBpedia,自然语言处理,机器学习,教育,科研 数据概述: LC-QuAD 2.0... -
航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei
航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei 数据来源:互联网公开数据 标签:ATIS,SNIPS,语音识别,槽位标注,意图识别,自然语言处理,SLU,对话系统 数据概述:... -
谷歌专利短语相似性评估数据集-google
谷歌专利短语相似性评估数据集-google 数据来源:互联网公开数据 标签:专利,短语相似性,技术术语,语义匹配,短语分类,自然语言处理,机器学习 数据概述:... -
情绪推断对话文本数据集-2011-thedevastator
情绪推断对话文本数据集-2011-thedevastator 数据来源:互联网公开数据 标签:情绪推断,对话文本,情感识别,自然语言处理,机器学习,文本分析 数据概述:... -
巴基斯坦企业黄页数据集1990-2017-mpasha96
巴基斯坦企业黄页数据集1990-2017-mpasha96 数据来源:互联网公开数据 标签:巴基斯坦,企业黄页,本地经济,商业信息,数据挖掘,自然语言处理,聚类分析 数据概述:... -
米德尔敦书屋笑话生成训练数据集-thedevastator
米德尔敦书屋笑话生成训练数据集-thedevastator 数据来源:互联网公开数据 标签:笑话生成,自然语言处理,幽默分析,机器学习,文本数据,训练集,教育 数据概述:... -
问答句分类数据集-SQuAD与SPAADIA融合数据集-shahrukhkhan
问答句分类数据集-SQuAD与SPAADIA融合数据集-shahrukhkhan 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问答,句子类型,SQuAD,SPAADIA,语句,疑问句 数据概述: 本数据集旨在对句子进行分类,区分其类型为:陈述句(声明句)或疑问句(提问句)。数据集由SQuAD数据集和SPAADIA数据集解析并融合而成。... -
多类别分类土耳其文本数据集-TC32-2023-savasy
多类别分类土耳其文本数据集-TC32-2023-savasy 数据来源:互联网公开数据 标签:土耳其文本分类,多类别分类,基准数据集,产品评论,自然语言处理,NLP,文本挖掘,机器学习,分类算法 数据概述:... -
训练文本统计数据集-机器学习项目2023-ajenningsfrankston
训练文本统计数据集-机器学习项目2023-ajenningsfrankston 数据来源:互联网公开数据 标签:文本统计,机器学习,自然语言处理,Kaggle,训练数据,文本分析 数据概述: 本数据集包含了从Kaggle上的Jupyter Notebook(https://www.kaggle.com/code/bulivington/no-... -
绕口令数据集-英文绕口令集合-2023-djathidiro
绕口令数据集-英文绕口令集合-2023-djathidiro 数据来源:互联网公开数据 标签:绕口令,语言学,机器学习,自然语言处理,数据集,开源,贡献,教育,娱乐,语言技能 数据概述:... -
英文单词SHA256哈希值数据集-单词长度4-13-bikashkundu
英文单词SHA256哈希值数据集-单词长度4-13-bikashkundu 数据来源:互联网公开数据 标签:英文单词,SHA256,哈希值,词汇,自然语言处理,数据科学,编码,文本分析 数据概述:... -
在线评论情感分析数据集
标题:在线评论情感分析数据集 数据内容:本数据集包含从互联网公开数据中收集的用户评论及其对应的情感标签。数据集主要包括以下两个数据元素: 1. review:评论内容,包含49582种不同的评论文本。 2. sentiment:情感标签,分为2种不同值(如积极和消极)。 数据来源:互联网公开数据 数据用途:该数据集可以用于多个行业的多种问题: 1.... -
商店商品标题分类数据集-ruchiyadav22
商店商品标题分类数据集-ruchiyadav22 数据来源:互联网公开数据 标签:文本分类,商品分类,机器学习,数据挖掘,零售,电商,标题分析,自然语言处理 数据概述:... -
亚马逊产品信息与客户评价数据集-2023-nguyenngocphung
亚马逊产品信息与客户评价数据集-2023-nguyenngocphung 数据来源:互联网公开数据 标签:亚马逊,产品信息,客户评价,数据挖掘,推荐系统,自然语言处理,数据分析 数据概述:... -
TowardsDataScienceTDS平台文章主题与内容分析数据集-2018至2021年-johoetter
TowardsDataScienceTDS平台文章主题与内容分析数据集-2018至2021年-johoetter 数据来源:互联网公开数据 标签:数据科学,机器学习,人工智能,自然语言处理,文本分析,主题建模,文章分析,TDS,在线出版物 数据概述: 本数据集收录了2018年至2021年期间Towards Data Science (TDS)... -
旧报纸印地语数据集
旧报纸印地语数据集 数据来源:互联网公开数据 标签:旧报纸,印地语,新闻文本,数据清洗,自然语言处理,历史文献,文本分析 数据概述: 本数据集是基于 Kaggle 平台上提供的旧报纸数据集(https://www.kaggle.com/alvations/old-... -
跨语言问答数据集XQuAD印地语部分2019-nbroad
跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-... -
亚洲宗教与圣经文本研究数据集-2019-ishandutta
亚洲宗教与圣经文本研究数据集-2019-ishandutta 数据来源:互联网公开数据 标签:亚洲宗教,圣经文本,文本分析,自然语言处理,数据集,文献研究,宗教比较,无监督学习 数据概述: 本数据集收录了8本宗教书籍的圣典文本,主要来源于Project... -
CoSQL数据库交互式对话数据集
CoSQL数据库交互式对话数据集 数据来源:互联网公开数据 标签:对话系统,自然语言处理,SQL,数据库,人机交互,文本转SQL,对话理解,数据集 数据概述: CoSQL是一个大型数据集,用于训练和测试基于SQL的任务导向型对话代理。该数据集由耶鲁大学提供,源于论文“CoSQL: A Conversational Text-to-{SQL}... -
Reddit语境与主题分类语料库-linkanjarad
Reddit语境与主题分类语料库-linkanjarad 数据来源:互联网公开数据 标签:语境分类,主题分类,语料库,Reddit,文本分析,自然语言处理,情感分析 数据概述:...