-
讽刺语句分析数据集
讽刺语句分析数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,文本分析,情感分析,机器学习,语义理解 数据概述: 本数据集包含1950条评论,每条评论由人工标注为讽刺性(1)或非讽刺性(-1)。数据集旨在提供一个用于讽刺语句识别的基准集合,帮助研究人员和开发者训练和评估文本分析模型。 数据用途概述:... -
改良后的印地语-孟加拉语仇恨言论数据集
改良后的印地语-孟加拉语仇恨言论数据集 数据来源:互联网公开数据 标签:仇恨言论,印地语,孟加拉语,多标签分类,文本分析,语言处理,社会研究 数据概述:... -
-
有声书市场用户评价与销售数据分析数据集
有声书市场用户评价与销售数据分析数据集 数据来源:互联网公开数据 标签:有声书,Audible,用户评价,销售数据,市场分析,电子书,数据清洗,文本分析 数据概述:... -
Reddit平台自杀相关讨论内容数据集
Reddit平台自杀相关讨论内容数据集 数据来源:互联网公开数据 标签:Reddit,社交媒体,自杀,心理健康,文本分析,情感分析,网络社区,负面情绪,情感识别 数据概述: 本数据集通过browse.ai的网络爬取技术,收集了Reddit平台上关于自杀讨论的帖子,共包含500条记录。... -
推特用户性别预测数据集
推特用户性别预测数据集 数据来源:互联网公开数据 标签:推特,性别预测,自然语言处理,机器学习,文本分析,社会语言学,性别识别 数据概述: 本数据集包含2019年5月21日至2019年6月1日期间通过Twitter... -
星际之门-SG-1剧本语料库
星际之门-SG-1剧本语料库 数据来源:互联网公开数据 标签:星际之门,SG-1,剧本,对话,电视剧,文本分析,文化研究,语言研究 数据概述: 本数据集包含了星际之门:SG-1从第一季到第六季(直到丹尼尔升天且不再为主要角色)的所有对话和指令内容。数据集覆盖了超过5年的电视剧集,为研究电视剧中的对话模式、角色互动及文化背景提供了丰富的文本材料。... -
-
印地语等多种语言Quora问答对数据集
印地语等多种语言Quora问答对数据集 数据来源:互联网公开数据 标签:问答对, Quora, 多语言, 印地语, 奥里亚语, 孟加拉语, 古吉拉特语, 马拉地语, 泰米尔语, 旁遮普语, 自然语言处理, 文本分析 数据概述: 本数据集包含3300对来自原始Quora问答对数据集的问答对。... -
阿拉伯语仇恨言论检测数据集-42k
阿拉伯语仇恨言论检测数据集-42k 数据来源:互联网公开数据 标签:阿拉伯语,仇恨言论,社交媒体,文本分析,自然语言处理,情感分析,语言学,机器学习 数据概述: 本数据集包含超过42,000条阿拉伯语文本数据,主要来源于社交媒体平台。 数据集旨在为研究和开发阿拉伯语仇恨言论检测模型提供支持。... -
-
德语词汇列表数据集
德语词汇列表数据集 数据来源:互联网公开数据 标签:德语词汇,语言学,语料库,书籍,文本分析,教育,研究 数据概述: 本数据集收录了11本德语书籍的文本内容,总计超过3000页。数据集中只包含一个字段,为德语词汇列表。这些书籍来源于互联网资源,包括DOABooks和USP E-Disciplinas平台上的相关文档。 数据用途概述:... -
加州餐厅评论数据集2023
加州餐厅评论数据集2023 数据来源:互联网公开数据 标签:餐厅评论,加州, sentiment analysis,星级评分,文本分析,消费者反馈,餐厅评价 数据概述:... -
美国Yelp平台必胜客用户评价文本情感分析数据集
美国Yelp平台必胜客用户评价文本情感分析数据集 数据来源:互联网公开数据 标签:用户评价,文本分析,情感分析,主题建模,关键词提取,必胜客,Yelp,美国,消费者洞察 数据概述:... -
叔本华哲学研究著作文本数据集1774-1860
叔本华哲学研究著作文本数据集1774-1860 数据来源:互联网公开数据 标签:叔本华,哲学,文本分析,NLP,语料库,德国古典哲学,时间序列 数据概述:... -
高评分电影词干与词形还原分析数据集
高评分电影词干与词形还原分析数据集 数据来源:互联网公开数据 标签:电影,高评分,词干提取,词形还原,自然语言处理,文本分析,影视研究 数据概述: 本数据集收录了若干高评分电影的基本信息及其概述内容的词干和词形还原处理结果。数据集包含以下字段: - 电影标题:电影的名称 - 电影概述:对电影剧情的简要描述 - 类型列表:电影所属的类型或标签 -... -
美国2024年夏季数据科学家职位招聘数据集
美国2024年夏季数据科学家职位招聘数据集 数据来源:互联网公开数据 标签:数据科学,招聘,职位,美国,远程,数据分析,数据可视化,文本分析,自然语言处理,机器学习 数据概述: 本数据集抓取自Indeed招聘网站,时间为2024年夏季,关键词为“数据科学家”。数据覆盖了美国所有州的职位招聘信息,包括远程职位,全面反映了该时期的数据科学就业市场状况。... -
印度最高法院判决文件与分析数据集1963-2021
印度最高法院判决文件与分析数据集1963-2021 数据来源:互联网公开数据 标签:最高法院,印度,法律判决,文本分析,命名实体识别,TF-IDF,词向量,情感分析,RNN 数据概述: 本数据集包含从印度最高法院网站抓取的判决文件及其分析结果。数据集包括两个主要文件:data_files.csv 和... -
贝叶斯网络自然语言解释文本数据集
贝叶斯网络自然语言解释文本数据集 数据来源:互联网公开数据 标签:贝叶斯网络,自然语言解释,可解释AI,文本分析,机器学习,语料库,语言学,解释生成 数据概述: 本数据集,即ExBAN语料库(Explanations for BAyesian... -
数据16K长度文本指令数据集
数据16K长度文本指令数据集 数据来源:互联网公开数据 标签:文本指令,自然语言处理,机器学习模型,数据分析,文本分析,情感分析,指令比较 数据概述:...