-
-
仇恨言论数据集-01
仇恨言论数据集-01 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,推特,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含用于识别仇恨言论的推特训练集和测试集,涵盖了2010年至2021年间推特平台上发布的大量文本数据。数据集经过标注,区分了包含仇恨言论和非仇恨言论的推文,适用于仇恨言论检测任务的研究和开发。 数据用途概述:... -
泰卢固语问答系统数据集
泰卢固语问答系统数据集 数据来源:互联网公开数据 标签:泰卢固语,问答系统,自然语言处理,机器学习,文本分析 数据概述: 本数据集专为构建泰卢固语问答系统而设计,包含了大量的泰卢固语问题及其对应的答案。数据集涵盖了多个领域的问题,包括但不限于科学、技术、文化、历史等,为开发和优化泰卢固语的问答系统提供了丰富的语言和知识基础。 数据用途概述:... -
BBC新闻数据集用于提取摘要
BBC新闻数据集用于提取摘要 数据来源:互联网公开数据 标签:BBC新闻,新闻摘要,自然语言处理,文本分析,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle平台,收录了BBC新闻的文章及其对应的摘要。数据集涵盖了五个不同的新闻类别:商业、科技、娱乐、体育和政治。每篇文章都配有一个简短的摘要,便于进行文本摘要技术的研究和应用。 数据用途概述:... -
Reddit用户自杀意念文本数据集
Reddit用户自杀意念文本数据集 数据来源:互联网公开数据 标签:Reddit,自杀意念,文本数据,情感分析,自然语言处理,心理健康,社交媒体,情感识别 数据概述: 本数据集包含了Reddit平台上的用户帖子,这些帖子基于其内容被人工标注为“有自杀意念”或“无自杀意念”两类。标注过程严格遵循以下规则: 有自杀意念文本:... -
IMDB电影评论情感分类数据集1963-2021
IMDB电影评论情感分类数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分类,自然语言处理,机器学习,文本分析,训练数据,测试数据 数据概述:... -
金融领域术语可读性评估数据集-FinRAD-2022
金融领域术语可读性评估数据集-FinRAD-2022 数据来源:互联网公开数据 标签:金融,可读性,自然语言处理,文本分析,术语,数据集,金融科技,语言学 数据概述: 本数据集,即FinRAD(Financial Readability Assessment... -
-
电影评论NLTK数据集
电影评论NLTK数据集 数据来源:互联网公开数据 标签:电影评论,自然语言处理,情感分析,词性标注,观众影响,故事描述,电影电视系列 数据概述: 本数据集包含了电影评论的相关信息,数据来源于之前的movie.csv数据集。数据集涵盖了电影名称、句子、词性标注、单个单词以及评论对观众的影响等内容,为电影评论的情感分析和自然语言处理提供了基础。... -
西班牙诗歌数据集
西班牙诗歌数据集 数据来源:互联网公开数据 标签:西班牙诗歌,NLP,文学分析,自然语言处理,诗歌爬虫,文学结构,文本挖掘 数据概述: 本数据集收录了从1960年代至今的大量西班牙诗歌作品,数据来源于2020年7月从诗歌网站www.poemas-del-... -
基于语言工具的AI生成文本错误分析数据集
基于语言工具的AI生成文本错误分析数据集 数据来源:互联网公开数据 标签:AI检测,文本分析,语言工具,错误分析,生成文本,写作风格,自然语言处理,教育,评估 数据概述:... -
在线赌博检测数据集
在线赌博检测数据集 数据来源:互联网公开数据 标签:在线赌博,社交媒体,内容检测,自然语言处理,公共事件,实时分析 数据概述: 本数据集包含来自“Yogyakarta夜 carnival 9”实时直播的评论数据,该活动是为了庆祝Yogyakarta市成立268周年。数据集收集了直播期间的用户评论,用于分析和检测在线赌博的推广行为。数据集包含以下字段:... -
电影评论与评分数据集
电影评论与评分数据集 数据来源:互联网公开数据 标签:电影评论,电影评分,自然语言处理,观众评价,电影分析,预测模型 数据概述: 本数据集来源于Rotten Tomatoes网站上观众(非专业评论家)的评论和评分。数据集包含了网站上各种电影的少量评论,旨在为自然语言处理分析提供基础,并构建一个能够根据观众评论预测评分的模型。所有数据的信用归Rotten... -
DatabricksDolly-15k指令数据集
DatabricksDolly-15k指令数据集 数据来源:互联网公开数据 标签:大型语言模型,指令微调,自然语言处理,数据集,开源,问答,文本生成,数据增强,Databricks 数据概述: Databricks Dolly-15k... -
复旦大学电影评论情感分析比赛数据集-电影评论-情感分析-文本数据
复旦大学电影评论情感分析比赛数据集-电影评论-情感分析-文本数据 数据来源:互联网公开数据 标签:情感分析,电影评论,文本数据,自然语言处理,复旦大学,机器学习,情感分类,Kaggle 数据概述: 本数据集是复旦大学自然语言处理实验室(FDU-... -
-
圣经葡萄牙文版数据集
圣经葡萄牙文版数据集 数据来源:互联网公开数据 标签:圣经,葡萄牙文,文本挖掘,自然语言处理,聚类分析,分类分析,情感分析,神学研究 数据概述: 本数据集包含《圣经》的葡萄牙文版,主要源于Almeida Corrigida e Revisada... -
快乐原因文本分类数据集
快乐原因文本分类数据集 数据来源:互联网公开数据 标签:文本分类,情感分析,快乐原因,数据科学,机器学习,自然语言处理 数据概述: 本数据集来源于一次在HackerEarth上进行的数据科学家职位挑战赛,包含了一系列文本数据,每条文本表达了个体感到快乐的原因。数据集旨在通过文本分类技术,识别并归类出个体快乐的原因,从而为情感分析和用户行为研究提供支持。... -
句子完成度预测文本分类数据集
句子完成度预测文本分类数据集 数据来源:互联网公开数据 标签:自然语言处理,句子完成度,文本分类,弱监督学习,新闻头条,文本数据清理 数据概述:... -
数据2019-2023印度尼西亚招聘信息推文数据集
数据2019-2023印度尼西亚招聘信息推文数据集 数据来源:互联网公开数据 标签:招聘信息,推文,自然语言处理,市场分析,公司需求,角色需求,社交媒体 数据概述: 本数据集包含2019年1月1日至2023年4月10日期间与职位空缺和招聘相关的50,000条推文。推文通过关键词“Job Vacancy”、“We are Hiring”和“We're...