-
流行语录作者分类数据集
流行语录作者分类数据集 数据来源:互联网公开数据 标签:流行语录,作者分类,文本分类,自然语言处理,机器学习,数据科学 数据概述: 本数据集包含世界知名作家所写的流行语录,涵盖多个著名作家的作品。数据集由两列组成,第一列是作家撰写的语录,第二列是相应作家的姓名。该数据集适用于二元文本分类任务,旨在根据语录内容识别作者。 数据用途概述:... -
孟加拉语文本分类研究数据集
孟加拉语文本分类研究数据集 数据来源:互联网公开数据 标签:孟加拉语,情感分析,毒性评论,文本分类,自然语言处理,多标签分类,社会媒体内容 数据概述:... -
土耳其新闻标题点击诱饵分类数据集
土耳其新闻标题点击诱饵分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 数据分类, 文本分析, 媒体研究, 数据标注, 文本分类 数据概述:... -
点击诱饵新闻标题分类数据集
点击诱饵新闻标题分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 文本分类, 机器学习, 数据标注, 社交媒体, 新闻分析 数据概述: 本数据集包含新闻标题的分类数据,主要分为“点击诱饵”(clickbait)和“非点击诱饵”(non-... -
情感分析文本情感分类数据集
情感分析文本情感分类数据集 数据来源:互联网公开数据 标签:情感分析,文本分类,自然语言处理,机器学习,情感识别,文本数据 数据概述: 本数据集是一个用于情感分析的文本情感分类数据集。 数据集包含文本内容及其对应的情感标签,用于训练和评估情感分析模型。... -
作者身份识别推文数据集
作者身份识别推文数据集 数据来源:互联网公开数据 标签:文本数据,推文,作者身份,作者归属,自然语言处理,机器学习,文本分类,社交媒体分析 数据概述: 本数据集包含了推文内容及其对应的作者姓名,旨在为构建作者身份识别模型提供基准数据集。 数据集包含不同作者发布的推文文本,可用于训练模型来识别推文的作者。 数据用途概述:... -
在线搜索查询意图领域分类数据集
在线搜索查询意图领域分类数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,搜索,查询,意图识别,机器学习,在线搜索,数据挖掘 数据概述: 本数据集由Analytics... -
英语-西班牙语和葡萄牙语语言变体数据集
英语-西班牙语和葡萄牙语语言变体数据集 数据来源:互联网公开数据 标签:语言变体,葡萄牙语,西班牙语,英语,地理分布,语言差异,文本分类,社会语言学 数据概述:... -
社交媒体内容情感分析与OCR文本数据集2023
社交媒体内容情感分析与OCR文本数据集2023 数据来源:互联网公开数据 标签:社交媒体,情感分析,OCR,文本分类,图像处理,自然语言处理 数据概述:... -
-
-
旁遮普邦巴基斯坦车牌字体数据集
旁遮普邦巴基斯坦车牌字体数据集 数据来源:互联网公开数据 标签:车牌识别,字符识别,光学字符识别,机器学习,深度学习,印度,旁遮普邦,车牌字体,文本分类 数据概述: 本数据集包含用于文本识别任务的0-9和a-... -
垃圾邮件过滤研究-SpamAssassin邮件数据集
垃圾邮件过滤研究-SpamAssassin邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,SpamAssassin,邮件,文本分类,自然语言处理,机器学习,贝叶斯,语料库 数据概述:... -
阿拉伯语方言数据集
阿拉伯语方言数据集 数据来源:互联网公开数据 标签:阿拉伯语方言,社交媒体文本,文本分类,语言分析,自然语言处理,区域语言差异 数据概述: 本数据集来源于Twitter平台,包含38,394条记录,主要分为四类阿拉伯语方言,分别为埃及方言、海湾方言、约旦方言和也门方言。各类别数据分布不均衡,为研究人员提供了多样化的数据资源。 数据用途概述:... -
印地语混合语YouTube评论仇恨言论NLP使用数据集
印地语混合语YouTube评论仇恨言论NLP使用数据集 数据来源:互联网公开数据 数据集说明: 本数据集旨在支持对社交媒体中针对宗教的仇恨言论进行自动识别与分析,特别聚焦于 Hindi-English code-mixed(印地语-英语混合)语言 的 YouTube... -
自然语言意图识别用于语音助手的IDE操作指令数据集
自然语言意图识别用于语音助手的IDE操作指令数据集 数据来源:互联网公开数据 数据来源: 本数据集由开发者自建并审核(self-approved),用于自然语言处理中的意图识别任务,特别针对集成开发环境(IDE)中的常见操作命令。 数据内容:... -
SCP幽默文章数据集
SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke... -
高校学生招聘数据文本化数据集
高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-... -
电子游戏评论情感分析数据集
电子游戏评论情感分析数据集 数据来源:互联网公开数据 标签:电子游戏,评论,情感分析,自然语言处理,NLP,文本分类,用户反馈,游戏行业 数据概述:... -
印地语-英语音译数据集
印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-...