-
在线搜索查询意图领域分类数据集
在线搜索查询意图领域分类数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,搜索,查询,意图识别,机器学习,在线搜索,数据挖掘 数据概述: 本数据集由Analytics... -
英语-西班牙语和葡萄牙语语言变体数据集
英语-西班牙语和葡萄牙语语言变体数据集 数据来源:互联网公开数据 标签:语言变体,葡萄牙语,西班牙语,英语,地理分布,语言差异,文本分类,社会语言学 数据概述:... -
社交媒体内容情感分析与OCR文本数据集2023
社交媒体内容情感分析与OCR文本数据集2023 数据来源:互联网公开数据 标签:社交媒体,情感分析,OCR,文本分类,图像处理,自然语言处理 数据概述:... -
-
-
旁遮普邦巴基斯坦车牌字体数据集
旁遮普邦巴基斯坦车牌字体数据集 数据来源:互联网公开数据 标签:车牌识别,字符识别,光学字符识别,机器学习,深度学习,印度,旁遮普邦,车牌字体,文本分类 数据概述: 本数据集包含用于文本识别任务的0-9和a-... -
垃圾邮件过滤研究-SpamAssassin邮件数据集
垃圾邮件过滤研究-SpamAssassin邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,SpamAssassin,邮件,文本分类,自然语言处理,机器学习,贝叶斯,语料库 数据概述:... -
阿拉伯语方言数据集
阿拉伯语方言数据集 数据来源:互联网公开数据 标签:阿拉伯语方言,社交媒体文本,文本分类,语言分析,自然语言处理,区域语言差异 数据概述: 本数据集来源于Twitter平台,包含38,394条记录,主要分为四类阿拉伯语方言,分别为埃及方言、海湾方言、约旦方言和也门方言。各类别数据分布不均衡,为研究人员提供了多样化的数据资源。 数据用途概述:... -
印地语混合语YouTube评论仇恨言论NLP使用数据集
印地语混合语YouTube评论仇恨言论NLP使用数据集 数据来源:互联网公开数据 数据集说明: 本数据集旨在支持对社交媒体中针对宗教的仇恨言论进行自动识别与分析,特别聚焦于 Hindi-English code-mixed(印地语-英语混合)语言 的 YouTube... -
自然语言意图识别用于语音助手的IDE操作指令数据集
自然语言意图识别用于语音助手的IDE操作指令数据集 数据来源:互联网公开数据 数据来源: 本数据集由开发者自建并审核(self-approved),用于自然语言处理中的意图识别任务,特别针对集成开发环境(IDE)中的常见操作命令。 数据内容:... -
SCP幽默文章数据集
SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke... -
高校学生招聘数据文本化数据集
高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-... -
电子游戏评论情感分析数据集
电子游戏评论情感分析数据集 数据来源:互联网公开数据 标签:电子游戏,评论,情感分析,自然语言处理,NLP,文本分类,用户反馈,游戏行业 数据概述:... -
印地语-英语音译数据集
印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-... -
议论文分析与文本分类论点要素标注数据集
议论文分析与文本分类论点要素标注数据集 数据来源:互联网公开数据 标签:议论文,文本分类,论点分析,论点要素,有效性评估,自然语言处理 数据概述:... -
宝莱坞视频点击诱饵分类与特征分析数据集
宝莱坞视频点击诱饵分类与特征分析数据集 数据来源:互联网公开数据 标签:宝莱坞,点击诱饵,视频分析,电影,娱乐,文本分类,机器学习,数据挖掘 数据概述:... -
情感分类不平衡数据集
情感分类不平衡数据集 数据来源:互联网公开数据 标签:情感分析,不平衡分类,半监督学习,文本分类,自然语言处理,机器学习 数据概述: 本数据集为解决情感分析中的类别不平衡问题而构建,涵盖三种情感类别:Negative、Positive和Neutral。初始阶段收集了620条评论数据,各类别分布分别为Negative 150条、Positive... -
NLP机器人用户提问意图分类数据集
NLP机器人用户提问意图分类数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,用户提问,意图识别,文本分类,机器学习,人工智能,prompt,用户交互 数据概述: 本数据集旨在对NLP机器人接收到的用户提问进行分类。数据集的核心是用户输入的文本内容(即用户提问),并为每个提问标注了相应的类别标签,以反映用户提问的意图。... -
-