-
自然语言意图识别用于语音助手的IDE操作指令数据集
自然语言意图识别用于语音助手的IDE操作指令数据集 数据来源:互联网公开数据 数据来源: 本数据集由开发者自建并审核(self-approved),用于自然语言处理中的意图识别任务,特别针对集成开发环境(IDE)中的常见操作命令。 数据内容:... -
SCP幽默文章数据集
SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke... -
高校学生招聘数据文本化数据集
高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-... -
电子游戏评论情感分析数据集
电子游戏评论情感分析数据集 数据来源:互联网公开数据 标签:电子游戏,评论,情感分析,自然语言处理,NLP,文本分类,用户反馈,游戏行业 数据概述:... -
印地语-英语音译数据集
印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-... -
议论文分析与文本分类论点要素标注数据集
议论文分析与文本分类论点要素标注数据集 数据来源:互联网公开数据 标签:议论文,文本分类,论点分析,论点要素,有效性评估,自然语言处理 数据概述:... -
宝莱坞视频点击诱饵分类与特征分析数据集
宝莱坞视频点击诱饵分类与特征分析数据集 数据来源:互联网公开数据 标签:宝莱坞,点击诱饵,视频分析,电影,娱乐,文本分类,机器学习,数据挖掘 数据概述:... -
情感分类不平衡数据集
情感分类不平衡数据集 数据来源:互联网公开数据 标签:情感分析,不平衡分类,半监督学习,文本分类,自然语言处理,机器学习 数据概述: 本数据集为解决情感分析中的类别不平衡问题而构建,涵盖三种情感类别:Negative、Positive和Neutral。初始阶段收集了620条评论数据,各类别分布分别为Negative 150条、Positive... -
NLP机器人用户提问意图分类数据集
NLP机器人用户提问意图分类数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,用户提问,意图识别,文本分类,机器学习,人工智能,prompt,用户交互 数据概述: 本数据集旨在对NLP机器人接收到的用户提问进行分类。数据集的核心是用户输入的文本内容(即用户提问),并为每个提问标注了相应的类别标签,以反映用户提问的意图。... -
-
-
印度大选期间BJP与国大党推特数据集2023
印度大选期间BJP与国大党推特数据集2023 数据来源:互联网公开数据 标签:印度选举,推特数据,政治分析,情感分析,文本分类,话题建模,BJP,国大党 数据概述: 本数据集收录了2023年印度大选期间与印度两大主要政党——BJP和国大党相关联的推特内容。数据集通过Twitter... -
数据200-20新闻组文本分类数据集
数据200-20新闻组文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,新闻组,文本预处理,机器学习,监督学习 数据概述: 本数据集是一个经过预处理的文本数据集合,来源为scikit-learn提供的20... -
大型加密货币交易所黑客攻击相关推文数据集
大型加密货币交易所黑客攻击相关推文数据集 数据来源:互联网公开数据 标签:加密货币,黑客攻击,社交媒体分析,文本分类,投资者行为,市场预测 数据概述: 本数据集包含2020年9月期间关于一家知名加密货币交易所遭受黑客攻击事件的相关推文。这些推文记录了事件发生后社交媒体上公众的即时反应和讨论,为分析加密货币市场的动态变化提供了丰富的文本数据资源。... -
马拉维新闻分类挑战数据集
马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio... -
印度短信垃圾信息与正常信息分类数据集
印度短信垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,文本分类,自然语言处理,数据分析,机器学习,信息过滤 数据概述:... -
罗伊诉韦德案取消后推特立场观点数据集1963-2021
罗伊诉韦德案取消后推特立场观点数据集1963-2021 数据来源:互联网公开数据 标签:推特数据,罗伊诉韦德案,立场观点,社会议题,情感分析,文本分类,公共讨论 数据概述:... -
马拉维公共卫生疾病监测与应对问答数据集2020
马拉维公共卫生疾病监测与应对问答数据集2020 数据来源:互联网公开数据 标签:马拉维,公共卫生,疾病监测,问答数据,文本分类,机器学习,信息检索,培训材料 数据概述:... -
亚马逊商品评论与评分预测数据集
亚马逊商品评论与评分预测数据集 数据来源:互联网公开数据 标签:亚马逊,评论分析,情感分析,评分预测,文本分类,电子商务,机器学习 数据概述 本数据集来源于亚马逊网站,通过爬取亚马逊商品的用户评论及其对应的评分构建而成。数据集包含约50,000条商品评论及其对应的5分制评分。每条记录主要包含以下两个关键字段: 1.... -
COVID-19疫苗相关文章数据集
COVID-19疫苗相关文章数据集 数据来源:互联网公开数据 标签:COVID-19,疫苗,新闻文章,正反观点,人工智能,文本分类 数据概述: 本数据集包含一系列与COVID-19疫苗相关的文章,内容涉及公众对疫苗的不同观点。数据集中的文章被分为两大类:支持疫苗(Pro-vaccine)和反对疫苗(Anti-...