-
印度Reddit论坛所有帖子数据集2023
2025年5月31日 30 187 146
印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API... -
阿塞拜疆新闻数据集2023
2025年4月25日 30 20 17
阿塞拜疆新闻数据集2023 数据来源:互联网公开数据 标签:阿塞拜疆新闻,文本分析,自然语言处理,机器学习,Azerbaijani语,新闻内容 数据概述:... -
抵制宝莱坞推特趋势数据集2023年
2025年4月24日 30 2 0
抵制宝莱坞推特趋势数据集2023年 数据来源:互联网公开数据 标签:抵制运动,宝莱坞,推特,自然语言处理,NLP,社交媒体分析,趋势研究 数据概述:... -
印度尼西亚评论情感分析训练数据集2023
2025年4月23日 30 56 40
印度尼西亚评论情感分析训练数据集2023 数据来源:互联网公开数据 标签:评论分析,情感分类,毒评检测,训练数据,机器学习,自然语言处理 数据概述:... -
世界新闻热点文章文本情感分析数据集2023
2025年4月15日 30 207 191
世界新闻热点文章文本情感分析数据集2023 数据来源:互联网公开数据 标签:世界新闻,情感分析,Reddit,新闻文本,自然语言处理,数据清洗,实体识别 数据概述: 本数据集包含了从Reddit的r/worldnews板块抓取的热门文章文本,时间范围截至2023年。数据集通过PushShift... -
印度机器学习工程师招聘简历筛选数据集2023
2025年4月15日 30 105 33
印度机器学习工程师招聘简历筛选数据集2023 数据来源:互联网公开数据 标签:招聘,机器学习工程师,简历筛选,自然语言处理,回归分析,公平比较,求职指导 数据概述:... -
新型对话生成与分析数据集2023
2025年4月15日 30 14 3
新型对话生成与分析数据集2023 数据来源:互联网公开数据 标签:对话生成,自然语言处理,人工智能,聊天机器人,人机交互,用户画像,对话分析 数据概述: 本数据集包含11,001条基于用户画像的对话,专门用于自然语言处理(NLP)任务。每条记录包括两位用户的基本信息(User 1 Persona和User 2... -
公共GPT模型列表数据集2023
2025年4月15日 30 141 16
公共GPT模型列表数据集2023 数据来源:互联网公开数据 标签:GPT模型,自然语言处理,机器学习,公开数据,开发资源,研究工具,技术趋势 数据概述: 公共GPT模型列表数据集收录了目前所有公开可用的生成式预训练变换器(GPT)模型。数据集来源于GitHub上的一个专用存储库(https://github.com/casssapir/gpt-... -
印度技术挑战赛问答数据集2023
2025年4月15日 30 39 8
印度技术挑战赛问答数据集2023 数据来源:互联网公开数据 标签:问答数据集,印度技术挑战赛,问题解决,自然语言处理,机器学习,教育应用 数据概述: 本数据集来源于2023年印度技术挑战赛(Inter IIT Tech Meet 11.0),由印度理工学院坎普尔(IIT... -
印度尼西亚数字货币社区讨论数据集2023
2025年4月15日 30 28 13
印度尼西亚数字货币社区讨论数据集2023 数据来源:互联网公开数据 标签:数字货币,社区讨论,Reddit,区块链,投资趋势,自然语言处理,机器学习 数据概述:... -
印度假新闻检测数据集2023
2025年4月15日 30 164 43
印度假新闻检测数据集2023 数据来源:互联网公开数据 标签:假新闻,机器学习,自然语言处理,特征工程,社交媒体,新闻验证 数据概述: 本数据集包含4729条独特的新闻记录,每条记录已被标记为真实或虚假。该数据集适用于训练机器学习模型以检测假新闻,为新闻验证和假新闻识别提供了宝贵的数据支持。 数据用途概述:... -
在线评论欺骗检测数据集2023
2025年4月15日 30 147 90
在线评论欺骗检测数据集2023 数据来源:互联网公开数据 标签:在线评论,欺骗检测,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle,包含了用于欺骗性意见垃圾邮件检测的评论文本记录。数据集包括真实的和欺骗性的在线评论,每个评论都经过标注,可以帮助研究人员和开发者训练和评估文本分析及自然语言处理模型。 数据用途概述:... -
印度尼西亚反论语料库数据集2023
2025年4月15日 30 142 87
印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro... -
对话机器人训练对话提示与响应数据集2023
2025年4月15日 30 64 37
对话机器人训练对话提示与响应数据集2023 数据来源:互联网公开数据 标签:对话机器人,训练数据,对话提示,对话响应,自然语言处理,对话系统,人工智能 数据概述: 本数据集包含用于训练对话机器人的对话提示与响应数据,数据涵盖广泛的主题,包括日常对话、推荐、兴趣爱好、哲学思想等。数据集利用Gemini技术生成,适用于构建和优化对话机器人系统。... -
印度互联网仇恨言论识别数据集2023
2025年4月15日 30 53 8
印度互联网仇恨言论识别数据集2023 数据来源:互联网公开数据 标签:仇恨言论,内容审核,文本分析,社交媒体,自然语言处理,人工智能,互联网治理 数据概述: 本数据集用于识别文本输入中是否包含仇恨言论,涵盖了大量的互联网文本样本。数据集旨在为开发和评估仇恨言论检测模型提供训练数据基础,支持对不恰当和有害在线内容进行有效管理。 数据用途概述:... -
数据20新闻组文本分类研究数据集2023
2025年4月15日 30 146 138
数据20新闻组文本分类研究数据集2023 数据来源:互联网公开数据 标签:文本分类,自然语言处理,20新闻组,数据清洗,机器学习,情感分析,主题建模 数据概述: 本数据集是基于scikit-... -
约瑟夫罗根播客评论数据集2023
2025年4月15日 30 100 76
约瑟夫罗根播客评论数据集2023 数据来源:互联网公开数据 标签:约瑟夫罗根,播客评论,自然语言处理,情感分析,词性分析,观众反馈 数据概述:... -
数据2023年电影产业数据分析数据集
2025年4月15日 30 6 3
数据2023年电影产业数据分析数据集 数据来源:互联网公开数据 标签:电影数据,电影产业,票房分析,预算预测,导演分析,演员分析,推荐系统,自然语言处理 数据概述: 本数据集收录了超过5000部电影的信息,包括预算、票房收入、演员阵容、导演、制作公司及电影类型等多方面特征。数据集涵盖了从热门到相对小众的电影,提供了电影产业的全面概述。数据收集自The... -
印度情绪分析社交媒体数据集2023
2025年4月15日 30 118 11
印度情绪分析社交媒体数据集2023 数据来源:互联网公开数据 标签:情绪分析,社交媒体,推特,英语,情感分类,数据标注,自然语言处理 数据概述: 本数据集包含通过Twitter... -
全球产品情感分析数据集2023
2025年4月15日 30 191 11
全球产品情感分析数据集2023 数据来源:互联网公开数据 标签:产品情感分析,机器学习,自然语言处理,消费者反馈,客户体验,市场研究,产品分类 数据概述:...