-
斯里兰卡AdaDerana新闻网站僧伽罗语新闻文章数据集2008-2024-tharindumadhusanka9
2025年5月31日 30 16 1
斯里兰卡AdaDerana新闻网站僧伽罗语新闻文章数据集2008-2024-tharindumadhusanka9 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,Ada Derana,斯里兰卡,NLP,自然语言处理,时间序列,文本分析,社会研究,媒体,2008-2024 数据概述: 本数据集是一个全面的新闻文章集合,来源于斯里兰卡Ada... -
电影剧情文本向量化数据集-3-5万部电影剧情向量数据-linhhlp
2025年5月31日 30 163 103
电影剧情文本向量化数据集-3-5万部电影剧情向量数据-linhhlp 数据来源:互联网公开数据 标签:电影,剧情,文本向量化,自然语言处理,向量搜索,机器学习,推荐系统,电影分析 数据概述:... -
对话数据集
2025年5月31日 30 51 27
对话数据集 数据来源:互联网公开数据 标签:对话数据集,自然语言处理,聊天机器人,会话分析,机器学习,人工智能,数据训练 数据概述: 本数据集是一个经过标注的对话集合,包含来自openerotica和freedom-... -
WELFake虚假新闻文本分类数据集-studymart
2025年5月31日 30 72 8
WELFake虚假新闻文本分类数据集-studymart 数据来源:互联网公开数据 标签:虚假新闻,文本分类,自然语言处理,机器学习,新闻,真实性,WELFake,文本分析 数据概述:... -
网络评论中仇恨言论检测数据集-2023年-cabmarcos
2025年5月31日 30 178 175
网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:... -
MDPI平台气候变化相关论文元数据数据集-devrajkashyap
2025年5月31日 30 46 5
MDPI平台气候变化相关论文元数据数据集-devrajkashyap 数据来源:互联网公开数据 标签:气候变化,论文,元数据,MDPI,学术研究,自然语言处理,文本分析 数据概述: 本数据集包含了从MDPI(Multidisciplinary Digital Publishing... -
伊博语重音符号恢复数据集
2025年5月31日 30 199 53
伊博语重音符号恢复数据集 数据来源:互联网公开数据 标签:伊博语,重音符号恢复,自然语言处理,机器学习,文本处理,语言资源 数据概述: 本数据集包含超过50万条经过精心整理的伊博语文本数据,数据来源包括开放获取的伊博语文学文本,如书籍、新闻文章等。数据集经过转录和预处理,旨在为AI模型的训练提供高质量的文本资源,特别是在模式识别领域。 数据用途概述:... -
雅虎问答主题分类数据集-2011至2021年
2025年5月31日 30 19 10
雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -... -
商品分类竞赛数据集
2025年5月31日 30 25 9
商品分类竞赛数据集 数据来源:互联网公开数据 标签:商品分类,层次分类,不完全标注,数据融合,自然语言处理,机器学习,分类算法,商品属性,多平台数据,类别预测 数据概述: 本数据集源于DataFusion... -
DBpedia语义分类数据集-14类-2014年-thedevastator
2025年5月31日 30 144 37
DBpedia语义分类数据集-14类-2014年-thedevastator 数据来源:互联网公开数据 标签:DBpedia,语义分类,文本数据集,自然语言处理,机器学习,数据科学,知识图谱,文本分类,分类模型,研究数据集 数据概述:... -
毒性评论分类数据集
2025年5月31日 30 144 92
毒性评论分类数据集 数据来源:互联网公开数据 标签:毒性评论,分类模型,自然语言处理,多语言,情感分析,文本处理,数据预处理 数据概述:... -
-
挪威议会演讲数据集1963-2021
2025年4月14日 60 178 128
挪威议会演讲数据集1963-2021 数据来源:互联网公开数据 标签:挪威议会,演讲,政治党派,时间序列,文本分析,自然语言处理 数据概述:... -
维基百科标题多语言翻译数据集
2025年5月31日 30 209 84
维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:... -
多语言视觉问答数据集
2025年5月31日 30 55 53
多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-... -
亚马逊商品评论情感细粒度分析数据集-训练与测试集
2025年5月31日 30 23 0
亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述:... -
印度Reddit论坛所有帖子数据集2023
2025年5月31日 30 209 135
印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API... -
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间
2025年5月31日 30 130 108
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间 数据来源:互联网公开数据 标签:Reddit,社区,帖子,主题分类,文本分类,自然语言处理,机器学习,社交媒体,推荐系统 数据概述:... -
亚马逊2018年评论数据集
2025年5月31日 30 126 56
亚马逊2018年评论数据集 数据来源:互联网公开数据 标签:亚马逊,评论,评分,自然语言处理,NLP,推荐系统,用户行为,商品分析 数据概述:... -
博客文本-数字内容管理数据集
2025年5月31日 30 125 95
博客文本-数字内容管理数据集 数据来源:互联网公开数据 标签:数字内容管理,博客,作者特征,文本分类,多标签分类,自然语言处理 数据概述:...