-
Reddit问答系统训练与测试数据集2011-thedevastator
Reddit问答系统训练与测试数据集2011-thedevastator 数据来源:互联网公开数据 标签:问答系统,Reddit,用户生成内容,训练数据,测试数据,自然语言处理,机器学习 数据概述:... -
卫星图像多视角描述数据集-图像与文本-训练-测试-验证集-devang1910
卫星图像多视角描述数据集-图像与文本-训练-测试-验证集-devang1910 数据来源:互联网公开数据 标签:卫星图像,图像描述,自然语言处理,计算机视觉,图像生成,文本生成,深度学习,训练数据集,测试数据集,验证数据集 数据概述:... -
-
阿拉伯语新闻综合数据集-2021-ahmeddulaimi
阿拉伯语新闻综合数据集-2021-ahmeddulaimi 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,文化,经济,体育,政治,艺术,社会,科技,医疗,宗教 数据概述:... -
HackerNews帖子数据分析数据集-故事-提问-展示和投票-时间跨度未知
HackerNews帖子数据分析数据集-故事-提问-展示和投票-时间跨度未知 数据来源:互联网公开数据 标签:Hacker News, 帖子, 故事, 提问, 展示, 投票, 社交媒体, 舆情分析, 数据挖掘, 自然语言处理 数据概述: 本数据集包含了从Hacker News(HN)平台抓取的所有帖子数据,涵盖了故事(Stories)、提问(Ask... -
推特情感分析数据集100万条-2023年-raj713335
推特情感分析数据集100万条-2023年-raj713335 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,自然语言处理,文本挖掘,机器学习,数据标注,情感分类 数据概述: 本数据集包含100万条从推特上提取的推文,使用推特开源API收集。每条推文已经被标注了情感极性(0 = 负面,2 = 中性,4 =... -
-
丹麦人口普查手写姓名数据集
丹麦人口普查手写姓名数据集 数据来源:互联网公开数据 标签:手写识别,丹麦人口普查,OCR,图像处理,自然语言处理,计算机视觉,历史数据,丹麦语言 数据概述:... -
Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki
Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki 数据来源:互联网公开数据 标签:Yelp,评价,情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性 数据概述:... -
-
CORD-19文本清洗数据集
CORD-19文本清洗数据集 数据来源:互联网公开数据 标签:文本清洗,COVID-19,学术研究,自然语言处理,数据预处理,文本挖掘,信息提取 数据概述: 本数据集是对CORD-19(COVID-19 Open Research... -
摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100
摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100 数据来源:互联网公开数据 标签:阿拉伯语,新闻文章,文本分类,自然语言处理,数据挖掘,信息检索,摩洛哥,文本分析 数据概述: MNAD(Moroccan News Articles... -
PubMed医学论文摘要生成数据集-thedevastator
PubMed医学论文摘要生成数据集-thedevastator 数据来源:互联网公开数据 标签:PubMed,医学论文,摘要生成,自然语言处理,文本摘要,科研,机器学习,文本分析 数据概述:... -
斯里兰卡AdaDerana新闻网站僧伽罗语新闻文章数据集2008-2024-tharindumadhusanka9
斯里兰卡AdaDerana新闻网站僧伽罗语新闻文章数据集2008-2024-tharindumadhusanka9 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,Ada Derana,斯里兰卡,NLP,自然语言处理,时间序列,文本分析,社会研究,媒体,2008-2024 数据概述: 本数据集是一个全面的新闻文章集合,来源于斯里兰卡Ada... -
电影剧情文本向量化数据集-3-5万部电影剧情向量数据-linhhlp
电影剧情文本向量化数据集-3-5万部电影剧情向量数据-linhhlp 数据来源:互联网公开数据 标签:电影,剧情,文本向量化,自然语言处理,向量搜索,机器学习,推荐系统,电影分析 数据概述:... -
对话数据集
对话数据集 数据来源:互联网公开数据 标签:对话数据集,自然语言处理,聊天机器人,会话分析,机器学习,人工智能,数据训练 数据概述: 本数据集是一个经过标注的对话集合,包含来自openerotica和freedom-... -
WELFake虚假新闻文本分类数据集-studymart
WELFake虚假新闻文本分类数据集-studymart 数据来源:互联网公开数据 标签:虚假新闻,文本分类,自然语言处理,机器学习,新闻,真实性,WELFake,文本分析 数据概述:... -
网络评论中仇恨言论检测数据集-2023年-cabmarcos
网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:... -
MDPI平台气候变化相关论文元数据数据集-devrajkashyap
MDPI平台气候变化相关论文元数据数据集-devrajkashyap 数据来源:互联网公开数据 标签:气候变化,论文,元数据,MDPI,学术研究,自然语言处理,文本分析 数据概述: 本数据集包含了从MDPI(Multidisciplinary Digital Publishing... -
伊博语重音符号恢复数据集
伊博语重音符号恢复数据集 数据来源:互联网公开数据 标签:伊博语,重音符号恢复,自然语言处理,机器学习,文本处理,语言资源 数据概述: 本数据集包含超过50万条经过精心整理的伊博语文本数据,数据来源包括开放获取的伊博语文学文本,如书籍、新闻文章等。数据集经过转录和预处理,旨在为AI模型的训练提供高质量的文本资源,特别是在模式识别领域。 数据用途概述:...