-
斯瓦希里语新闻分类数据集
斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:... -
-
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日 数据来源:互联网公开数据 标签:TED演讲,文本,转录,演讲稿,自然语言处理,文本分析,主题分割,内容分析 数据概述:... -
Twitter社交媒体情感分析数据集
Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:... -
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:... -
ChatGPT话题推特情感分析数据集-2022年11月至2023年2月
ChatGPT话题推特情感分析数据集-2022年11月至2023年2月 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,情感分析,自然语言处理,人工智能,用户行为,话题讨论 数据概述:... -
俄罗斯幽默笑话主题分类数据集
俄罗斯幽默笑话主题分类数据集 数据来源:互联网公开数据 标签:笑话,俄罗斯,幽默,文本分类,自然语言处理,情感分析,语言文化,喜剧 数据概述: 本数据集包含大量俄罗斯幽默笑话的文本内容,旨在为文本分类任务提供训练和测试数据。数据集中的每个笑话都附带了文本信息,可用于预测笑话的主题或进行情感分析。 数据用途概述:... -
Reddit百万笑话语料库数据集-2020年4月1日前
Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:... -
IWSLT2017英语-中文翻译数据集
IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging... -
-
汉字与汉语拼音转换训练数据集
汉字与汉语拼音转换训练数据集 数据来源:互联网公开数据 标签:汉字,汉语拼音,文本数据,语言处理,机器学习,自然语言处理,数据转换 数据概述: 本数据集包含了多领域文本数据,包括汉字语句序列及其对应的汉语拼音序列。这些数据适用于训练汉字与汉语拼音之间的互转模型,支持多种自然语言处理任务。 数据用途概述: 该数据集适用于汉字-... -
韩国语翻译数据集
韩国语翻译数据集 数据来源:互联网公开数据 标签:韩国语,翻译,NLP模型,机器翻译,自然语言处理,DeepL API,英译韩,语言学习 数据概述: 本数据集提供了一组从英语翻译成韩国语的文本数据,适用于GPT4ALL、Dolly、Vicuna等NLP模型的训练与研究。数据集由nlpai-lab团队整理,通过DeepL... -
Reddit社区情感分析-帖子情感倾向数据集-2024
Reddit社区情感分析-帖子情感倾向数据集-2024 数据来源:互联网公开数据 标签:情感分析, Reddit, 文本数据, 社交媒体, 自然语言处理, 情感分类, 机器学习, 文本情感, 帖子, 2024 数据概述:... -
WebGL模型问答数据集
WebGL模型问答数据集 数据来源:互联网公开数据 标签:WebGL,模型,问答,自然语言处理,机器学习,计算机图形学,数据集,QA 数据概述: 本数据集由THUDM团队在Hugging... -
-
-
波兰图书评论数据集
波兰图书评论数据集 数据来源:互联网公开数据 标签:图书评论,波兰,用户反馈,情感分析,文本数据,自然语言处理 数据概述: 本数据集来源于波兰最大的在线图书论坛... -
印度拼图毒评强度与严重性增强数据集1963-2021
印度拼图毒评强度与严重性增强数据集1963-2021 数据来源:互联网公开数据 标签:文本增强,毒评检测,数据增强,自然语言处理,情感分析,机器学习,数据分析 数据概述: 本数据集用于增强初始的印度拼图(Jigsaw)数据集,特别针对毒评强度与严重性的分析。数据集来源于Davidson等人在2017年发表的《Automated Hate Speech... -
-
日本动漫图像标签描述数据集-Safebooru标签信息
日本动漫图像标签描述数据集-Safebooru标签信息 数据来源:互联网公开数据 标签:动漫,图像,标签,描述,日语,Safebooru,数据分析,自然语言处理,图像识别,文本挖掘 数据概述:...