-
不明飞行物UFO目击记录数据集
不明飞行物UFO目击记录数据集 数据来源:互联网公开数据 标签:不明飞行物, UFO目击记录, 地理编码, 时间序列分析, 空中现象, 数据可视化, 自然语言处理 数据概述:... -
Kickstarter项目描述文本与项目成功状态数据集-2017年
Kickstarter项目描述文本与项目成功状态数据集-2017年 数据来源:互联网公开数据 标签:众筹项目,Kickstarter,自然语言处理,项目成功预测,文本分析,机器学习,项目描述,文本分类 数据概述:... -
TED演讲数据集含演讲稿-LIWC和MFT分析
TED演讲数据集含演讲稿-LIWC和MFT分析 数据来源:互联网公开数据 标签:TED演讲,公共演讲,语言分析,道德基础理论,数据可视化,文本挖掘,自然语言处理,心理语言学 数据概述:... -
-
全球352种语言形态标注数据集
全球352种语言形态标注数据集 数据来源:互联网公开数据 标签:语言学,形态学,词形变化,多语种,自然语言处理,Unimorph,特征标注 数据概述:... -
斯瓦希里语新闻分类数据集
斯瓦希里语新闻分类数据集 数据来源:互联网公开数据 标签:斯瓦希里语,新闻分类,自然语言处理,NLP,非洲语言,语言保护,文本分析,多语言数据 数据概述:... -
-
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日 数据来源:互联网公开数据 标签:TED演讲,文本,转录,演讲稿,自然语言处理,文本分析,主题分割,内容分析 数据概述:... -
Twitter社交媒体情感分析数据集
Twitter社交媒体情感分析数据集 数据来源:互联网公开数据 标签:Twitter,社交媒体,情感分析,NLP,自然语言处理,文本数据,情绪识别,舆情分析 数据概述:... -
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:... -
ChatGPT话题推特情感分析数据集-2022年11月至2023年2月
ChatGPT话题推特情感分析数据集-2022年11月至2023年2月 数据来源:互联网公开数据 标签:ChatGPT,推特,社交媒体,情感分析,自然语言处理,人工智能,用户行为,话题讨论 数据概述:... -
俄罗斯幽默笑话主题分类数据集
俄罗斯幽默笑话主题分类数据集 数据来源:互联网公开数据 标签:笑话,俄罗斯,幽默,文本分类,自然语言处理,情感分析,语言文化,喜剧 数据概述: 本数据集包含大量俄罗斯幽默笑话的文本内容,旨在为文本分类任务提供训练和测试数据。数据集中的每个笑话都附带了文本信息,可用于预测笑话的主题或进行情感分析。 数据用途概述:... -
Reddit百万笑话语料库数据集-2020年4月1日前
Reddit百万笑话语料库数据集-2020年4月1日前 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,社交媒体,自然语言处理,情感分析,喜剧,幽默,语言学 数据概述:... -
IWSLT2017英语-中文翻译数据集
IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging... -
-
汉字与汉语拼音转换训练数据集
汉字与汉语拼音转换训练数据集 数据来源:互联网公开数据 标签:汉字,汉语拼音,文本数据,语言处理,机器学习,自然语言处理,数据转换 数据概述: 本数据集包含了多领域文本数据,包括汉字语句序列及其对应的汉语拼音序列。这些数据适用于训练汉字与汉语拼音之间的互转模型,支持多种自然语言处理任务。 数据用途概述: 该数据集适用于汉字-... -
韩国语翻译数据集
韩国语翻译数据集 数据来源:互联网公开数据 标签:韩国语,翻译,NLP模型,机器翻译,自然语言处理,DeepL API,英译韩,语言学习 数据概述: 本数据集提供了一组从英语翻译成韩国语的文本数据,适用于GPT4ALL、Dolly、Vicuna等NLP模型的训练与研究。数据集由nlpai-lab团队整理,通过DeepL... -
Reddit社区情感分析-帖子情感倾向数据集-2024
Reddit社区情感分析-帖子情感倾向数据集-2024 数据来源:互联网公开数据 标签:情感分析, Reddit, 文本数据, 社交媒体, 自然语言处理, 情感分类, 机器学习, 文本情感, 帖子, 2024 数据概述:... -
WebGL模型问答数据集
WebGL模型问答数据集 数据来源:互联网公开数据 标签:WebGL,模型,问答,自然语言处理,机器学习,计算机图形学,数据集,QA 数据概述: 本数据集由THUDM团队在Hugging... -