数据集 - 海数据

不明飞行物目击事件完整描述数据集

2025年4月21日

不明飞行物目击事件完整描述数据集数据来源：互联网公开数据标签：不明飞行物,UFO,目击事件,NLP,自然语言处理,文本分析,描述,报告,事件,NUFORC 数据概述：...

ZIP

推特情感分析数据集-社交媒体文本情感分类-公开推文数据

2025年4月21日

推特情感分析数据集-社交媒体文本情感分类-公开推文数据数据来源：互联网公开数据标签：推特,情感分析,社交媒体,文本挖掘,自然语言处理,情感分类,机器学习数据概述：...

ZIP

英法翻译数据集-英语至法语翻译项目-数据-通用

2025年4月21日

英法翻译数据集-英语至法语翻译项目-数据-通用数据来源：互联网公开数据标签：翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集数据概述：本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-...

ZIP

网络海量数据俳句文本挖掘与人工校验数据集-2023年10月

2025年4月21日

网络海量数据俳句文本挖掘与人工校验数据集-2023年10月数据来源：互联网公开数据标签：俳句,诗歌,文本挖掘,自然语言处理,诗歌创作,文本分析,机器学习,网络数据数据概述：...

ZIP

虚假新闻识别文本数据集

2025年4月21日

虚假新闻识别文本数据集数据来源：互联网公开数据标签：虚假新闻,新闻文本,自然语言处理,文本分类,机器学习,舆情分析,新闻真伪,网络安全数据概述：本数据集来源于《机器学习在网络安全中的应用》一书的第四章，包含了虚假新闻和真实新闻文章的集合。数据集旨在为研究人员和实践者提供一个用于虚假新闻检测和分析的资源。数据用途概述：...

ZIP

英文小说文本数据集

2025年4月21日

英文小说文本数据集数据来源：互联网公开数据标签：英文小说,自然语言处理,NLP,文本分类,文本摘要,文学作品,预处理,内容过滤数据概述：本数据集包含一系列英文小说文本，适用于自然语言处理（NLP）任务，例如文本分类、文本摘要等。数据集基于Project...

ZIP

IMDB电影评论情感分析数据集-电影评论情感分类预测

2025年4月21日

IMDB电影评论情感分析数据集-电影评论情感分类预测数据来源：互联网公开数据标签：电影评论,情感分析,自然语言处理,文本分类,机器学习,IMDB,情感,评论,文本数据数据概述：...

ZIP

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

2025年4月20日

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛数据来源：互联网公开数据标签：LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据数据概述：本数据集是为LLM（大型语言模型）生成文本检测竞赛收集的。数据来源于多个公开的文本资源，涵盖了不同来源和类型的文本，旨在用于训练和评估检测模型，以识别由LLM生成的文本。...

ZIP

SuperGLUE自然语言理解任务基准数据集

2025年4月20日

SuperGLUE自然语言理解任务基准数据集数据来源：互联网公开数据标签：自然语言处理, NLP, 语言理解, 文本分类, 问答, 语义推理, 多任务学习数据概述： SuperGLUE 是一个由多个具有挑战性的自然语言理解（NLU）任务组成的数据集，旨在评估模型的泛化能力和对复杂语言现象的理解程度。该基准测试是 GLUE（General...

ZIP

互联网电影数据库电影评论情感分析数据集

2025年4月20日

互联网电影数据库电影评论情感分析数据集数据来源：互联网公开数据标签：电影评论,情感分析,自然语言处理,文本挖掘,机器学习,IMDb,电影,评论,情感,积极,消极数据概述：...

ZIP

提示注入攻击实例数据集

2025年4月20日

提示注入攻击实例数据集数据来源：互联网公开数据标签：提示注入,自然语言处理,网络安全,机器学习,对抗攻击,数据安全数据概述：本数据集汇集了从Hugging...

ZIP

BERT768维嵌入文章数据集

2025年4月20日

BERT768维嵌入文章数据集数据来源：互联网公开数据标签：BERT, 自然语言处理, 文章嵌入, COVID-19研究, 文本分析, 机器学习, 深度学习数据概述：本数据集包含了从COVID-19开放研究数据集挑战（CORD-19）中提取的27,648篇文章的BERT...

ZIP

HellaSwag常识推理数据集-句子补全任务-通用

2025年4月20日

HellaSwag常识推理数据集-句子补全任务-通用数据来源：互联网公开数据标签：自然语言处理,常识推理,句子补全,NLI,语言理解,文本生成,机器学习,人工智能数据概述：...

ZIP

多源对话数据集

2025年4月20日

多源对话数据集数据来源：互联网公开数据标签：对话数据,多源对话,自然语言处理,机器学习,聊天机器人,对话生成,情感分析数据概述：...

ZIP

亚马逊精细食品评论数据集

2025年4月20日

亚马逊精细食品评论数据集数据来源：互联网公开数据标签：评论分析,情感分析,文本挖掘,食品行业,用户行为,自然语言处理,文本预处理数据概述：...

ZIP

电影评论情感分析IMDB数据集-50000条评论

2025年4月20日

电影评论情感分析IMDB数据集-50000条评论数据来源：互联网公开数据标签：情感分析,文本分析,自然语言处理,机器学习,电影评论,二元分类,IMDB 数据概述： IMDB数据集是一个包含50,000条电影评论的宝贵资源，非常适合用于自然语言处理和文本分析研究。该数据集是进行二元情感分类任务的理想选择，其数据覆盖范围超过了以往的基准数据集。...