-
英语词汇综合列表数据集
英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:... -
福尔摩斯的矛盾增强数据集1963-2021
福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:... -
LG电子员工评价数据集
LG电子员工评价数据集 数据来源:互联网公开数据 标签:LG电子,员工评价,工作环境,职场体验,数据分析,情感分析,自然语言处理 数据概述: LG电子员工评价数据集汇集了来自Ambition Box平台上员工对LG电子的评价和意见,Ambition... -
问答平台问题点赞数预测数据集
问答平台问题点赞数预测数据集 数据来源:互联网公开数据 标签:问答平台,用户行为分析,点赞预测,机器学习,自然语言处理,声誉,用户互动,数据挖掘 数据概述:... -
-
英语语法错误纠正常用数据集
英语语法错误纠正常用数据集 数据来源:互联网公开数据 标签:语法错误,英语学习,自然语言处理,语法纠正,机器学习,文本分析 数据概述: 本数据集是JFLEG(JHU FLuency-Extended... -
Eminem专辑YouTube评论垃圾邮件分类数据集
Eminem专辑YouTube评论垃圾邮件分类数据集 数据来源:互联网公开数据 标签:Eminem, YouTube, 评论, 垃圾邮件, 自然语言处理, 机器学习, 文本分类, 社交媒体分析 数据概述: 本数据集由Ezhil... -
-
Anthropic公司Claude模型生成的1000篇论文数据集-说服性写作练习-多主题-时间跨度未知
Anthropic公司Claude模型生成的1000篇论文数据集-说服性写作练习-多主题-时间跨度未知 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,写作,Claude模型,说服性写作,论文,Anthropic 数据概述: 本数据集包含了由Anthropic公司开发的Claude-... -
-
英国英语语音识别数据集1963-2021
英国英语语音识别数据集1963-2021 数据来源:互联网公开数据 标签:英国英语,语音识别,自然语言处理,对话系统,语言理解,音频数据,文本转录,演讲者信息,多样话题 数据概述:... -
医学影像报告结构化数据集
医学影像报告结构化数据集 数据来源:互联网公开数据 标签:医学影像,结构化报告,自然语言处理,深度学习,Transformer,医学信息提取,腹盆腔超声报告 数据概述:... -
Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子
Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子 数据来源:互联网公开数据 标签:Reddit,政治,观点分析,自由派,保守派,文本数据,社交媒体,NLP,自然语言处理 数据概述:... -
推特用户情感分析数据集-社交媒体互动与情感洞察-2023年
推特用户情感分析数据集-社交媒体互动与情感洞察-2023年 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,文本挖掘,自然语言处理,用户行为,情感倾向,舆情分析 数据概述:... -
多语言大型语言模型生成文本数据集1963-2021
多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:... -
尼泊尔语社交媒体情感分析数据集
尼泊尔语社交媒体情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,尼泊尔语,社交媒体,文本分类,情感,NLP,机器学习 数据概述: 本数据集包含尼泊尔语社交媒体文本,并标注了情感极性。情感标签分为三类:积极(1),消极(0),和中性(2)。数据集来源于Hugging Face Datasets... -
社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开
社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开 数据来源:互联网公开数据 标签:情感分析,自然语言处理,社交媒体,用户评论,文本分类,机器学习,情感分类,正负中性 数据概述: 本数据集旨在支持社交媒体情感分析任务,涵盖了用户评论的情感倾向分类。数据集包含训练集、开发集和测试集,用于模型的训练、验证和评估。... -
多语言医学问答数据集MedQA-4K数据集
多语言医学问答数据集MedQA-4K数据集 数据来源:互联网公开数据 标签:医学,问答,多语言,自然语言处理,机器学习,英语,中文,韩语,医疗,数据集 数据概述: 本数据集源于MedQA数据集,并精心挑选了多选题形式的医学问题。该数据集专为多语言自然语言处理和微调语言模型而设计。 关键特征: 语言分布:... -
斯里兰卡麻醉药品法问答数据集
斯里兰卡麻醉药品法问答数据集 数据来源:互联网公开数据 标签:斯里兰卡,麻醉药品法,问答数据集,法律文本分析,自然语言处理,法律信息抽取 数据概述:... -
LLM提示恢复数据集800个提示
LLM提示恢复数据集800个提示 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,机器学习,竞赛数据,文本生成,人工智能 数据概述: 本数据集为LLM提示恢复竞赛而创建,包含了800个精心设计的语言模型提示。这些提示涵盖了多种应用场景和主题,旨在用于评估和改进语言模型的提示恢复能力。数据集中的每个提示都经过仔细设计,确保多样性和代表性。...