-
SCIE2019计算机科学论文数据集
SCIE2019计算机科学论文数据集 数据来源:互联网公开数据 标签:计算机科学,论文,关键词推荐,Web of Science,研究工具 数据概述: 本数据集包含从Web of Science数据库中使用查询词“Computer...
-
Kaggle问答社区Qoura平台问题及关注度数据集
Kaggle问答社区Qoura平台问题及关注度数据集 数据来源:互联网公开数据 标签:问答,社区,Kaggle,问题,关注度,社交媒体,数据分析,用户互动 数据概述:...
-
HuggingFace平台模型元数据与下载量分析数据集-2021年6月
HuggingFace平台模型元数据与下载量分析数据集-2021年6月 数据来源:互联网公开数据 标签:Hugging Face, 模型, 机器学习, 自然语言处理, 计算机视觉, 模型库, 元数据, 下载量, 文本分析 数据概述: 本数据集包含了Hugging Face模型中心(Model...
-
英语学习者语言熟练度评估多标签分类竞赛数据集
英语学习者语言熟练度评估多标签分类竞赛数据集 数据来源:互联网公开数据 标签:多标签分类,英语学习者,语言熟练度评估,教育技术,自然语言处理,机器学习,学业分析 数据概述:...
-
Databricks人工智能对话交互数据集-Dolly项目-开放域对话-15000-样本
Databricks人工智能对话交互数据集-Dolly项目-开放域对话-15000-样本 数据来源:互联网公开数据 标签:自然语言处理,对话系统,机器学习,人工智能,文本数据,对话生成,交互,Prompt,响应,Dolly,Databricks,Hugging Face 数据概述:...
-
-
斯坦福问答数据集SQuAD泰米尔语翻译数据集-CHAIi竞赛
斯坦福问答数据集SQuAD泰米尔语翻译数据集-CHAIi竞赛 数据来源:互联网公开数据 标签:问答,泰米尔语,翻译,自然语言处理,机器阅读理解,CHAIi,文本数据,数据集 数据概述: 本数据集是通过将斯坦福问答数据集(SQuAD,Stanford Question Answering...
-
代码生成模型DeclamaC代码还原性能评估数据集
代码生成模型DeclamaC代码还原性能评估数据集 数据来源:互联网公开数据 标签:代码生成, C代码, 反编译, 机器学习, 模型评估, 深度学习, CodeLlama, 自然语言处理 数据概述: 本数据集用于评估Declama模型在C代码还原任务中的性能。Declama模型是基于CodeLlama-7b-hf模型进行微调,专门用于解决从Hex-...
-
国家失业日推特数据集
国家失业日推特数据集 数据来源:互联网公开数据 标签:失业分析, 社交媒体, 推特数据, 用户行为, 时间序列, 哈希标签, 社会经济指标 数据概述: 本数据集来源于推特平台,围绕“national-unemployment-...
-
数据80行手写乌尔都语OCR数据集
数据80行手写乌尔都语OCR数据集 数据来源:互联网公开数据 标签:手写识别,乌尔都语,OCR,光学字符识别,自然语言处理,文档数字化,历史文献 数据概述:...
-
数据2022英联邦运动会社交媒体情绪分析数据集
数据2022英联邦运动会社交媒体情绪分析数据集 数据来源:互联网公开数据 标签:英联邦运动会,社交媒体,情绪分析,2022年,公众意见,推特,数据挖掘 数据概述:...
-
点击诱饵新闻标题分类数据集
点击诱饵新闻标题分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 文本分类, 机器学习, 数据标注, 社交媒体, 新闻分析 数据概述: 本数据集包含新闻标题的分类数据,主要分为“点击诱饵”(clickbait)和“非点击诱饵”(non-...
-
-
VentHere埃塞俄比亚情绪与情感分析数据集
VentHere埃塞俄比亚情绪与情感分析数据集 数据来源:互联网公开数据 标签:情绪分析,情感分析,社交媒体,Telegram,在线社区,文本预处理,数据挖掘,机器学习 数据概述: 本数据集来源于埃塞俄比亚Telegram频道Vent...
-
塔马兹伊特NLP-庞图恩翻译数据集
塔马兹伊特NLP-庞图恩翻译数据集 数据来源:互联网公开数据 标签:塔马兹伊特,语言处理,NLP,翻译,庞图恩,数据集,教育培训 数据概述: 塔马兹伊特NLP-...
-
情感分析文本情感分类数据集
情感分析文本情感分类数据集 数据来源:互联网公开数据 标签:情感分析,文本分类,自然语言处理,机器学习,情感识别,文本数据 数据概述: 本数据集是一个用于情感分析的文本情感分类数据集。 数据集包含文本内容及其对应的情感标签,用于训练和评估情感分析模型。...
-
Reddit社区萌宠版块用户互动情感分析数据集
Reddit社区萌宠版块用户互动情感分析数据集 数据来源:互联网公开数据 标签:Reddit,情感分析,社区互动,萌宠,用户行为,社交媒体,文本数据,aww,情绪,互动 数据概述:...
-
金融欺诈与非欺诈相关的新闻分类数据集
金融欺诈与非欺诈相关的新闻分类数据集 数据来源:互联网公开数据 标签:金融欺诈,非欺诈,新闻分类,自然语言处理,金融科技,数据标注 数据概述 本数据集旨在帮助用户对新闻文章进行分类,区分金融欺诈相关和非欺诈相关的内容。由于现有公开数据集中缺乏满足该需求的资源,本数据集由研究团队从头构建,旨在为类似研究提供支持。 数据集包含以下两个CSV文件: 1....
-
作者身份识别推文数据集
作者身份识别推文数据集 数据来源:互联网公开数据 标签:文本数据,推文,作者身份,作者归属,自然语言处理,机器学习,文本分类,社交媒体分析 数据概述: 本数据集包含了推文内容及其对应的作者姓名,旨在为构建作者身份识别模型提供基准数据集。 数据集包含不同作者发布的推文文本,可用于训练模型来识别推文的作者。 数据用途概述:...
-
NIST术语词汇表数据集
NIST术语词汇表数据集 数据来源:互联网公开数据 标签:术语词汇, 标准化, NIST, 网络安全, 信息安全, 技术规范, 教育资源, 研究工具 数据概述:...



