找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 写作训练数据集

    2025年4月14日   

    写作训练数据集 数据来源:互联网公开数据 标签:写作训练,学生作文,人工智能生成文本,语言模型,竞赛数据,文本检测 数据概述: 本数据集包含约1398篇作文,其中包括学生撰写的作品和大型语言模型(LLM)生成的文本。该数据集专为“LLM -...
    packageimg
  • 多模态情感数据集

    2025年4月14日   

    多模态情感数据集 数据来源:互联网公开数据 标签:多模态,情感分析,图像识别,自然语言处理,计算机视觉,图像分类,文本分析 数据概述: 本数据集包含100个不同类别动物和物体的图像及其对应的文本描述和情感标签,适用于多模态情感分析研究。图像类别包括鲨鱼、鸟类、蜥蜴、蜘蛛等。该数据集为计算机视觉和自然语言处理任务提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • 印尼苏丹语推特情绪分类数据集2021

    2025年4月14日   

    印尼苏丹语推特情绪分类数据集2021 数据来源:互联网公开数据 标签:苏丹语,推特,情绪分类,自然语言处理,计算机科学,数据集 数据概述: 本数据集包含2510条推特,这些推特使用印尼的第二大本地语言——苏丹语。数据集用于情绪分类研究,旨在帮助理解苏丹语推特中的情绪表达。数据集经过预处理,包括小写转换、停用词去除和词干提取。 数据用途概述:...
    packageimg
  • 维基百科文章网络数据集2018

    2025年4月14日   

    维基百科文章网络数据集2018 数据来源:互联网公开数据 标签:维基百科,文章网络,网络分析,机器学习,回归分析,链接预测,社区检测,网络可视化 数据概述:...
    packageimg
  • 在线新闻聚类分析数据集2021

    2025年4月14日   

    在线新闻聚类分析数据集2021 数据来源:互联网公开数据 标签:在线新闻,聚类分析,K均值聚类,层次聚类,新闻分类,数据挖掘,文本分析 数据概述: 本数据集包含2021年在线新闻的文章数据,涵盖新闻的主题、内容摘要、发布日期、作者、类别等多种信息。数据集旨在为新闻分类和聚类分析提供丰富的源数据,支持不同类型的文本处理研究。 数据用途概述:...
    packageimg
  • 印度英语口音识别数据集1963-2021

    2025年4月14日   

    印度英语口音识别数据集1963-2021 数据来源:互联网公开数据 标签:口音识别,英语,语音特征,机器学习,神经网络,音素发音,语音频谱 数据概述:...
    packageimg
  • HuggingFace模型库模型下载量及特征分析数据集-2023年9月

    2025年4月14日   

    HuggingFace模型库模型下载量及特征分析数据集-2023年9月 数据来源:互联网公开数据 标签:Hugging Face, 模型库, 下载量, 模型, 机器学习, 自然语言处理, 计算机视觉, 模型分析 数据概述: 本数据集收录了截至2023年9月20日Hugging...
    packageimg
  • TikTok视频字幕与误导信息分类数据集

    2025年4月14日   

    TikTok视频字幕与误导信息分类数据集 数据来源:互联网公开数据 标签:短视频, 社交媒体, 误导信息, 内容审核, 自然语言处理, 数据标注, 机器学习, 用户互动 数据概述 本数据集包含了来自 TikTok...
    packageimg
  • 编程任务反馈迭代数据集-2023

    2025年4月14日   

    编程任务反馈迭代数据集-2023 数据来源:互联网公开数据 标签:编程任务,迭代,while循环,代码反馈,ChatGPT,编程教育,错误分类 数据概述:...
    packageimg
  • 格言与警句数据集

    2025年4月14日   

    格言与警句数据集 数据来源:互联网公开数据 标签:格言,警句,谚语,多语言,文化,历史,人文,哲学 数据概述:...
    packageimg
  • 情感分析库比较数据集

    2025年4月14日   

    情感分析库比较数据集 数据来源:互联网公开数据 标签:情感分析,Python,政治演讲,推文,情感模型, sentiment analysis, NLP 数据概述:...
    packageimg
  • 领英企业页面帖子数据分析数据集-2021年2月

    2025年4月14日   

    领英企业页面帖子数据分析数据集-2021年2月 数据来源:互联网公开数据 标签:领英,企业页面,帖子,社交媒体分析,内容分析,自然语言处理,数据抓取 数据概述:...
    packageimg
  • 印度尼西亚垃圾短信文本分析数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾短信文本分析数据集1963-2021 数据来源:互联网公开数据 标签:垃圾短信,文本分析,商业用途,欺诈检测,客户支持,趋势分析,教育,网络安全,短信分类,机器学习,自然语言处理 数据概述:...
    packageimg
  • 开源软件漏洞数据集

    2025年4月14日   

    开源软件漏洞数据集 数据来源:互联网公开数据 标签:开源软件,漏洞分析,网络安全,NVD,漏洞预测,NLP,数据科学 数据概述: 本数据集包含了自2010年1月1日以来,公开报告至国家漏洞数据库(National Vulnerability Database,...
    packageimg
  • 谷歌应用商店安卓应用程序市场分析数据集

    2025年4月14日   

    谷歌应用商店安卓应用程序市场分析数据集 数据来源:互联网公开数据 标签:安卓应用,Google Play,移动应用,应用市场,数据分析,用户评论,情感分析,应用类别,市场趋势 数据概述: 本数据集包含对谷歌应用商店(Google Play)中超过一万个安卓应用程序的详细信息,以及它们的用户评论数据。数据集由两个主要文件构成:...
    packageimg
  • 谷歌涂鸦图像与信息数据集1998-2021

    2025年4月14日   

    谷歌涂鸦图像与信息数据集1998-2021 数据来源:互联网公开数据 标签:谷歌涂鸦,图像分析,创意研究,节日纪念,历史人物,语言翻译 数据概述:...
    packageimg
  • 数据2022年自由车队抗议事件推特评论数据集

    2025年4月14日   

    数据2022年自由车队抗议事件推特评论数据集 数据来源:互联网公开数据 标签:自由车队,抗议,推特,公众意见,情感分析,社会研究,2022年,加拿大,渥太华 数据概述:...
    packageimg
  • 问答驱动阅读理解研究数据集2011-2013

    2025年4月14日   

    问答驱动阅读理解研究数据集2011-2013 数据来源:互联网公开数据 标签:问答系统,阅读理解,自然语言处理,研究数据集,阿尔茨海默病,入学考试 数据概述: 问答驱动阅读理解(QA4MRE)数据集是由Huggingface Hub提供的一个庞大问答数据集,包含多个主题的文档及对应的问答对。该数据集作为CLEF...
    packageimg
  • 微博头像数据集

    2025年4月14日   

    微博头像数据集 数据来源:互联网公开数据 标签:微博,社交媒体,头像,文本分析,TF-IDF,Bert,话题识别 数据概述: 本数据集包含从微博爬取的CSV文件和使用TF-...
    packageimg
  • Threads应用用户评论情感分析数据集-37000条评论

    2025年4月14日   

    Threads应用用户评论情感分析数据集-37000条评论 数据来源:互联网公开数据 标签:Threads,社交媒体,用户评论,情感分析,移动应用,App Store,Google Play,文本数据,用户体验,数据挖掘 数据概述: 本数据集包含超过37000条来自Google Play商店和Apple App...
    packageimg