找到16,269个数据集

标签: 自然语言处理

过滤结果
  • 孟加拉国政治评论数据集

    2025年4月15日   

    孟加拉国政治评论数据集 数据来源:互联网公开数据 标签:孟加拉国,政治评论,自然语言处理,情感分析,意见挖掘,社交媒体分析,政治生态 数据概述:...
    packageimg
  • Reddit机器学习社区帖子数据集-2023年

    2025年4月15日   

    Reddit机器学习社区帖子数据集-2023年 数据来源:互联网公开数据 标签:Reddit,机器学习,深度学习,人工智能,社区,帖子,数据分析,情感分析,话题识别,趋势分析 数据概述: 本数据集包含从Reddit的机器学习社区(r/machinelearning)下载的帖子数据,时间范围截至2023年。数据通过Python Reddit API...
    packageimg
  • 客户技术支持NPS反馈与性能指标数据集

    2025年4月15日   

    客户技术支持NPS反馈与性能指标数据集 数据来源:互联网公开数据 标签:技术支持,客户满意度,NPS,SLA, churn风险,情感分析,客户服务 数据概述:...
    packageimg
  • PewDiePieYouTube视频转录文本数据集

    2025年4月15日   

    PewDiePieYouTube视频转录文本数据集 数据来源:互联网公开数据 标签:PewDiePie, YouTube, 视频, 转录文本, 语言分析, 视频分析, 社交媒体, 自然语言处理 数据概述: 本数据集包含了PewDiePie YouTube 频道所有视频的转录文本,数据来源于使用 OpenAI 的 Whisper...
    packageimg
  • 绝命毒师剧本对话数据集

    2025年4月15日   

    绝命毒师剧本对话数据集 数据来源:互联网公开数据 标签:绝命毒师,电视剧剧本,对话记录,时间序列,角色分析,情节分析 数据概述: 本数据集收录了美剧《绝命毒师》的剧本对话记录,数据直接来自Forever...
    packageimg
  • 意大利启蒙运动问答数据集

    2025年4月15日   

    意大利启蒙运动问答数据集 数据来源:互联网公开数据 标签:意大利启蒙运动,哲学,文化,问答,文本分析,语言研究,历史文献 数据概述: 本数据集包含意大利启蒙运动时期作者的文本片段。这些文本用于微调Gemma 2模型,以保留意大利启蒙运动的思想和语言特色。意大利启蒙运动起源于十八世纪下半叶,是一场涉及认识论、伦理学和政治学等领域讨论的文化和哲学运动。...
    packageimg
  • YouTube视频内容分类文本分析数据集

    2025年4月15日   

    YouTube视频内容分类文本分析数据集 数据来源:互联网公开数据 标签:视频分类,文本分析,机器学习,自然语言处理,多类别分类,数据标注,Youtube API 数据概述: 本数据集基于YouTube...
    packageimg
  • Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年

    2025年4月15日   

    Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年 数据来源:互联网公开数据 标签:Netflix,社交媒体,Facebook,用户评论,情感分析,LLM,自然语言处理,文本数据 数据概述:...
    packageimg
  • 印度COVID-19研究文献信息提取三元组数据集

    2025年4月15日   

    印度COVID-19研究文献信息提取三元组数据集 数据来源:互联网公开数据 标签:COVID-19,印度,文献研究,信息提取,三元组,自然语言处理,知识图谱 数据概述: 本数据集是针对COVID-19 Open Research Dataset Challenge...
    packageimg
  • 情感检测CNN输出数据集

    2025年4月15日   

    情感检测CNN输出数据集 数据来源:互联网公开数据 标签:情感检测,CNN,机器学习,深度学习,准确率,情绪分析,文本数据 数据概述:...
    packageimg
  • 数据2019年常见漏洞与暴露数据集

    2025年4月15日   

    数据2019年常见漏洞与暴露数据集 数据来源:互联网公开数据 标签:网络安全,漏洞,暴露,CVE,NVD,2019,自然语言处理 数据概述:...
    packageimg
  • Catch-the-AI人工智能生成内容检测数据集

    2025年4月15日   

    Catch-the-AI人工智能生成内容检测数据集 数据来源:互联网公开数据 (Kaggle 竞赛及其他数据集) 标签:人工智能, AI 生成内容, 检测, LLM, 文本, 图像, 音频, 机器学习, 数据集, 自然语言处理, 幻觉检测, DAIGT, Kaggle, Hugging Face 数据概述: 本数据集是 Catch the AI...
    packageimg
  • 人类与机器生成文本对比研究数据集

    2025年4月15日   

    人类与机器生成文本对比研究数据集 数据来源:互联网公开数据 标签:机器学习,文本生成,自然语言处理,文本检测,文学作品,编程代码 数据概述: 本数据集包含人类撰写和由大型语言模型(GPT-4 和...
    packageimg
  • 古兰经纯净文本数据集无阿拉伯语重音符号1963-2021

    2025年4月15日   

    古兰经纯净文本数据集无阿拉伯语重音符号1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,宗教文本,纯净文本,阿拉伯语,重音符号去除,宗教研究 数据概述: 本数据集包含古兰经的纯净版本文本,使用阿拉伯语,为古兰经的原生语言。该文本版本经过Tanzil项目专家团队的精心制作、高度验证和持续监控,确保了文本的准确性和可靠性。...
    packageimg
  • 医疗健康智能问答数据集

    2025年4月15日   

    医疗健康智能问答数据集 数据来源:互联网公开数据 标签:医疗健康,疾病预测,人工智能,自然语言处理,数据挖掘,健康风险,医疗分析 数据概述:...
    packageimg
  • 搜索引擎优化子论坛情感分析数据集

    2025年4月15日   

    搜索引擎优化子论坛情感分析数据集 数据来源:互联网公开数据 标签:SEO,子论坛,情感分析,自然语言处理,社交媒体分析,Facebook RoBerta 数据概述:...
    packageimg
  • 期刊引用数据命名实体识别数据集

    2025年4月15日   

    期刊引用数据命名实体识别数据集 数据来源:互联网公开数据 标签:期刊引用,命名实体识别,学术文献,数据结构化,数据库管理,研究分析,数据集成,机器学习,数字图书馆,学术网络 数据概述:...
    packageimg
  • 大金印度员工评价数据集

    2025年4月15日   

    大金印度员工评价数据集 数据来源:互联网公开数据 标签:大金印度,员工评价,工作环境,职业发展,公司文化,工作生活平衡,HR分析,数据驱动,文化分析 数据概述: 大金印度员工评价数据集收录了来自Ambition Box平台的大金印度员工评价,Ambition...
    packageimg
  • 土耳其新冠疫情推特情绪分析数据集

    2025年4月15日   

    土耳其新冠疫情推特情绪分析数据集 数据来源:互联网公开数据 标签:新冠疫情,土耳其,情绪分析,推特,卷积神经网络,双向长短期记忆,深度学习 数据概述: 本数据集专为实现题为“基于卷积神经网络和双向长短期记忆结合的土耳其COVID-19情绪分析”(发表于Concurrency and Computation: Practice and...
    packageimg
  • 哈维飓风2017年推特数据集

    2025年4月15日   

    哈维飓风2017年推特数据集 数据来源:互联网公开数据 标签:哈维飓风,2017,推特数据,灾害响应,主题建模,自然语言处理,公众感知,情感分析 数据概述:...
    packageimg