找到11,702个数据集

标签: 自然语言处理

过滤结果
  • Kaggle平台数据任务AI助手文档问答数据集

    2025年4月15日   

    Kaggle平台数据任务AI助手文档问答数据集 数据来源:互联网公开数据 标签:Kaggle, AI助手, 数据任务, 文档, 问答, Gemma, 自然语言处理, 机器学习, 开发者工具 数据概述: 本数据集旨在支持“Google – AI Assistants for Data Tasks with Gemma : Build tools to...
    packageimg
  • 基于GPT-2生成的灾难推文数据集

    2025年4月15日   

    基于GPT-2生成的灾难推文数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,灾难推文,数据增强,GPT-2,文本生成 数据概述:...
    packageimg
  • 古登堡文学作品样本数据集18本书1963-2021

    2025年4月15日   

    古登堡文学作品样本数据集18本书1963-2021 数据来源:互联网公开数据 标签:古登堡项目,文学作品,文本样本,分类任务,自然语言处理,经典文学,样本清理 数据概述:...
    packageimg
  • 自然语言处理文本纠错数据集

    2025年4月15日   

    自然语言处理文本纠错数据集 数据来源:互联网公开数据 标签:自然语言处理,文本纠错,语法错误检测,机器学习,数据分类,语言技术,文本分析 数据概述:...
    packageimg
  • 带表情符号的推文数据集

    2025年4月15日   

    带表情符号的推文数据集 数据来源:互联网公开数据 标签:表情符号,推文,社交媒体,自然语言处理,情绪分析,文本挖掘,机器学习 数据概述:...
    packageimg
  • 电子商务交易与用户行为研究数据集

    2025年4月15日   

    电子商务交易与用户行为研究数据集 数据来源:互联网公开数据 标签:电子商务,用户评分,用户行为,商品分类,数据清洗,机器学习,自然语言处理 数据概述:...
    packageimg
  • 推特用户评论情感分析数据集

    2025年4月15日   

    推特用户评论情感分析数据集 数据来源:互联网公开数据 标签:推特,用户评论,情感分析,文本数据,自然语言处理,情感分类,客户反馈 数据概述: 本数据集包含数千条推特用户评论(输入文本)及其对应的情感标签(输出标签),旨在用于情感分析模型的训练。数据通过使用关键词从Twitter...
    packageimg
  • 皮肤第一季剧本数据集

    2025年4月15日   

    皮肤第一季剧本数据集 数据来源:互联网公开数据 标签:剧本,对话分析,角色台词,自然语言处理,数据科学,电视剧分析,人物关系 数据概述: 本数据集包含电视剧《皮肤》第一季的完整剧本,记录了每一句台词及其对应的说话角色。剧本数据涵盖了全部集数的对话内容,为研究角色发展、剧情推进和对话模式提供了丰富的文本资源。 数据用途概述:...
    packageimg
  • 尼采著作文本数据集1885-1905

    2025年4月15日   

    尼采著作文本数据集1885-1905 数据来源:互联网公开数据 标签:尼采,哲学,文本分析,自然语言处理,词频分析,推荐系统,人文研究 数据概述:...
    packageimg
  • 谷歌应用商店用户评论情感分析数据集

    2025年4月15日   

    谷歌应用商店用户评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析,用户评论,应用商店,文本数据,自然语言处理,情感极性,评论分析,机器学习 数据概述:...
    packageimg
  • 孟加拉国政治评论数据集

    2025年4月15日   

    孟加拉国政治评论数据集 数据来源:互联网公开数据 标签:孟加拉国,政治评论,自然语言处理,情感分析,意见挖掘,社交媒体分析,政治生态 数据概述:...
    packageimg
  • PewDiePieYouTube视频转录文本数据集

    2025年4月15日   

    PewDiePieYouTube视频转录文本数据集 数据来源:互联网公开数据 标签:PewDiePie, YouTube, 视频, 转录文本, 语言分析, 视频分析, 社交媒体, 自然语言处理 数据概述: 本数据集包含了PewDiePie YouTube 频道所有视频的转录文本,数据来源于使用 OpenAI 的 Whisper...
    packageimg
  • YouTube视频内容分类文本分析数据集

    2025年4月15日   

    YouTube视频内容分类文本分析数据集 数据来源:互联网公开数据 标签:视频分类,文本分析,机器学习,自然语言处理,多类别分类,数据标注,Youtube API 数据概述: 本数据集基于YouTube...
    packageimg
  • Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年

    2025年4月15日   

    Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年 数据来源:互联网公开数据 标签:Netflix,社交媒体,Facebook,用户评论,情感分析,LLM,自然语言处理,文本数据 数据概述:...
    packageimg
  • 印度COVID-19研究文献信息提取三元组数据集

    2025年4月15日   

    印度COVID-19研究文献信息提取三元组数据集 数据来源:互联网公开数据 标签:COVID-19,印度,文献研究,信息提取,三元组,自然语言处理,知识图谱 数据概述: 本数据集是针对COVID-19 Open Research Dataset Challenge...
    packageimg
  • 数据2019年常见漏洞与暴露数据集

    2025年4月15日   

    数据2019年常见漏洞与暴露数据集 数据来源:互联网公开数据 标签:网络安全,漏洞,暴露,CVE,NVD,2019,自然语言处理 数据概述:...
    packageimg
  • Catch-the-AI人工智能生成内容检测数据集

    2025年4月15日   

    Catch-the-AI人工智能生成内容检测数据集 数据来源:互联网公开数据 (Kaggle 竞赛及其他数据集) 标签:人工智能, AI 生成内容, 检测, LLM, 文本, 图像, 音频, 机器学习, 数据集, 自然语言处理, 幻觉检测, DAIGT, Kaggle, Hugging Face 数据概述: 本数据集是 Catch the AI...
    packageimg
  • 人类与机器生成文本对比研究数据集

    2025年4月15日   

    人类与机器生成文本对比研究数据集 数据来源:互联网公开数据 标签:机器学习,文本生成,自然语言处理,文本检测,文学作品,编程代码 数据概述: 本数据集包含人类撰写和由大型语言模型(GPT-4 和...
    packageimg
  • 医疗健康智能问答数据集

    2025年4月15日   

    医疗健康智能问答数据集 数据来源:互联网公开数据 标签:医疗健康,疾病预测,人工智能,自然语言处理,数据挖掘,健康风险,医疗分析 数据概述:...
    packageimg
  • 搜索引擎优化子论坛情感分析数据集

    2025年4月15日   

    搜索引擎优化子论坛情感分析数据集 数据来源:互联网公开数据 标签:SEO,子论坛,情感分析,自然语言处理,社交媒体分析,Facebook RoBerta 数据概述:...
    packageimg