找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 电影相关推文数据集

    2025年4月14日   

    电影相关推文数据集 数据来源:互联网公开数据 标签:电影,社交媒体,推文,情感分析,文本处理,大数据,自然语言处理 数据概述:...
    packageimg
  • 眼科医学文本双语平行语料库

    2025年4月14日   

    眼科医学文本双语平行语料库 数据来源:互联网公开数据 标签:医学翻译,眼科,平行语料库,双语文本,机器翻译,领域特定数据 数据概述:...
    packageimg
  • IMDB电影评论有用性预测数据集

    2025年4月14日   

    IMDB电影评论有用性预测数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,有用性预测,用户行为,文本挖掘,IMDB 数据概述:...
    packageimg
  • 症状与诊断数据集

    2025年4月14日   

    症状与诊断数据集 数据来源:互联网公开数据 标签:症状,诊断,医疗,机器学习,训练数据,健康,疾病分类,症状多样性,诊断准确性 数据概述: 症状与诊断数据集是一个全面且精心整理的医疗症状及其对应诊断的集合。该数据集经过仔细编译和组织,旨在为医疗诊断和健康相关应用中的各种机器学习模型(如BERT或LLAMA2)的训练和评估提供支持。 数据用途概述:...
    packageimg
  • 印度刑法典条款信息数据集

    2025年4月14日   

    印度刑法典条款信息数据集 数据来源:互联网公开数据 标签:印度刑法典,IPC,法律条款,犯罪行为,法律分析,法律趋势,自然语言处理,情感分析,法律咨询 数据概述:...
    packageimg
  • 数据2022世界杯FIFA官方推特数据集

    2025年4月14日   

    数据2022世界杯FIFA官方推特数据集 数据来源:互联网公开数据 标签:世界杯,2022,FIFA,推特,社交媒体,数据分析, public opinion, sentiment analysis 数据概述: 本数据集收录了2022...
    packageimg
  • 通用数据集描述模板-2019数据集

    2025年4月14日   

    通用数据集描述模板-2019数据集 数据来源:互联网公开数据 标签:社交媒体,情感分析,用户行为,自然语言处理,2019年,数据科学 数据概述: haha-2019数据集包含了2019年内社交媒体平台上用户发布的各类内容记录。数据集涵盖了文本内容、发布时间、用户信息等关键要素,为研究社交媒体上的用户行为、情感分析及内容传播提供了丰富的数据支持。...
    packageimg
  • 验证集-500

    2025年4月14日   

    验证集-500 数据来源:互联网公开数据 标签:验证集,数据集,机器学习,自然语言处理,评估,LLM评估,GPT4 数据概述: 本数据集基于Kaggle上的“wuwenmin/llm-sci-...
    packageimg
  • 医疗翻译数据集

    2025年4月14日   

    医疗翻译数据集 数据来源:互联网公开数据 标签:医疗翻译,多语言支持,医疗术语,公共健康,社会服务,语言技术,翻译工具 数据概述:...
    packageimg
  • 在线搜索查询意图领域分类数据集

    2025年4月14日   

    在线搜索查询意图领域分类数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,搜索,查询,意图识别,机器学习,在线搜索,数据挖掘 数据概述: 本数据集由Analytics...
    packageimg
  • 英语-西班牙语和葡萄牙语语言变体数据集

    2025年4月14日   

    英语-西班牙语和葡萄牙语语言变体数据集 数据来源:互联网公开数据 标签:语言变体,葡萄牙语,西班牙语,英语,地理分布,语言差异,文本分类,社会语言学 数据概述:...
    packageimg
  • 安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002

    2025年4月14日   

    安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻 数据概述:...
    packageimg
  • AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试

    2025年4月14日   

    AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试 数据来源:互联网公开数据 标签:人工智能,文本生成,聊天机器人,自然语言处理,文本检测,机器学习,竞赛数据,ChatGPT,Bard,Bing 数据概述:...
    packageimg
  • 母亲节推文情感分类数据集2023

    2025年4月14日   

    母亲节推文情感分类数据集2023 数据来源:互联网公开数据 标签:母亲节,推文,情感分析,机器学习,自然语言处理,社交媒体分析 数据概述:...
    packageimg
  • 卡纳达语数据集

    2025年4月14日   

    卡纳达语数据集 数据来源:互联网公开数据 标签:卡纳达语,自然语言处理,NLP,语言模型,多样文本,精细调优,古吉拉特语 数据概述...
    packageimg
  • 写作与写作质量研究论文数据集1963-2021

    2025年4月14日   

    写作与写作质量研究论文数据集1963-2021 数据来源:互联网公开数据 标签:写作质量,论文,写作过程,机器学习,自然语言处理,教育研究,数据分析 数据概述: 本数据集收录了通过特定写作过程生成的训练集和测试集论文,数据源自Kaggle竞赛链接:https://www.kaggle.com/competitions/linking-writing-...
    packageimg
  • 全球猴痘疫情社交媒体推文数据集

    2025年4月14日   

    全球猴痘疫情社交媒体推文数据集 数据来源:互联网公开数据 标签:猴痘,疫情,社交媒体,推文,Twitter,公共卫生,舆情分析,疾病传播 数据概述:...
    packageimg
  • 社交媒体内容情感分析与OCR文本数据集2023

    2025年4月14日   

    社交媒体内容情感分析与OCR文本数据集2023 数据来源:互联网公开数据 标签:社交媒体,情感分析,OCR,文本分类,图像处理,自然语言处理 数据概述:...
    packageimg
  • 马拉提语新闻标题数据集1963-2021

    2025年4月14日   

    马拉提语新闻标题数据集1963-2021 数据来源:互联网公开数据 标签:马拉提语,新闻标题,文本分析,自然语言处理,分类模型,机器学习,数据清洗 数据概述: 本数据集包含从马拉提语新闻网站收集的约12000条新闻文章标题。数据集已经经过清洗处理,并分为训练集和测试集,适用于基准测试各类马拉提语文本分类模型。 数据用途概述:...
    packageimg
  • 美国最高法院口头辩论数据集2017-2021

    2025年4月14日   

    美国最高法院口头辩论数据集2017-2021 数据来源:互联网公开数据 标签:最高法院,美国,口头辩论,法律,司法,案例分析,法律研究 数据概述: 本数据集收录了2017年至2021年间美国最高法院的口头辩论记录,包含了辩论的逐行对话,并标注了发言者和案件编号。数据集为法律研究、司法分析和案例研究提供了丰富的文本材料。 数据用途概述:...
    packageimg