找到16,243个数据集

标签: 自然语言处理

过滤结果
  • Reddit自杀主题帖文分析数据集-2024年3月更新

    2025年4月15日   

    Reddit自杀主题帖文分析数据集-2024年3月更新 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,数据挖掘,自然语言处理,情绪识别,网络社区 数据概述:...
    packageimg
  • 印度瑜伽士萨古鲁热门帖子数据集

    2025年4月15日   

    印度瑜伽士萨古鲁热门帖子数据集 数据来源:互联网公开数据 标签:萨古鲁,瑜伽,冥想,印度,社区讨论, Reddit, 热门帖子, 情感分析, 讨论主题 数据概述: 本数据集包含了从2021年至今Reddit上r/Sadhguru子版块中的热门帖子。数据集通过Python Reddit API...
    packageimg
  • 讽刺语料库数据集

    2025年4月15日   

    讽刺语料库数据集 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,机器学习,社交媒体分析,文本情感分析 数据概述:...
    packageimg
  • 福克斯新闻YouTube视频标题-观看量与发布日期数据集每周更新

    2025年4月15日   

    福克斯新闻YouTube视频标题-观看量与发布日期数据集每周更新 数据来源:互联网公开数据 标签:福克斯新闻,YouTube,视频,标题,观看量,发布日期,政治,新闻,媒体分析,共和党,内容分析 数据概述:...
    packageimg
  • 泰米尔语-问答数据集

    2025年4月15日   

    泰米尔语-问答数据集 数据来源:互联网公开数据 标签:泰米尔语,问答系统,自然语言处理,NLP,机器翻译,QA挑战,斯坦福SQuAD 数据概述: 本数据集是为Chaii Hindi和泰米尔语问答挑战(Chaii Hindi and Tamil QA...
    packageimg
  • Tasty网站菜谱菜品信息数据集

    2025年4月15日   

    Tasty网站菜谱菜品信息数据集 数据来源:互联网公开数据 标签:菜谱,食谱,烹饪,美食,菜品,食材,烹饪步骤,Tasty网站 数据概述: 本数据集包含了Tasty网站上的所有菜谱信息。数据集由两个主要文件构成: dishes.csv:该文件列出了所有菜品,每个菜品都有一个唯一的ID和slug(别名),以及其他相关信息。...
    packageimg
  • BBC新闻多领域新闻文章数据集2022-2024

    2025年4月15日   

    BBC新闻多领域新闻文章数据集2022-2024 数据来源:互联网公开数据 标签:新闻媒体,BBC,文本分析,时间序列,信息传播,舆论分析,数据新闻 数据概述:...
    packageimg
  • 大型语言模型LLM科学考试RLHF训练数据集

    2025年4月15日   

    大型语言模型LLM科学考试RLHF训练数据集 数据来源:互联网公开数据 标签:LLM, 科学考试, RLHF, 奖励模型训练, 强化学习, 自然语言处理, 机器学习 数据概述: 本数据集是使用Llama-2-13b模型生成的,专门用于奖励模型(RM, Reward Model)训练,进而应用于强化学习与人类反馈(RLHF, Reinforcement...
    packageimg
  • Kaggle问答社区常见问题解答数据集-用户提问与LLM智能回复

    2025年4月15日   

    Kaggle问答社区常见问题解答数据集-用户提问与LLM智能回复 数据来源:互联网公开数据 标签:Kaggle,问答,FAQ,常见问题,LLM,大语言模型,自然语言处理,数据科学,社区,知识库 数据概述:...
    packageimg
  • 印度垃圾短信分类数据集

    2025年4月15日   

    印度垃圾短信分类数据集 数据来源:互联网公开数据 标签:垃圾短信,印度,短信分类,文本分析,机器学习,数据贡献,通讯模式 数据概述:...
    packageimg
  • ChatGPT安卓应用用户评价数据集-每日更新

    2025年4月15日   

    ChatGPT安卓应用用户评价数据集-每日更新 数据来源:互联网公开数据 标签:ChatGPT,安卓应用,用户评价,评论分析,评分,用户体验,自然语言处理,App Store 数据概述: 本数据集包含每日更新的ChatGPT安卓应用用户评价和评分。数据集涵盖了用户评论的多个关键属性,提供了关于用户体验和反馈随时间变化的深入分析。 字段解释:...
    packageimg
  • GPT-4o20问游戏对战数据-LLM问答竞赛数据集

    2025年4月15日   

    GPT-4o20问游戏对战数据-LLM问答竞赛数据集 数据来源:互联网公开数据 标签:大型语言模型,GPT-4o,20问游戏,LLM,问答,机器学习,自然语言处理,游戏数据,问答竞赛,数据集 数据概述:...
    packageimg
  • 德国联邦议院选举候选人社交媒体推文数据集-2021

    2025年4月15日   

    德国联邦议院选举候选人社交媒体推文数据集-2021 数据来源:互联网公开数据 标签:德国,选举,社交媒体,推特,政治,数据分析,联邦议院,政党,候选人 数据概述:...
    packageimg
  • 亚马逊乐器客户评论数据集

    2025年4月15日   

    亚马逊乐器客户评论数据集 数据来源:互联网公开数据 标签:亚马逊,客户评论,乐器,情感分析,自然语言处理,消费者反馈,产品质量 数据概述: 本数据集包含在亚马逊平台上销售的乐器的客户评论。每个评论包括评论标题、评论正文以及客户的整体评分等信息。该数据集为感兴趣于情感分析和自然语言处理的研究者提供了宝贵的资源。 数据用途概述:...
    packageimg
  • WinoBias性别偏见解决Winograd模式数据集

    2025年4月15日   

    WinoBias性别偏见解决Winograd模式数据集 数据来源:互联网公开数据 标签:性别偏见,共指解析,Winograd模式,自然语言处理,计算语言学,文本分析 数据概述:...
    packageimg
  • LinkedIn美国数学教师招聘信息数据集2023-2024

    2025年4月15日   

    LinkedIn美国数学教师招聘信息数据集2023-2024 数据来源:互联网公开数据 标签:数学教师,招聘信息,LinkedIn,美国,教育,就业市场,数据分析,时间序列,地理位置,职位描述 数据概述:...
    packageimg
  • 疫苗接种倾向分析数据集

    2025年4月15日   

    疫苗接种倾向分析数据集 数据来源:互联网公开数据 标签:疫苗接种,公众态度,社交媒体分析,COVID-19,健康政策,自然语言处理,情感分析 数据概述:...
    packageimg
  • 印度尼日利亚英文短信垃圾信息数据集

    2025年4月15日   

    印度尼日利亚英文短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信数据,垃圾信息识别,文本分析,自然语言处理,用户行为,数据隐私 数据概述:...
    packageimg
  • 摩洛哥方言-英语词汇对照数据集

    2025年4月15日   

    摩洛哥方言-英语词汇对照数据集 数据来源:互联网公开数据 标签:摩洛哥方言,英语,自然语言处理,NLP,词汇对照,方言研究,语言学 数据概述:...
    packageimg
  • 虚假新闻分类数据集2016-2019

    2025年4月15日   

    虚假新闻分类数据集2016-2019 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,新闻来源,文本分析,机器学习,数据标注 数据概述:...
    packageimg