找到16,244个数据集

标签: 自然语言处理

过滤结果
  • 乌尔都语与旁遮普语合并数据集

    2025年4月15日   

    乌尔都语与旁遮普语合并数据集 数据来源:互联网公开数据 标签:乌尔都语,旁遮普语,双语数据集,词性标注,词形还原,语言处理 数据概述:...
    packageimg
  • 银行客户推文情感分析数据集

    2025年4月15日   

    银行客户推文情感分析数据集 数据来源:互联网公开数据 标签:银行,客户,推文,情感分析,尼日利亚,社交媒体,文本数据,自然语言处理 数据概述:...
    packageimg
  • Reddit热门帖子互动分析数据集2020-2024

    2025年4月15日   

    Reddit热门帖子互动分析数据集2020-2024 数据来源:互联网公开数据 标签:Reddit, 社交媒体, 帖子, 互动分析, 情感分析, 热门趋势, 时间序列, 内容分析 数据概述: 本数据集包含了2020年至2024年期间,从Reddit的news, worldnews,...
    packageimg
  • 西班牙科技领域推特用户互动数据集-推特用户-2024年

    2025年4月15日   

    西班牙科技领域推特用户互动数据集-推特用户-2024年 数据来源:互联网公开数据 标签:推特,社交媒体,科技,西班牙语,数据分析,自然语言处理,社交网络,科技影响者,舆情分析 数据概述:...
    packageimg
  • 说唱歌词NLP数据集

    2025年4月15日   

    说唱歌词NLP数据集 数据来源:互联网公开数据 标签:说唱,歌词,NLP,文本分析,文本预处理,文本分类,音乐分析 数据概述: 本数据集收录了来自11位不同艺术家的说唱歌词,包括Drake、J. Cole、Kendrick Lamar、Eminem、Nas、Skepta、Rapsody、Nicki...
    packageimg
  • AI辩论数据集

    2025年4月15日   

    AI辩论数据集 数据来源:互联网公开数据 标签:AI安全,辩论,人工智能,技术伦理,研究项目,数据集 数据概述: 本数据集是关于通过辩论探索AI安全性的研究项目的一部分。数据集包含了用于研究AI安全性的辩论记录及相关信息,旨在为AI安全领域的研究提供数据支持。 数据用途概述:...
    packageimg
  • 蓝星员工评价数据集

    2025年4月15日   

    蓝星员工评价数据集 数据来源:互联网公开数据 标签:蓝星,员工评价,工作环境,情感分析,数据分析,公司文化,职业发展 数据概述: 蓝星员工评价数据集是一份收集了蓝星公司员工评价的宝贵信息集合。蓝星是一家著名的消费电子与家电公司,该数据集通过对员工在Ambition...
    packageimg
  • 人工智能语言检测软件训练数据集

    2025年4月15日   

    人工智能语言检测软件训练数据集 数据来源:互联网公开数据 标签:人工智能,语言检测,NLP,自然语言处理,开源软件,Naive Bayes算法,数据处理,机器学习 数据概述: 本数据集是用于训练人工智能语言检测软件的数据集合,由资深人工智能工程师Emirhan BULUT开发并公开分享。数据集涵盖了多种语言文本样本,用于训练和优化Naive...
    packageimg
  • 预处理数据集

    2025年4月15日   

    预处理数据集 数据来源:互联网公开数据 标签:数据预处理,机器学习,Transformer模型,实验设置,模型优化 数据概述: 本数据集包含了经过预处理的数据文件,这些数据已经准备好用于训练和测试Transformer模型。预处理包括数据清洗、特征提取和格式转换等步骤,以确保数据的质量和适用性。 数据用途概述:...
    packageimg
  • DataTalksClub-Zoomcamp问答匹配挑战数据集

    2025年4月15日   

    DataTalksClub-Zoomcamp问答匹配挑战数据集 数据来源:互联网公开数据 标签:问答匹配,机器学习,教育数据,课程内容,时间序列,数据挑战,Kaggle 数据概述:...
    packageimg
  • 土耳其恶意内容推文数据集2023

    2025年4月15日   

    土耳其恶意内容推文数据集2023 数据来源:互联网公开数据 标签:土耳其,推文,社交媒体,恶意内容,文本分析,语言处理,社会研究 数据概述: 本数据集收录了来自Twitter的土耳其推文,涵盖2023年的推文内容。数据集中约40%的推文包含冒犯性或粗俗的语境,为研究社交媒体上的恶意内容提供了宝贵的材料。每个推文记录了原文、发布时间、推文语言等关键信息。...
    packageimg
  • 比萨亚成语与英语对照数据集

    2025年4月15日   

    比萨亚成语与英语对照数据集 数据来源:互联网公开数据 标签:比萨亚语,成语,英语,语言学,对照表,文化研究 数据概述:...
    packageimg
  • 心理健康与自杀风险评估演示数据集

    2025年4月15日   

    心理健康与自杀风险评估演示数据集 数据来源:互联网公开数据 标签:心理健康,自杀风险,演示数据,机器学习,情感分析,文本分析,数据挖掘 数据概述:...
    packageimg
  • 早期现代英语戏剧数据集

    2025年4月15日   

    早期现代英语戏剧数据集 数据来源:互联网公开数据 标签:戏剧,英语,文学分析,回归分析,文化历史,作品风格,创作时间 数据概述:...
    packageimg
  • 多领域文本蕴含语料库数据集

    2025年4月15日   

    多领域文本蕴含语料库数据集 数据来源:互联网公开数据 标签:文本蕴含,自然语言处理,跨领域泛化,语言推理,机器学习,深度学习,NLP 数据概述:...
    packageimg
  • 左手手势遥控控制数据集

    2025年4月15日   

    左手手势遥控控制数据集 数据来源:互联网公开数据 标签:手势识别,遥控控制,人体交互,手语识别,机器学习,左手法则 数据概述: 本数据集收录了10,000条左手手势数据,这些数据通过关键点检测技术捕获,每条记录代表一个特定的左手手势,并提供手部各个关键点的X和Y坐标。数据集旨在用于开发和测试手势识别系统,特别是遥控控制应用程序。 数据用途概述:...
    packageimg
  • 万圣节热门服装亚马逊评论数据集

    2025年4月15日   

    万圣节热门服装亚马逊评论数据集 数据来源:互联网公开数据 标签:万圣节服装,亚马逊,用户评论,自然语言处理,NLP,文本分析,评分预测,时间序列,产品评价 数据概述:...
    packageimg
  • 山区命名实体识别数据集

    2025年4月15日   

    山区命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,山区,自然地理,文本分析,机器学习,自然语言处理 数据概述: 本数据集用于命名实体识别(NER)任务,旨在识别文本中的山区名称。数据集中的每条记录对应一个由OpenAI的ChatGPT生成的推文或句子。数据集包含多种类型的推文/文本,其中包括专注于山区体验的内容,也可能涉及其他主题。...
    packageimg
  • RedditAskReddit用户互动趋势研究数据集-2011至2021年

    2025年4月15日   

    RedditAskReddit用户互动趋势研究数据集-2011至2021年 数据来源:互联网公开数据 标签:AskReddit,Reddit,用户互动,内容分析,社交媒体,用户参与度,数据科学,研究分析 数据概述:...
    packageimg
  • 印度尼西亚反论语料库数据集2023

    2025年4月15日   

    印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro...
    packageimg