找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 土耳其新闻文本数据集

    2025年4月14日   

    土耳其新闻文本数据集 数据来源:互联网公开数据 标签:土耳其新闻,文本分析,新闻分类,文化,艺术,经济,世界新闻,汽车,体育,技术,杂志 数据概述:...
    packageimg
  • 心疾病相关医学文献PICO分类数据集

    2025年4月14日   

    心疾病相关医学文献PICO分类数据集 数据来源:互联网公开数据 标签:PICO分类,医学文献,心疾病,证据基础,自然语言处理,生物医学信息学 数据概述:...
    packageimg
  • Codeforces编程竞赛问题分类与难度评估数据集

    2025年4月14日   

    Codeforces编程竞赛问题分类与难度评估数据集 数据来源:互联网公开数据 标签:Codeforces,编程竞赛,问题分类,难度,算法,数据分析,自然语言处理,机器学习 数据概述: 本数据集收录了Codeforces编程竞赛平台上的问题信息,旨在为问题分类、难度评估等研究提供数据支持。...
    packageimg
  • 西班牙语推文情感分析数据集

    2025年4月14日   

    西班牙语推文情感分析数据集 数据来源:互联网公开数据 标签:情感分析,西班牙语,社交媒体,自然语言处理,文本分类,情感识别 数据概述: 本数据集旨在支持西班牙语情感分析模型的开发,包含西班牙语推文的文本内容及其对应的情感标签。数据集记录了每条推文的发布时间和主题标签,适用于分析西班牙语社交媒体中的情感倾向。 数据用途概述:...
    packageimg
  • 推特中拍手表情符号使用位置数据集

    2025年4月14日   

    推特中拍手表情符号使用位置数据集 数据来源:互联网公开数据 标签:推特,拍手表情符号,自然语言处理,社交媒体分析,表情符号使用模式,文本分析 数据概述:...
    packageimg
  • 荷兰新闻标题数据集

    2025年4月14日   

    荷兰新闻标题数据集 数据来源:互联网公开数据 标签:新闻标题,荷兰新闻,讽刺检测,新闻分类,政治新闻,国际新闻,国内新闻,自然语言处理,文本分析 数据概述: 本数据集包含来自两个荷兰新闻网站的新闻标题,涵盖正常新闻标题和讽刺性新闻标题。讽刺性标题来源于荷兰网站 Speld.nl(类似于美国的 The Onion),而正常新闻标题则来源于新闻网站...
    packageimg
  • Reddit问答社区用户提问数据集-AskReddit等-2023

    2025年4月14日   

    Reddit问答社区用户提问数据集-AskReddit等-2023 数据来源:互联网公开数据 标签:Reddit,问答社区,用户提问,NLP,社会研究,数据分析,用户行为 数据概述:...
    packageimg
  • 情感数据集原始版

    2025年4月14日   

    情感数据集原始版 数据来源:互联网公开数据 标签:情感分析,自然语言处理,NLP,情感检测,文本分类,机器学习,聊天机器人,推荐系统,心理健康 数据概述:...
    packageimg
  • TED演讲信息数据集

    2025年4月14日   

    TED演讲信息数据集 数据来源:互联网公开数据 标签:TED演讲,演讲信息,全球化议题,技术与创新,教育与传播,数据分析 数据概述...
    packageimg
  • 阿拉伯语自动简答题评分数据集AR-ASAG

    2025年4月14日   

    阿拉伯语自动简答题评分数据集AR-ASAG 数据来源:互联网公开数据 标签:阿拉伯语,自动评分,简答题,教育,评估,机器学习,自然语言处理 数据概述:...
    packageimg
  • 政治机器人账户数据集

    2025年4月14日   

    政治机器人账户数据集 数据来源:互联网公开数据 标签:政治机器人,社交媒体分析,自然语言处理,数据清洗,特征提取,机器学习,账户检测,推文分析 数据概述:...
    packageimg
  • 半岛电视台YouTube频道视频标题与观看量数据集-时间跨度未知

    2025年4月14日   

    半岛电视台YouTube频道视频标题与观看量数据集-时间跨度未知 数据来源:互联网公开数据 标签:半岛电视台,YouTube,视频,标题,观看量,发布日期,内容分析,舆情分析,媒体研究 数据概述: 本数据集通过名为“SiteScraper”的Python模块(基于Selenium构建,链接:https://github.com/ibrahim-...
    packageimg
  • 魔兽世界经典版玩家术语与词汇数据集2004-2023

    2025年4月14日   

    魔兽世界经典版玩家术语与词汇数据集2004-2023 数据来源:互联网公开数据 标签:魔兽世界,经典版,玩家评论,游戏术语,社区意见,游戏平衡,游戏故事 数据概述: 本数据集收录了自2004年以来与魔兽世界(World of...
    packageimg
  • Flipkart电商平台用户评论情感分析数据集

    2025年4月14日   

    Flipkart电商平台用户评论情感分析数据集 数据来源:互联网公开数据 标签:电商,用户评论,情感分析,自然语言处理,机器学习,Flipkart,消费者行为,文本挖掘 数据概述:...
    packageimg
  • 洋葱新闻数据集

    2025年4月14日   

    洋葱新闻数据集 数据来源:互联网公开数据 标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性 数据概述: 本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The...
    packageimg
  • 文本编辑数据集

    2025年4月14日   

    文本编辑数据集 数据来源:互联网公开数据 标签:文本编辑,机器学习,自然语言处理,语法检查,语言模型,训练数据,数据标注 数据概述:...
    packageimg
  • 孟加拉语对话摘要数据集英文翻译

    2025年4月14日   

    孟加拉语对话摘要数据集英文翻译 数据来源:互联网公开数据 标签:对话摘要, 孟加拉语, 自然语言处理, 机器翻译, 文本摘要, 语言数据, 翻译数据集 数据概述:...
    packageimg
  • Vox今日解读播客节目文本数据集

    2025年4月14日   

    Vox今日解读播客节目文本数据集 数据来源:互联网公开数据 标签:播客,文本,新闻,时事,舆情分析,对话,VOX,Today Explained,转录 数据概述: 本数据集包含了Vox公司旗下播客节目“Today...
    packageimg
  • PII数据检测与生成数据集

    2025年4月14日   

    PII数据检测与生成数据集 数据来源:互联网公开数据 标签:PII检测,数据生成,Gemini API,数据安全,机器学习,自然语言处理 数据概述: 本数据集通过Gemini...
    packageimg
  • 印度消费者COVID-19文章问答数据集2021

    2025年4月14日   

    印度消费者COVID-19文章问答数据集2021 数据来源:互联网公开数据 标签:COVID-19,问答系统,消费者信息,医学研究,专家问答,时间序列,健康信息 数据概述: 本数据集旨在应对COVID-19疫情,包含两大类文章:研究文章和消费者文章。研究文章来自COVID-19开放研究数据集挑战(CORD-19),涵盖PubMed...
    packageimg