找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 神经网络项目数据集

    2025年4月14日   

    神经网络项目数据集 数据来源:互联网公开数据 标签:神经网络,人工智能,机器学习,数据科学,行业应用,创新驱动,复杂问题解决 数据概述:...
    packageimg
  • OpenAIHumanEval代码生成评估数据集

    2025年4月14日   

    OpenAIHumanEval代码生成评估数据集 数据来源:互联网公开数据 标签:代码生成,自然语言处理,编程,Python,模型评估,机器学习,Hugging Face,OpenAI,编程问题,单元测试 数据概述:...
    packageimg
  • 印度假新闻检测与立场识别数据集2017

    2025年4月14日   

    印度假新闻检测与立场识别数据集2017 数据来源:互联网公开数据 标签:假新闻,立场检测,机器学习,新闻分析,数据可视化,情感分析,文本处理 数据概述:...
    packageimg
  • Telegram应用评论数据集

    2025年4月14日   

    Telegram应用评论数据集 数据来源:互联网公开数据 标签:用户评论,应用评价,Telegram,Google Play,评分,时间戳,用户反馈,开发者回应,应用版本 数据概述: 本数据集收录了Telegram应用在Google...
    packageimg
  • WhatsApp聊天记录分析数据集

    2025年4月14日   

    WhatsApp聊天记录分析数据集 数据来源:互联网公开数据 标签:WhatsApp,聊天记录,社交媒体,数据分析,项目实践,初学者,数据挖掘,自然语言处理 数据概述:...
    packageimg
  • 分诊评论数据集-附带优先级和标签层次结构

    2025年4月14日   

    分诊评论数据集-附带优先级和标签层次结构 数据来源:互联网公开数据 标签:自然语言处理,机器学习,情感分析,评论分诊,主题建模,协作 数据概述: 本数据集包含4,992行结构化信息,来源于一个用于管理和优先处理协作环境中评论的分诊系统。通过使用高级机器学习技术,如GEMMA-2B进行意图分类,Hugging...
    packageimg
  • 俄罗斯矿业行业文本数据集2009-2023

    2025年4月14日   

    俄罗斯矿业行业文本数据集2009-2023 数据来源:互联网公开数据 标签:矿业,俄罗斯,新闻,行业报告,文本分析,自然语言处理,数据挖掘 数据概述: 本数据集收录了2009年至2023年间约9万条新闻文章、新闻稿和矿业公司公共报告的俄语文本数据。数据通过自动抓取网站内容生成,经过句法切分处理,每行包含一个句子,适用于矿业行业文本分析。 数据用途概述:...
    packageimg
  • 优质图书数据集

    2025年4月14日   

    优质图书数据集 数据来源:互联网公开数据 标签:好读网,图书推荐,21世纪最佳图书,图书信息,读者评价,网络爬虫,数据抓取 数据概述: 本数据集收录了2001年1月1日至当前期间,根据好读网用户评价排名的21世纪最佳1500本书的信息。数据集通过网络爬虫技术,使用BeautifulSoup工具从好读网抓取,涵盖了这些顶尖图书的关键特征。 数据用途概述:...
    packageimg
  • 英语月经健康与卫生聊天机器人数据集

    2025年4月14日   

    英语月经健康与卫生聊天机器人数据集 数据来源:互联网公开数据 标签:月经健康,卫生,聊天机器人,自然语言处理,对话系统,健康咨询,英语 数据概述: 本数据集由哈比大学团队Mai作为毕业设计项目的一部分整理而成,旨在通过构建一个基于变换器的英文聊天机器人来解决月经健康和卫生相关问题。数据集来源于多个渠道,包括Hello...
    packageimg
  • 土耳其报纸专栏文章数据集

    2025年4月14日   

    土耳其报纸专栏文章数据集 数据来源:互联网公开数据 标签:土耳其报纸,专栏文章,作者识别,新闻媒体,时间序列,语言处理,人工智能 数据概述:...
    packageimg
  • 格鲁吉亚语情感分析数据集

    2025年4月14日   

    格鲁吉亚语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,格鲁吉亚语,自然语言处理,文本分类,社会研究 数据概述: 本数据集包含标注了情感标签的格鲁吉亚语句子,涵盖正面、负面和中性三种情感类型。数据集为研究格鲁吉亚语的情感表达和文本分析提供了丰富的语料资源。 数据用途概述:...
    packageimg
  • Discord游戏改进建议与投票数据集-Discord服务器-时间不限

    2025年4月14日   

    Discord游戏改进建议与投票数据集-Discord服务器-时间不限 数据来源:互联网公开数据 标签:游戏改进,Discord,社区反馈,NLP,文本分析,投票,建议,开发者,用户生成内容 数据概述:...
    packageimg
  • 碧昂歌词数据集

    2025年4月14日   

    碧昂歌词数据集 数据来源:互联网公开数据 标签:碧昂,歌词,音乐分析,专辑,歌曲,文本数据,音乐研究 数据概述: 本数据集包含了碧昂从2003年至2022年发行的多张专辑的歌词记录,具体包括《Dangerously In Love》、《B'Day》、《I Am…Sasha...
    packageimg
  • 尼泊尔语句子相似度基准数据集1963-2021

    2025年4月14日   

    尼泊尔语句子相似度基准数据集1963-2021 数据来源:互联网公开数据 标签:尼泊尔语,句子相似度,自然语言处理,机器翻译,同义句检测,语义搜索 数据概述: 本数据集是尼泊尔语版的句子文本相似性基准(STS-B),源自STS-...
    packageimg
  • WebMD健康问答平台问题与解答数据集

    2025年4月14日   

    WebMD健康问答平台问题与解答数据集 数据来源:互联网公开数据 标签:健康,医疗,问答,WebMD,医学,文本数据,自然语言处理,信息检索 数据概述:...
    packageimg
  • COVID-19研究文章数据集

    2025年4月14日   

    COVID-19研究文章数据集 数据来源:互联网公开数据 标签:COVID-19, 研究文章, 文本分析, 时间序列, 推荐系统, 情感分析, 机器学习 数据概述...
    packageimg
  • 调整文本数据集

    2025年4月14日   

    调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:...
    packageimg
  • 谷歌新闻原始数据集

    2025年4月14日   

    谷歌新闻原始数据集 数据来源:互联网公开数据 标签:谷歌新闻,原始数据,自然语言处理,文本分析,数据科学,新闻内容 数据概述: 本数据集包含从谷歌新闻收集的新闻文章集合,数据通过网络抓取获得,涵盖多个新闻来源的原始、未加工文本。该数据集提供了广泛的新聞内容,适用于自然语言处理项目、文本分析和其他需要原始文本数据的数据科学应用。 数据用途概述:...
    packageimg
  • 全球热门电影综合信息数据集-截至2024年8月

    2025年4月14日   

    全球热门电影综合信息数据集-截至2024年8月 数据来源:互联网公开数据 标签:电影,TMDb,影视,票房,语言,流派,评分,用户评价,电影市场,数据分析 数据概述: 本数据集收录了全球范围内各类电影的综合信息,涵盖了多种语言、多种电影流派,时间跨度截止至2024年8月。数据来源于The Movie Database...
    packageimg
  • AI与数据职业推文数据集

    2025年4月14日   

    AI与数据职业推文数据集 数据来源:互联网公开数据 标签:AI,数据职业,推文分析,职业发展,技术趋势,ChatGPT,行业洞察 数据概述:...
    packageimg