找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 人工智能生成虚假播客数据集2023

    2025年4月14日   

    人工智能生成虚假播客数据集2023 数据来源:互联网公开数据 标签:播客,人工智能,虚假内容,垃圾邮件,SEO,媒体分析,技术伦理 数据概述: 本数据集收录了部分在Listen Notes播客数据库添加过程中被标记为人工智能生成的虚假播客。这些“播客”主要使用Notebook...
    packageimg
  • 佩里-罗丹宇宙飞船数据集

    2025年4月14日   

    佩里-罗丹宇宙飞船数据集 数据来源:互联网公开数据 标签:佩里-罗丹,宇宙飞船,科幻小说,银河帝国,太空探索,科技发展,外星文明 数据概述: 本数据集收录了科幻小说《佩里-罗丹》(Perry...
    packageimg
  • 土耳其语社交媒体攻击性语言识别数据集

    2025年4月14日   

    土耳其语社交媒体攻击性语言识别数据集 数据来源:互联网公开数据 标签:土耳其语,社交媒体,攻击性语言,数据增强,文本分类,自然语言处理,情感分析 数据概述:...
    packageimg
  • 英国文学NLP标注短语数据集

    2025年4月14日   

    英国文学NLP标注短语数据集 数据来源:互联网公开数据 标签:英国文学,NLP,短语标注,作家,书籍,世纪,句子分析,文学研究 数据概述:...
    packageimg
  • Hinglish印地语-英语混合语机器翻译数据集

    2025年4月14日   

    Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish...
    packageimg
  • 英德阿拉伯文本翻译数据集

    2025年4月14日   

    英德阿拉伯文本翻译数据集 数据来源:互联网公开数据 标签:文本翻译,语言学,英语,德语,阿拉伯语,多语言数据集,语言对比 数据概述: 本数据集包含从英语翻译到德语和阿拉伯语的多语言文本内容。数据集涵盖了广泛的文本类型,适用于语言学研究、机器翻译模型训练以及跨语言信息处理等领域。其中,阿拉伯语翻译部分来源于特定的数据集。 数据用途概述:...
    packageimg
  • 餐厅评论情感分析分类数据集

    2025年4月14日   

    餐厅评论情感分析分类数据集 数据来源:互联网公开数据 标签:餐厅评论,情感分析,自然语言处理,文本分类,机器学习,监督学习,情感识别 数据概述:...
    packageimg
  • 英语至印地文罗马化翻译数据集

    2025年4月14日   

    英语至印地文罗马化翻译数据集 数据来源:互联网公开数据 标签:英语,印地文,罗马化,翻译,31字母,化学,生物,地理 数据概述: 本数据集用于将英语翻译成印地文的罗马化形式。数据集中使用了31个字母来转写梵文字母的印地文,包括26个拉丁字母a-...
    packageimg
  • 疫苗相关推文数据集

    2025年4月14日   

    疫苗相关推文数据集 数据来源:互联网公开数据 标签:疫苗,推文,COVID-19,公众意见,社交媒体分析,健康信息,数据收集 数据概述: 本数据集收集了全球范围内关于COVID-19疫苗的近期推文数据,涵盖的主要疫苗包括Pfizer/BioNTech, Sinopharm, Sinovac, Moderna, Oxford/AstraZeneca,...
    packageimg
  • 维基百科加密货币文章数据集

    2025年4月14日   

    维基百科加密货币文章数据集 数据来源:互联网公开数据 标签:加密货币,维基百科,文章数据,机器学习,问答系统,摘要,对话,实体识别 数据概述:...
    packageimg
  • 南方公园台词文本数据集1997-2019

    2025年4月14日   

    南方公园台词文本数据集1997-2019 数据来源:互联网公开数据 标签:南方公园,台词,自然语言处理,文本分析,电视剧,角色对话,时间序列 数据概述:...
    packageimg
  • 泰英混合语词频分析数据集

    2025年4月14日   

    泰英混合语词频分析数据集 数据来源:互联网公开数据 标签:泰英混合语,词频分析,自然语言处理,NLP,文本数据,语言学研究,数据集 数据概述:...
    packageimg
  • Reddit讽刺新闻真伪辨析数据集

    2025年4月14日   

    Reddit讽刺新闻真伪辨析数据集 数据来源:互联网公开数据 标签:Reddit, NotTheOnion, 讽刺新闻, 真伪辨别, 社交媒体, 新闻分析, 幽默, 数据挖掘 数据概述:...
    packageimg
  • 推特讽刺检测LSTM语境分析数据集-2020

    2025年4月14日   

    推特讽刺检测LSTM语境分析数据集-2020 数据来源:互联网公开数据 标签:讽刺检测,LSTM,推特,语境分析,自然语言处理,数据集,不平衡数据,平衡数据 数据概述: 本数据集包含用于讽刺检测的研究数据,特别针对推特平台上的内容。数据集分为两个版本:不平衡数据集(English...
    packageimg
  • 印度巴哈萨语语料库情感标签数据集

    2025年4月14日   

    印度巴哈萨语语料库情感标签数据集 数据来源:互联网公开数据 标签:情感分析,巴哈萨语,文本分类,机器学习,自然语言处理,社会媒体监控,客户服务 数据概述:...
    packageimg
  • 小型英语到法语机器翻译数据集

    2025年4月14日   

    小型英语到法语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,英语,法语,自然语言处理,翻译模型,训练数据,语言学习 数据概述:...
    packageimg
  • 情感分析数据集EvalML-PS-06-基于RoBERTa模型-多版本

    2025年4月14日   

    情感分析数据集EvalML-PS-06-基于RoBERTa模型-多版本 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本分类,RoBERTa,模型比较,机器学习,数据集 数据概述: 本数据集为EvalML-...
    packageimg
  • 数据2021美国总统就职典礼推特数据集

    2025年4月14日   

    数据2021美国总统就职典礼推特数据集 数据来源:互联网公开数据 标签:特朗普,拜登,卡玛拉哈里斯,美国大选,总统就职典礼,美国总统,第一夫人,推特,公众意见,政治趋势 数据概述:...
    packageimg
  • YouTube阿姆哈拉语视频评论情感分析数据集

    2025年4月14日   

    YouTube阿姆哈拉语视频评论情感分析数据集 数据来源:互联网公开数据 标签:阿姆哈拉语,YouTube,视频评论,情感分析,自然语言处理,情感极性,文本数据 数据概述: 本数据集包含了从YouTube上抓取的阿姆哈拉语电影和视频片段的评论数据,数据通过YouTube 2.0...
    packageimg
  • 股票价格与新闻情感分析数据集

    2025年4月14日   

    股票价格与新闻情感分析数据集 数据来源:互联网公开数据 标签:股票价格预测,新闻情感分析,股票市场,金融数据分析,投资决策,自然语言处理 数据概述:...
    packageimg