找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 苹果VisionPro头显产品用户体验Youtube视频评论数据集

    2025年4月14日   

    苹果VisionPro头显产品用户体验Youtube视频评论数据集 数据来源:互联网公开数据 标签:苹果,Vision Pro,头显,AR,VR,用户评价,YouTube,视频评论,科技,产品评测 数据概述: 本数据集收集了来自YouTube平台的关于苹果Vision Pro头显产品的用户体验视频评论。...
    packageimg
  • 欧洲杯赛事社交媒体讨论内容情感分析数据集-2020年Reddit平台

    2025年4月14日   

    欧洲杯赛事社交媒体讨论内容情感分析数据集-2020年Reddit平台 数据来源:互联网公开数据 标签:欧洲杯,足球,社交媒体,Reddit,情感分析,赛事讨论,文本数据,体育,舆情分析 数据概述: 本数据集收录了2020年欧洲杯期间Reddit平台r/Euro2020子版块内的帖子和评论数据。数据来源于Reddit官方API,使用Python...
    packageimg
  • ACL会议接受论文数据集2016-2018

    2025年4月14日   

    ACL会议接受论文数据集2016-2018 数据来源:互联网公开数据 标签:ACL会议,接受论文,自然语言处理,研究趋势,学术出版,论文分析,开源数据 数据概述:...
    packageimg
  • 阿拉伯新闻分类研究数据集1963-2021

    2025年4月14日   

    阿拉伯新闻分类研究数据集1963-2021 数据来源:互联网公开数据 标签:阿拉伯新闻,分类研究,NLP,创业,科技,其他,灵感 数据概述:...
    packageimg
  • AskReddit热门评论数据集-NLP文本分析

    2025年4月14日   

    AskReddit热门评论数据集-NLP文本分析 数据来源:互联网公开数据 标签:AskReddit,评论,Reddit,文本分析,NLP,自然语言处理,情感分析,热门评论,数据分析,EDA 数据概述: 本数据集包含了过去一个月内AskReddit版块中,最热门的评论数据。...
    packageimg
  • PDF数据分析数据集

    2025年4月14日   

    PDF数据分析数据集 数据来源:互联网公开数据 标签:PDF分析,文本提取,数据处理,自然语言处理,机器学习,文档分析,信息提取 数据概述: 本数据集包含了一系列PDF文档,以及对这些文档进行分析后提取的数据。数据集涵盖了文档的基本信息、文本内容、关键词、结构化数据等关键要素,为研究PDF文档的内容和结构提供了基础。 数据用途概述:...
    packageimg
  • LLM提示恢复合成数据集

    2025年4月14日   

    LLM提示恢复合成数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,合成数据,自然语言处理,人工智能,机器学习,数据竞赛 数据概述: 本数据集使用Gemma 7B-IT生成了1000个示例,用于LLM提示恢复竞赛。数据集基于@thedrcat的原始数据集进行扩展,包含两个额外的列:一是Gemma 7B-IT生成的原始输出,二是去除“Sure…...
    packageimg
  • 牛津大学TripAdvisor评价数据集1963-2021

    2025年4月14日   

    牛津大学TripAdvisor评价数据集1963-2021 数据来源:互联网公开数据 标签:牛津大学,评价,数据分析,情感分析,趋势分析,词云,旅游,平台,评论 数据概述: 本数据集包含1119条来自TripAdvisor对牛津大学的评价记录。每条评论包含了发布日期、发布平台和旅行类型等详细信息,为分析公众对牛津大学的看法提供了宝贵的资源。...
    packageimg
  • 带水印与不带水印文本生成数据集

    2025年4月14日   

    带水印与不带水印文本生成数据集 数据来源:互联网公开数据 标签:文本生成,水印嵌入,语言模型,OPT-350M,数据集,机器学习,自然语言处理 数据概述:...
    packageimg
  • EAFC24游戏玩家评价数据集-Steam平台

    2025年4月14日   

    EAFC24游戏玩家评价数据集-Steam平台 数据来源:互联网公开数据 标签:游戏评价,Steam,EA,FC24,用户反馈,游戏体验,游戏时长,推荐,评论分析 数据概述: 本数据集包含了Steam平台上关于游戏EA...
    packageimg
  • CNBC商业与财经新闻数据集

    2025年4月14日   

    CNBC商业与财经新闻数据集 数据来源:互联网公开数据 标签:CNBC,商业新闻,财经新闻,股票,经济指标,市场分析,新闻研究 数据概述:...
    packageimg
  • 英语单词频率数据集

    2025年4月14日   

    英语单词频率数据集 数据来源:互联网公开数据 标签:单词频率,英语,语料库分析,自然语言处理,文本挖掘,数据可视化,机器学习 数据概述: 本数据集基于Google...
    packageimg
  • 英文引言与标签分类数据集

    2025年4月14日   

    英文引言与标签分类数据集 数据来源:互联网公开数据 标签:引言,作者,标签分类,数据清理,文本分析,数据挖掘 数据概述:...
    packageimg
  • 数据科学领域访谈博客文章互动表现数据集

    2025年4月14日   

    数据科学领域访谈博客文章互动表现数据集 数据来源:互联网公开数据 标签:数据科学,访谈,博客,机器学习,人物访谈,文本分析,社交媒体,互动分析 数据概述: 本数据集包含了Sanyam...
    packageimg
  • 推特情绪数据集SMILE项目

    2025年4月14日   

    推特情绪数据集SMILE项目 数据来源:互联网公开数据 标签:推特,情绪分析,英国博物馆,文化体验,情感分类,领域适应 数据概述:...
    packageimg
  • 尼泊尔语与乌尔都语平行语料库

    2025年4月14日   

    尼泊尔语与乌尔都语平行语料库 数据来源:互联网公开数据 标签:尼泊尔语,乌尔都语,平行语料库,词性标注,宾夕法尼亚树库,机器翻译,语言模型,语料清洗,语言研究 数据概述:...
    packageimg
  • 汽车广告标题数据集

    2025年4月14日   

    汽车广告标题数据集 数据来源:互联网公开数据 标签:汽车广告,模型预测,文本分类,机器学习,NLP,数据预处理,广告分析 数据概述: 本数据集包含从伊朗主流在线市场Divar抓取的汽车广告标题,每个标题均标注了对应的汽车型号,为训练和评估汽车模型预测的机器学习模型提供了宝贵资源。数据集经过预处理,包括文本规范化和标点符号去除,确保数据的一致性和可用性。...
    packageimg
  • 推特用户情感分析主题聚类数据集

    2025年4月14日   

    推特用户情感分析主题聚类数据集 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,主题聚类,自然语言处理,文本挖掘,舆情分析 数据概述: 本数据集包含经过聚类的推特(Twitter)用户推文数据,并结合了情感分析结果。原始数据经过预处理,包括清洗和自然语言处理(NLP)等步骤。数据集的核心是推文聚类,每个聚类代表一个特定的主题或话题。...
    packageimg
  • 印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集

    2025年4月14日   

    印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集 数据来源:互联网公开数据 标签:Covaxin,新冠疫苗,疫苗,推文,社交媒体,巴拉特生物科技,疫情,公共卫生,文本分析 数据概述: 本数据集包含了巴拉特生物科技公司(Bharat Biotech)在Twitter平台上发布的超过200条关于Covaxin新冠疫苗的推文。...
    packageimg
  • 蜜蜂总动员电影数据集

    2025年4月14日   

    蜜蜂总动员电影数据集 数据来源:互联网公开数据 标签:蜜蜂总动员,电影脚本,词频分析,文本挖掘,词汇统计 数据概述:...
    packageimg