找到569个数据集

标签: NLP

过滤结果
  • 新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月

    2025年4月14日   

    新加坡滨海湾金沙酒店TripAdvisor用户评论数据集-2015年1月至2022年10月 数据来源:互联网公开数据 标签:酒店评论,滨海湾金沙,TripAdvisor,用户评价,文本分析,NLP,情感分析,旅游,新加坡 数据概述:...
    packageimg
  • 阿斯利康抗新冠病毒推特数据集

    2025年4月14日   

    阿斯利康抗新冠病毒推特数据集 数据来源:互联网公开数据 标签:阿斯利康,新冠病毒,推特,情感分析,文本挖掘,NLP,社会媒体分析,公众意见 数据概述:...
    packageimg
  • Steam游戏用户评论情感分析数据集

    2025年4月14日   

    Steam游戏用户评论情感分析数据集 数据来源:互联网公开数据 标签:Steam游戏,用户评论,情感分析,推荐系统,NLP,文本挖掘,游戏评价 数据概述: 本数据集包含来自Steam平台的多个游戏的用户评论,以及用户是否推荐该游戏的标签。数据来源于AV JantaHack NLP...
    packageimg
  • 乌尔都语评论情感分类数据集

    2025年4月14日   

    乌尔都语评论情感分类数据集 数据来源:互联网公开数据 标签:乌尔都语,评论,情感分析,自然语言处理,NLP,社交媒体 数据概述:...
    packageimg
  • 自动化记者数据集

    2025年4月14日   

    自动化记者数据集 数据来源:互联网公开数据 标签:自动化记者,文本生成,NLP,新闻摘要,Reddit数据 数据概述: 本数据集来源于正在开发的自动化记者应用程序。数据包括从Reddit获取的对话记录以及由应用程序生成的新闻摘要和新闻内容。该数据集专门用于评估生成文本的质量,适用于自然语言处理(NLP)项目的评估和改进。 数据用途概述:...
    packageimg
  • Reddit问答社区用户提问数据集-AskReddit等-2023

    2025年4月14日   

    Reddit问答社区用户提问数据集-AskReddit等-2023 数据来源:互联网公开数据 标签:Reddit,问答社区,用户提问,NLP,社会研究,数据分析,用户行为 数据概述:...
    packageimg
  • 情感数据集原始版

    2025年4月14日   

    情感数据集原始版 数据来源:互联网公开数据 标签:情感分析,自然语言处理,NLP,情感检测,文本分类,机器学习,聊天机器人,推荐系统,心理健康 数据概述:...
    packageimg
  • 中东地区出行平台用户评论数据集

    2025年4月14日   

    中东地区出行平台用户评论数据集 数据来源: 互联网公开数据 (Google Play Store & Apple App Store) 标签: 用户评论,评论数据,自然语言处理,NLP,情感分析,出行平台 数据概述:...
    packageimg
  • CNBC新闻头条数据集

    2025年4月14日   

    CNBC新闻头条数据集 数据来源:互联网公开数据 标签:CNBC,新闻头条,商业,政治,金融,科技,文本挖掘,情感分析,NLP,市场研究 数据概述: 本数据集收录了500条CNBC发布的新闻头条,涵盖商业、政治、金融、科技等多个领域。数据以CSV格式组织,便于分析。新闻头条的时间跨度较大,涵盖了近期新闻周期中的重要事件。 数据用途概述:...
    packageimg
  • 亚马逊精选美食评论数据集

    2025年4月14日   

    亚马逊精选美食评论数据集 数据来源:互联网公开数据 标签:电子商务,食品,用户评价,自然语言处理,NLP,推荐系统,评分数据,消费行为 数据概述 本数据集是经过精简和清洗的 Amazon Fine Foods...
    packageimg
  • ELLIPSE英语学习者语料库

    2025年4月14日   

    ELLIPSE英语学习者语料库 数据来源:互联网公开数据 标签:英语学习者,语言能力评价,语料库,NLP,语言研究,教育评估,写作分析 数据概述:...
    packageimg
  • 乌兹别克斯坦宪法NLP数据集

    2025年4月14日   

    乌兹别克斯坦宪法NLP数据集 数据来源:互联网公开数据 标签:乌兹别克斯坦宪法,自然语言处理,NLP,乌兹别克语,自动纠正,拼写检查,语言模型 数据概述: 本数据集来源于我的YouTube频道的直播内容,旨在为乌兹别克语(O'zbek语)创建一个自动纠正(拼写检查)的概率模型。数据集包含了乌兹别克斯坦宪法的文本,为训练语言模型提供了基础。...
    packageimg
  • 斯里兰卡Singlish与僧伽罗语对话数据集

    2025年4月14日   

    斯里兰卡Singlish与僧伽罗语对话数据集 数据来源:互联网公开数据 标签:Singlish,僧伽罗语,对话数据集,NLP,聊天机器人,机器翻译,语言学习,社会媒体分析,语言研究 数据概述:...
    packageimg
  • RAG与Few-Shot相似问题提示数据集

    2025年4月14日   

    RAG与Few-Shot相似问题提示数据集 数据来源:互联网公开数据 标签:相似问题,嵌入向量,提示生成,RAG,Few Shot学习,自然语言处理,NLP 数据概述:...
    packageimg
  • 英语单词家族数据集1963-2021

    2025年4月14日   

    英语单词家族数据集1963-2021 数据来源:互联网公开数据 标签:英语单词,词典,自然语言处理,NLP,词汇学,教育培训 数据概述: 本数据集收录了按字母顺序排列的全部英语单词,涵盖了从A到Z的所有单词条目。数据集适用于自然语言处理项目的参考和验证,为词典编纂、词汇学研究和教育培训提供了全面的单词资源。 数据用途概述:...
    packageimg
  • Goodreads网站精选名言数据集

    2025年4月14日   

    Goodreads网站精选名言数据集 数据来源:互联网公开数据 标签:名言,语录,励志,格言,作者,文学,情感分析,文本生成,NLP 数据概述:...
    packageimg
  • 西班牙诗歌数据集

    2025年4月14日   

    西班牙诗歌数据集 数据来源:互联网公开数据 标签:西班牙诗歌,NLP,文学分析,自然语言处理,诗歌爬虫,文学结构,文本挖掘 数据概述: 本数据集收录了从1960年代至今的大量西班牙诗歌作品,数据来源于2020年7月从诗歌网站www.poemas-del-...
    packageimg
  • 金融新闻情感数据集

    2025年4月14日   

    金融新闻情感数据集 数据来源:互联网公开数据 标签:金融新闻,情感分析,NLP,文本处理,数据清洗,股票市场 数据概述: 本数据集包含标注了情感标签的金融新闻文本,适用于自然语言处理(NLP)任务。数据集经过了一系列文本处理操作,包括去除空值、删除重复项、平衡各类情感标签的数量、去除前后空格和换行符、移除URL、展开缩写(如将“it's”转换为“it...
    packageimg
  • 推特讽刺分类数据集

    2025年4月14日   

    推特讽刺分类数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据 数据概述: 本数据集包含了大量推特帖子,并被分类为讽刺性内容,并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源,可用于训练和测试模型。 数据用途概述:...
    packageimg
  • 特拉维夫短租Facebook帖子数据集-2015年

    2025年4月14日   

    特拉维夫短租Facebook帖子数据集-2015年 数据来源:互联网公开数据 标签:短租,特拉维夫,Facebook,社交媒体,房地产,希伯来语,NLP,文本分析,价格分析 数据概述: 本数据集收录了2015年从Facebook群组“特拉维夫短租” (希伯来语:סאבלטים בתל אביב לתקופות קצרות)...
    packageimg