找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 联合国一般性辩论文本集

    2025年4月14日   

    联合国一般性辩论文本集 数据来源:互联网公开数据 标签:联合国,一般性辩论,政治话语,文本分析,国际关系,NLP,全球治理,多边外交,历史记录,政治文本,政策分析 数据概述:...
    packageimg
  • NBME临床患者笔记修正数据集

    2025年4月14日   

    NBME临床患者笔记修正数据集 数据来源:互联网公开数据 标签:临床笔记,患者记录,修正,注释,医学,数据标注,校正 数据概述: 本数据集是基于Kaggle竞赛数据集(https://www.kaggle.com/competitions/nbme-score-clinical-patient-...
    packageimg
  • 波斯语情绪分析与分类数据集

    2025年4月14日   

    波斯语情绪分析与分类数据集 数据来源:互联网公开数据 标签:情绪分析,波斯语,文本分类,自然语言处理,情感识别,机器学习 数据概述:...
    packageimg
  • ChatGPT医疗应用研究文献数据集

    2025年4月14日   

    ChatGPT医疗应用研究文献数据集 数据来源:互联网公开数据 标签:PubMed, 医疗, ChatGPT, 研究论文, 文本分析, 长上下文建模, 大语言模型, Gemini 数据概述: 本数据集由 Google - Gemini Long Context 竞赛产生,包含通过 PubMed 搜索获取的关于 ChatGPT...
    packageimg
  • 日语词汇按级别分类数据集

    2025年4月14日   

    日语词汇按级别分类数据集 数据来源:互联网公开数据 标签:日语学习, JLPT, 词汇表, 日语测试, 语言学习 数据概述:...
    packageimg
  • 数据2022年Goodreads最佳浪漫小说数据集

    2025年4月14日   

    数据2022年Goodreads最佳浪漫小说数据集 数据来源:互联网公开数据 标签:Goodreads,最佳浪漫小说,2022,书评,数据清洗,情感分析 数据概述:...
    packageimg
  • 微软位置提及识别实践数据集

    2025年4月14日   

    微软位置提及识别实践数据集 数据来源:互联网公开数据 标签:位置提及识别,微博客,紧急情况,灾害响应,救援活动,推特,文本分析 数据概述:...
    packageimg
  • 印度新闻数据集

    2025年4月14日   

    印度新闻数据集 数据来源:互联网公开数据 标签:印度新闻,媒体分析,新闻摘要,文本数据,应用开发,学术研究,政治,科技 数据概述: 本数据集精心汇集了来自印度各地多份知名英文报纸的丰富文本资料及简明摘要,涵盖从政治到科技等多元领域。数据集为应用开发和深入研究提供了坚实的基础,支持细致的分析和创新性的探索。 数据用途概述:...
    packageimg
  • ICC社交媒体数据集

    2025年4月14日   

    ICC社交媒体数据集 数据来源:互联网公开数据 标签:ICC,社交媒体,数据科学,情感分析,趋势分析,参与度分析,网络分析,NLP,体育社区,粉丝参与 数据概述:...
    packageimg
  • 英国冠状病毒新闻文章数据集

    2025年4月14日   

    英国冠状病毒新闻文章数据集 数据来源:互联网公开数据 标签:冠状病毒,英国新闻,数据抓取,文本分类,新闻媒体,疫情报道,机器学习 数据概述:...
    packageimg
  • LLM恢复对齐数据集

    2025年4月14日   

    LLM恢复对齐数据集 数据来源:互联网公开数据 标签:语言模型,恢复对齐,自然语言处理,NLP,生成模型,对齐评估,文本生成 数据概述 本数据集由Gemma-7b-it模型生成,使用最大token长度设置为256。数据集包含两部分内容:原始文本(document)和重写文本(rewritten)。原始文本来源于Hugging...
    packageimg
  • 越南合成学生反馈语料库

    2025年4月14日   

    越南合成学生反馈语料库 数据来源:互联网公开数据 标签:越南,学生反馈,情感分析,合成数据,ChatGPT,教育,餐厅评论 数据概述: 合成越南学生反馈语料库是一个基于UIT-...
    packageimg
  • 推特情感分析数据集-2009年

    2025年4月14日   

    推特情感分析数据集-2009年 数据来源:互联网公开数据 标签:情感分析,文本挖掘,推特,社交媒体,机器学习,自然语言处理,情绪识别 数据概述: 本数据集包含2009年推特上的推文数据,用于情感分析研究。...
    packageimg
  • 尼泊尔新闻内容分析数据集

    2025年4月14日   

    尼泊尔新闻内容分析数据集 数据来源:互联网公开数据 标签:尼泊尔新闻,新闻分析,政治,社会,经济,技术,文化,趋势分析,情感分析 数据概述:...
    packageimg
  • 耳机评论数据集

    2025年4月14日   

    耳机评论数据集 数据来源:互联网公开数据 标签:耳机,评论,情感分析,中文文本,规则标注,用户反馈,产品评测 数据概述: 本数据集来自耳机大家坛(erji.net),这是一个面向中文用户的公开论坛,用户可在该平台上分享和评论不同耳机的使用体验。数据集涵盖了大量耳机产品的用户评论文本,并通过规则-...
    packageimg
  • 反对大众旅游抗议数据集2014-2017

    2025年4月14日   

    反对大众旅游抗议数据集2014-2017 数据来源:互联网公开数据 标签:大众旅游,抗议活动,城市反对,媒体分析,叙事研究,威尼斯,阿姆斯特丹,巴塞罗那 数据概述:...
    packageimg
  • Midjourney图像生成关键词增强词汇统计数据集-2023年7月

    2025年4月14日   

    Midjourney图像生成关键词增强词汇统计数据集-2023年7月 数据来源:互联网公开数据 标签:Midjourney,图像生成,AI绘画,关键词,Prompt,数据分析,文本挖掘 数据概述:...
    packageimg
  • NASA社交媒体推文与公众互动分析数据集2018-2022

    2025年4月14日   

    NASA社交媒体推文与公众互动分析数据集2018-2022 数据来源:互联网公开数据 标签:NASA,社交媒体,推文分析,文本挖掘,时间序列,公众互动,科学传播,NLP 数据概述:...
    packageimg
  • 命名实体识别文本信息标注数据集

    2025年4月14日   

    命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:...
    packageimg
  • 尼采与卢梭相关AI写作提示与回复数据集

    2025年4月14日   

    尼采与卢梭相关AI写作提示与回复数据集 数据来源:互联网公开数据 标签:作家, 对话生成, AI生成, 文学, 尼采, 卢梭, 提示工程 数据概述: 本数据集包含由Gemini模型生成的与两位著名哲学作家——弗里德里希·尼采(Friedrich Nietzsche)与让-雅克·卢梭(Jean-Jacques...
    packageimg