找到560个数据集

标签: NLP

过滤结果
  • 尼泊尔新闻文章文本分类与摘要数据集

    2025年4月15日   

    尼泊尔新闻文章文本分类与摘要数据集 数据来源:互联网公开数据 标签:尼泊尔语,新闻文章,文本分类,文本摘要,自然语言处理,NLP,机器学习,文本数据 数据概述: 本数据集包含约7500篇尼泊尔语新闻文章,来源于多个尼泊尔新闻网站。数据集经过清洗,包含相对平衡的训练集和测试集,适用于训练和评估尼泊尔语文本分类模型和文本摘要模型。 数据用途概述:...
    packageimg
  • 印度LGBTQ社区骄傲月情感检测引语数据集2023

    2025年4月15日   

    印度LGBTQ社区骄傲月情感检测引语数据集2023 数据来源:互联网公开数据 标签:LGBTQ,骄傲月,情感分析,引语,社会包容,OCR,NLP,机器学习 数据概述: 本数据集收录了在印度骄傲月期间上传的引语,旨在通过机器学习模型分析这些引语的情感倾向。数据集涵盖了多种引语内容,包括正面、负面和随机情感,为研究情感分析和自然语言处理提供了丰富的素材。...
    packageimg
  • 异构数据集文本-数值-有序列

    2025年4月15日   

    异构数据集文本-数值-有序列 数据来源:互联网公开数据 标签:NLP,文本数据,数值数据,有序数据,特征工程,列转换器,机器学习,产品决策,合成数据 数据概述:...
    packageimg
  • 阿拉伯字母文本生成数据集

    2025年4月15日   

    阿拉伯字母文本生成数据集 数据来源:互联网公开数据 标签:阿拉伯字母,文本生成,NLP,内容创作,消息生成,请求响应,多样数据 数据概述:...
    packageimg
  • 英语语言学习者能力评估语料库1963-2021

    2025年4月15日   

    英语语言学习者能力评估语料库1963-2021 数据来源:互联网公开数据 标签:英语学习者,语言能力评估,写作样本,语料库,NLP,教育研究,评估方法 数据概述:...
    packageimg
  • 社交媒体情绪分析英语推文数据集-SemEval2018

    2025年4月15日   

    社交媒体情绪分析英语推文数据集-SemEval2018 数据来源:互联网公开数据 标签:推文,情感分析,情绪识别,自然语言处理,文本挖掘,社交媒体,英语,SemEval,NLP 数据概述: 本数据集源自SemEval-2018 Task...
    packageimg
  • 猴痘疫情Reddit讨论主题数据集-2022

    2025年4月15日   

    猴痘疫情Reddit讨论主题数据集-2022 数据来源:互联网公开数据 标签:猴痘,传染病,疫情,Reddit,社交媒体,数据分析,NLP,公共卫生 数据概述: 本数据集包含从 Reddit 平台上收集的关于猴痘疫情的讨论主题数据,总计约 20,000 条记录。数据来源于 Reddit API 和 praw...
    packageimg
  • 波斯语拼写纠错数据集-FASpell数据集

    2025年4月15日   

    波斯语拼写纠错数据集-FASpell数据集 数据来源:互联网公开数据 标签:波斯语,Farsi,拼写纠错,自然语言处理,NLP,语言学,文本校对,教育,机器学习 数据概述:...
    packageimg
  • Steam游戏平台用户评论文本情感分析数据集-2020年

    2025年4月15日   

    Steam游戏平台用户评论文本情感分析数据集-2020年 数据来源:互联网公开数据 标签:Steam,游戏评论,文本情感分析,自然语言处理,NLP,用户评价,数据清洗,机器学习 数据概述: 本数据集包含了Steam游戏平台的用户评论数据,旨在用于文本情感分析任务。数据集中包含用户针对游戏发表的各种评论,这些评论构成了数据集的核心内容。 数据用途概述:...
    packageimg
  • 伊斯兰教圣训文本分析与研究数据集

    2025年4月15日   

    伊斯兰教圣训文本分析与研究数据集 数据来源:互联网公开数据 标签:圣训, Sunnah, 伊斯兰教, NLP, 自然语言处理, 文本分析, 机器学习, 阿拉伯语, 印尼语, 宗教研究, 文本翻译 数据概述: 本数据集旨在促进使用自然语言处理 (NLP)...
    packageimg
  • 玻利维亚政治人物推特数据集

    2025年4月15日   

    玻利维亚政治人物推特数据集 数据来源:互联网公开数据 标签:玻利维亚,政治人物,推特,NLP,情感分析,选举,政治生态,社交媒体分析 数据概述:...
    packageimg
  • 塔马兹伊特NLP-庞图恩翻译数据集

    2025年4月14日   

    塔马兹伊特NLP-庞图恩翻译数据集 数据来源:互联网公开数据 标签:塔马兹伊特,语言处理,NLP,翻译,庞图恩,数据集,教育培训 数据概述: 塔马兹伊特NLP-...
    packageimg
  • 文本情感分析数据集-情感识别文本样本集

    2025年4月14日   

    文本情感分析数据集-情感识别文本样本集 数据来源:互联网公开数据 标签:情感分析,情绪识别,自然语言处理,NLP,文本数据,机器学习,情感分类 数据概述:...
    packageimg
  • 卡纳达语数据集

    2025年4月14日   

    卡纳达语数据集 数据来源:互联网公开数据 标签:卡纳达语,自然语言处理,NLP,语言模型,多样文本,精细调优,古吉拉特语 数据概述...
    packageimg
  • 联合国一般性辩论文本集

    2025年4月14日   

    联合国一般性辩论文本集 数据来源:互联网公开数据 标签:联合国,一般性辩论,政治话语,文本分析,国际关系,NLP,全球治理,多边外交,历史记录,政治文本,政策分析 数据概述:...
    packageimg
  • ICC社交媒体数据集

    2025年4月14日   

    ICC社交媒体数据集 数据来源:互联网公开数据 标签:ICC,社交媒体,数据科学,情感分析,趋势分析,参与度分析,网络分析,NLP,体育社区,粉丝参与 数据概述:...
    packageimg
  • LLM恢复对齐数据集

    2025年4月14日   

    LLM恢复对齐数据集 数据来源:互联网公开数据 标签:语言模型,恢复对齐,自然语言处理,NLP,生成模型,对齐评估,文本生成 数据概述 本数据集由Gemma-7b-it模型生成,使用最大token长度设置为256。数据集包含两部分内容:原始文本(document)和重写文本(rewritten)。原始文本来源于Hugging...
    packageimg
  • NASA社交媒体推文与公众互动分析数据集2018-2022

    2025年4月14日   

    NASA社交媒体推文与公众互动分析数据集2018-2022 数据来源:互联网公开数据 标签:NASA,社交媒体,推文分析,文本挖掘,时间序列,公众互动,科学传播,NLP 数据概述:...
    packageimg
  • 全球程序员地理分布与标签数据

    2025年4月14日   

    全球程序员地理分布与标签数据 数据来源:互联网公开数据 数据集说明: 本数据集汇总了 Stack Overflow 平台上用户的位置信息及其最常使用的前 5 个技术标签(tags),用于分析用户的技术兴趣与地域分布之间的关系。标签通常反映用户参与讨论最多的技术领域,如编程语言、框架、工具等。...
    packageimg
  • 印度动作电影评论数据集1963-2021

    2025年4月14日   

    印度动作电影评论数据集1963-2021 数据来源:互联网公开数据 标签:动作电影,电影评论,电影评级,NLP,机器学习,影评分析 数据概述: 本数据集包含超过2300条动作电影的评论,涵盖了电影的详细信息,包括评分等关键要素。评论由活跃影评人撰写,为自然语言处理(NLP)任务和机器学习操作提供了丰富且有价值的资源。 数据用途概述:...
    packageimg