找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 印尼DANA应用评分评论数据集

    2025年4月14日   

    印尼DANA应用评分评论数据集 数据来源:互联网公开数据 标签:DANA应用,印尼,谷歌Play商店,用户评论,评分,情感分析,NLP任务 数据概述: 本数据集收录了从谷歌Play商店印尼版获取的50,000条关于DANA应用的用户评论,每条评论均附带用户名称、评分、评论日期、评论内容以及情感标注。该数据集为自然语言处理任务提供了丰富的文本数据资源。...
    packageimg
  • 阿拉伯诗歌情感分析数据集2021

    2025年4月14日   

    阿拉伯诗歌情感分析数据集2021 数据来源:互联网公开数据 标签:阿拉伯诗歌,情感分析,自然语言处理,文学研究,情感分类 数据概述: 本数据集收录了超过9000首阿拉伯诗歌,并由三类情感标签进行标注,即积极、消极和中性。这些诗歌涵盖了广泛的文学时期和风格,为情感分析和自然语言处理研究提供了丰富的资源。 数据用途概述:...
    packageimg
  • 讽刺语句分析数据集

    2025年4月14日   

    讽刺语句分析数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,文本分析,情感分析,机器学习,语义理解 数据概述: 本数据集包含1950条评论,每条评论由人工标注为讽刺性(1)或非讽刺性(-1)。数据集旨在提供一个用于讽刺语句识别的基准集合,帮助研究人员和开发者训练和评估文本分析模型。 数据用途概述:...
    packageimg
  • WinoGrande-常识推理挑战数据集

    2025年4月14日   

    WinoGrande-常识推理挑战数据集 数据来源:互联网公开数据 标签:自然语言处理,常识推理,文本理解,完形填空,机器阅读理解,AI,NLP 数据概述: WinoGrande是一个包含44,000个问题的集合,灵感来源于Winograd Schema...
    packageimg
  • 沙特阿拉伯新冠疫情情绪分析推特数据集2020-2021

    2025年4月14日   

    沙特阿拉伯新冠疫情情绪分析推特数据集2020-2021 数据来源:互联网公开数据 标签:新冠疫情,情绪分析,沙特阿拉伯,推特数据,深度学习,公共卫生,社会影响 数据概述:...
    packageimg
  • 土耳其教育数据集用于LLM微调

    2025年4月14日   

    土耳其教育数据集用于LLM微调 数据来源:互联网公开数据 标签:土耳其教育,LLM微调,自然语言处理,巴塔然阿斯兰,巴图汗凯莱姆,奥默法鲁克切利克,T3 AI,教育系统,微调数据集 数据概述: 本数据集旨在用于微调T3 AI土耳其LLM。该数据集由巴塔然阿斯兰、巴图汗凯莱姆和奥默法鲁克切利克为T3...
    packageimg
  • 马拉维新闻分类挑战数据集

    2025年4月14日   

    马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio...
    packageimg
  • 安然公司员工电子邮件通信数据集1999-2004

    2025年4月14日   

    安然公司员工电子邮件通信数据集1999-2004 数据来源:互联网公开数据 标签:安然公司,员工通信,电子邮件,企业沟通,情感分析,关键词识别,语言学研究 数据概述:...
    packageimg
  • 印度短信垃圾信息与正常信息分类数据集

    2025年4月14日   

    印度短信垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,文本分类,自然语言处理,数据分析,机器学习,信息过滤 数据概述:...
    packageimg
  • 印度医疗问答数据集1963-2021

    2025年4月14日   

    印度医疗问答数据集1963-2021 数据来源:互联网公开数据 标签:医疗问答,印度,健康,数据集,自然语言处理,机器学习,医疗研究 数据概述: 本数据集包含10045条记录,源自MedQuad医疗问答数据集,涵盖了广泛的医疗问题和答案。数据内容涉及不同医学领域,为医疗研究、问答系统开发和自然语言处理提供了丰富的资源。 数据用途概述:...
    packageimg
  • 艾瑞莎黑兹斯唱片集数据集

    2025年4月14日   

    艾瑞莎黑兹斯唱片集数据集 数据来源:互联网公开数据 标签:艾瑞莎黑兹斯,菲律宾音乐,音乐分析,音频特征,歌词,时间序列,音乐趋势,音乐教育 数据概述:...
    packageimg
  • 社交媒体Omicron话题讨论推文数据集-2021年11月30日至今

    2025年4月14日   

    社交媒体Omicron话题讨论推文数据集-2021年11月30日至今 数据来源:互联网公开数据 标签:Omicron,新冠病毒,社交媒体,推文,舆情分析,文本挖掘,趋势分析,情感分析,地理分布 数据概述: 本数据集收集了使用Twitter...
    packageimg
  • 白宫演讲与讲话数据集

    2025年4月14日   

    白宫演讲与讲话数据集 数据来源:互联网公开数据 标签:白宫,演讲,讲话,情感分析,NLP,时间序列,地点分析,文本数据 数据概述: 本数据集包含1963年至2021年间白宫发布的1100篇演讲和讲话记录。数据集涵盖标题、演讲日期、地点和演讲文本等四个关键字段,为情感分析、自然语言处理等应用提供了丰富的文本资源。 数据用途概述:...
    packageimg
  • 推特情感分析百万级推文数据集-情感倾向分析-2024

    2025年4月14日   

    推特情感分析百万级推文数据集-情感倾向分析-2024 数据来源:互联网公开数据 标签:推特,情感分析,推文,文本数据,情感倾向,自然语言处理,机器学习,情感分类 数据概述:...
    packageimg
  • 开放获取期刊研究库数据集

    2025年4月14日   

    开放获取期刊研究库数据集 数据来源:互联网公开数据 标签:开放获取期刊,研究库,学术资源,全球分析,出版趋势,权利信息,数据可视化 数据概述:...
    packageimg
  • 改良后的印地语-孟加拉语仇恨言论数据集

    2025年4月14日   

    改良后的印地语-孟加拉语仇恨言论数据集 数据来源:互联网公开数据 标签:仇恨言论,印地语,孟加拉语,多标签分类,文本分析,语言处理,社会研究 数据概述:...
    packageimg
  • 推文情感提取扩展数据集

    2025年4月14日   

    推文情感提取扩展数据集 数据来源:互联网公开数据 标签:情感分析,推文,自然语言处理,NLP,扩展数据,特征提取,文本分析,数据处理 数据概述:...
    packageimg
  • 罗伊诉韦德案取消后推特立场观点数据集1963-2021

    2025年4月14日   

    罗伊诉韦德案取消后推特立场观点数据集1963-2021 数据来源:互联网公开数据 标签:推特数据,罗伊诉韦德案,立场观点,社会议题,情感分析,文本分类,公共讨论 数据概述:...
    packageimg
  • 马德里西班牙体育新闻数据集

    2025年4月14日   

    马德里西班牙体育新闻数据集 数据来源:互联网公开数据 标签:西班牙,体育新闻,文章数据,时间序列,新闻分析,内容挖掘 数据概述:...
    packageimg
  • 综合园艺维基数据集

    2025年4月14日   

    综合园艺维基数据集 数据来源:互联网公开数据 标签:园艺,维基,植物学,合成数据,语义分离,自然语言处理,测试数据,机器学习 数据概述: 本数据集是一个实验性的合成数据集,基于小型维基百科中关于园艺和植物学的条目集合。数据内容由Claude...
    packageimg