找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 常用印地语词汇与语言学习数据集

    2025年4月14日   

    常用印地语词汇与语言学习数据集 数据来源:互联网公开数据 标签:印地语,词汇,语言学习,自然语言处理,翻译,教育,文化研究 数据概述: 本数据集基于IIT...
    packageimg
  • 阿拉伯语日常对话数据集-涵盖5000个对话-多主题-AI生成

    2025年4月14日   

    阿拉伯语日常对话数据集-涵盖5000个对话-多主题-AI生成 数据来源:互联网公开数据 标签:阿拉伯语,对话,语言学,自然语言处理,AI生成,文本数据,文化交流,语言学习 数据概述:...
    packageimg
  • 多语言命名实体识别数据集英语

    2025年4月14日   

    多语言命名实体识别数据集英语 数据来源:互联网公开数据 标签:多语言,命名实体识别,PER,LOC,ORG,MISC,自然语言处理 数据概述: 本数据集为多语言命名实体识别任务提供了一个经过处理的数据集版本,主要来源于GitHub项目(https://github.com/afshinrahimi/mmner),并在Amazon Cloud...
    packageimg
  • 阿尔及利亚汽车市场评论情感数据集

    2025年4月14日   

    阿尔及利亚汽车市场评论情感数据集 数据来源:互联网公开数据 标签:阿尔及利亚,汽车市场,评论分析,情感分析,自然语言处理,市场研究,消费者行为 数据概述:...
    packageimg
  • 孟加拉语词形还原数据集

    2025年4月14日   

    孟加拉语词形还原数据集 数据来源:互联网公开数据 标签:孟加拉语,词形还原,自然语言处理,文本分析,语言学,数据集 数据概述: “孟加拉语词形还原数据集”收录了来自不同文本来源的词形还原词,特别 focus 在泰戈尔短篇小说和涵盖多个领域的新闻文章。该数据集为孟加拉语自然语言处理任务提供了宝贵的资源。 数据用途概述:...
    packageimg
  • 列塔-方塔-1000-分词数据集

    2025年4月14日   

    列塔-方塔-1000-分词数据集 数据来源:互联网公开数据 标签:列塔,方塔,新闻分类,分词处理,文本分析,社会,经济,政治,文化,健康,旅游,科技 数据概述:...
    packageimg
  • 电子邮件情感分析数据集

    2025年4月14日   

    电子邮件情感分析数据集 数据来源:互联网公开数据 标签:电子邮件,情感分析,企业通信,元数据,部门,职位,设备,工作时间,工作日,可视化 数据概述: 本数据集提供了公司内部电子邮件通信的详细信息,包括发件人和收件人的元数据、电子邮件内容及相关属性。数据集结构如下: 电子邮件元数据: - 电子邮件ID:分配给每封电子邮件的唯一标识符。 -...
    packageimg
  • SIGGRAPH会议论文图谱数据集2002-2015

    2025年4月14日   

    SIGGRAPH会议论文图谱数据集2002-2015 数据来源:互联网公开数据 标签:SIGGRAPH,会议论文,知识图谱,自然语言处理,开放信息抽取,学术研究,创新分析 数据概述: 本数据集包含了自2002年至2015年间SIGGRAPH(ACM计算机图形学特别兴趣组)会议1100余篇论文摘要中提取的小型知识图谱。每个图谱由名词-动词-名词(主语-...
    packageimg
  • 航空公司服务体验与乘客评价数据集

    2025年4月14日   

    航空公司服务体验与乘客评价数据集 数据来源:互联网公开数据 标签:航空公司,乘客评价,服务质量,情感分析,文本挖掘,客户反馈,航空业,用户体验 数据概述: 本数据集详细收录了来自乘客的航空公司服务体验评价,旨在捕捉乘客对航空公司、服务以及航班相关体验的情感和观点。数据包含:...
    packageimg
  • 基于方面的情感分析数据集

    2025年4月14日   

    基于方面的情感分析数据集 数据来源:互联网公开数据 标签:情感分析,方面分析,用户评论,自然语言处理,应用评价,文本挖掘,市场研究 数据概述:...
    packageimg
  • 基于加速度计和声音的活动识别数据集

    2025年4月14日   

    基于加速度计和声音的活动识别数据集 数据来源:互联网公开数据 标签:活动识别,加速度计,声音数据,家庭活动,辅助技术,独立生活,老人护理,心理健康监测,机器学习,传感器数据融合,多视图学习 数据概述:...
    packageimg
  • 推特用户活跃度与内容分析数据集-2023年全年

    2025年4月14日   

    推特用户活跃度与内容分析数据集-2023年全年 数据来源:互联网公开数据 标签:推特,社交媒体,用户行为,内容分析,文本挖掘,舆情分析,时间序列,话题趋势 数据概述:...
    packageimg
  • 罗马乌尔都语数据集

    2025年4月14日   

    罗马乌尔都语数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,自然语言处理,NLP,情感分析,电子商务,社交媒体,语言转换,词典资源 数据概述:...
    packageimg
  • 阿拉伯谚语集合数据集

    2025年4月14日   

    阿拉伯谚语集合数据集 数据来源:互联网公开数据 标签:阿拉伯语,谚语,语言模型,文化研究,社会传统,语言学分析,文本挖掘 数据概述: 本数据集是一个全面的阿拉伯谚语集合,包含古典阿拉伯语、 colloquial阿拉伯语和流行阿拉伯语中的谚语及其解释。古典阿拉伯语部分源自Abi al-Fadl al-Maydani al-Nisaburi的《Majma'...
    packageimg
  • 大型表格总结数据集

    2025年4月14日   

    大型表格总结数据集 数据来源:互联网公开数据 标签:表格数据,总结任务,自然语言处理,语言模型训练,复杂数据解析,数据压缩,信息抽取 数据概述:...
    packageimg
  • 阿拉伯嘻哈音乐数据集

    2025年4月14日   

    阿拉伯嘻哈音乐数据集 数据来源:互联网公开数据 标签:嘻哈音乐,阿拉伯语,中东文化,音乐分析,歌词数据,艺人信息,地区分布,音乐趋势 数据概述:...
    packageimg
  • 仓库租赁数据集

    2025年4月14日   

    仓库租赁数据集 数据来源:互联网公开数据 标签:仓库租赁,位置数据,价格信息,面积数据,物业特征,自然语言处理 数据概述:...
    packageimg
  • 纽约时报新闻文章内容摘要数据集-2010至2023年

    2025年4月14日   

    纽约时报新闻文章内容摘要数据集-2010至2023年 数据来源:互联网公开数据 标签:纽约时报,新闻文章,文章内容,摘要,新闻媒体,出版物,时事,文本数据 数据概述: 本数据集包含了2010年至2023年期间,纽约时报(NYTimes)随机抽取的新闻文章摘要信息,共计11865篇文章。数据集包含7个字段,提供了文章的关键信息。 字段包括: *...
    packageimg
  • ChatGPT社交媒体用户情感分析与主题研究推文数据集

    2025年4月14日   

    ChatGPT社交媒体用户情感分析与主题研究推文数据集 数据来源:互联网公开数据 标签:ChatGPT, 社交媒体, 情感分析, 主题建模, 推文, 人工智能, 机器学习, BERT, 文本分析, 自然语言处理 数据概述:...
    packageimg
  • 灾害推文数据集预处理版

    2025年4月14日   

    灾害推文数据集预处理版 数据来源:互联网公开数据 标签:灾害推文,文本预处理,NLP,社交媒体分析,灾害监测,紧急响应,数据清洗 数据概述: 本数据集通过对灾害相关的推文应用各种文本数据预处理技术进行清洗而成。数据集涵盖了经过清理和预处理的推文文本,为灾害监测和紧急响应分析提供了高质量的数据支持。 数据用途概述:...
    packageimg