找到16,261个数据集

标签: 自然语言处理

过滤结果
  • 超义关系数据集

    2025年4月15日   

    超义关系数据集 数据来源:互联网公开数据 标签:超义关系,自然语言处理,NLP,词汇语义,知识库,机器学习,神经网络,WordNet,DBPedia,Wikidata,Yago 数据概述:...
    packageimg
  • 确定代词消解数据集

    2025年4月15日   

    确定代词消解数据集 数据来源:互联网公开数据 标签:确定代词消解,代词,自然语言处理,消解任务,EMNLP,谷歌数据集,GAP 数据概述:...
    packageimg
  • 新型对话生成与分析数据集2023

    2025年4月15日   

    新型对话生成与分析数据集2023 数据来源:互联网公开数据 标签:对话生成,自然语言处理,人工智能,聊天机器人,人机交互,用户画像,对话分析 数据概述: 本数据集包含11,001条基于用户画像的对话,专门用于自然语言处理(NLP)任务。每条记录包括两位用户的基本信息(User 1 Persona和User 2...
    packageimg
  • 旅行体验与偏好研究数据集2021-2023

    2025年4月15日   

    旅行体验与偏好研究数据集2021-2023 数据来源:互联网公开数据 标签:旅行,用户偏好,体验分析,社交媒体,Reddit,数据分析,市场研究 数据概述:...
    packageimg
  • 多语言软件缺陷报告及其翻译数据集1963-2025

    2025年4月15日   

    多语言软件缺陷报告及其翻译数据集1963-2025 数据来源:互联网公开数据 标签:多语言,软件缺陷报告,翻译,自然语言处理,机器翻译,跨语言分析 数据概述:...
    packageimg
  • 卡塔尔腐败丑闻社交媒体推文数据集

    2025年4月15日   

    卡塔尔腐败丑闻社交媒体推文数据集 数据来源:互联网公开数据 标签:卡塔尔腐败丑闻,社交媒体分析,政治事件,欧洲议会,公共事务,数据挖掘,舆论研究 数据概述:...
    packageimg
  • 新闻组文章分类数据集1990-2000

    2025年4月15日   

    新闻组文章分类数据集1990-2000 数据来源:互联网公开数据 标签:新闻组,文本分类,文本预处理,文本聚类,主题挖掘,主题分类,自然语言处理 数据概述:...
    packageimg
  • 查询意图领域分类数据集

    2025年4月15日   

    查询意图领域分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,查询意图,领域分类,搜索引擎,NLP,机器学习 数据概述:...
    packageimg
  • 公告牌热门单曲榜单歌曲特征与歌词数据集-2000至2023年

    2025年4月15日   

    公告牌热门单曲榜单歌曲特征与歌词数据集-2000至2023年 数据来源:互联网公开数据 标签:音乐,公告牌,热门单曲,歌曲,歌词,Spotify,音乐分析,推荐系统,文化研究 数据概述: 本数据集整合了公告牌热门单曲榜单(Billboard...
    packageimg
  • COVID-19疫苗公众反应推特数据集

    2025年4月15日   

    COVID-19疫苗公众反应推特数据集 数据来源:互联网公开数据 数据集说明: 本数据集收集了与 Covishield 新冠疫苗 相关的推文文本,旨在支持自然语言处理(NLP)任务,如情感分析、主题提取、公众反应趋势研究等。Covishield 是由阿斯利康与牛津大学合作研发,并由印度血清研究所(Serum Institute of...
    packageimg
  • Reddit抑郁文本情感分析与TF-IDF特征数据集

    2025年4月15日   

    Reddit抑郁文本情感分析与TF-IDF特征数据集 数据来源:互联网公开数据 标签:情感分析,TF-IDF,Reddit,抑郁研究,自然语言处理,额外特征,社会情感 数据概述:...
    packageimg
  • 灾害推文地理位置数据集

    2025年4月15日   

    灾害推文地理位置数据集 数据来源:互联网公开数据 标签:灾害推文,地理位置,自然语言处理,竞赛数据,地理编码,空间分析 数据概述: 本数据集来源于“真实还是假?灾害推特”自然语言处理竞赛中的预清理位置字段,包含了推文的地理位置信息。数据通过使用geopy库结合ArcGIS地理编码服务提取,为地理空间分析提供了方便。 数据用途概述:...
    packageimg
  • 多语言仇恨言论分析数据集1963-2021

    2025年4月15日   

    多语言仇恨言论分析数据集1963-2021 数据来源:互联网公开数据 标签:仇恨言论,多语言,法语,意大利语,西班牙语,俄语,土耳其语,英语,葡萄牙语,文本分析,自然语言处理 数据概述:...
    packageimg
  • Net-a-Porter与MrPorter奢侈时尚商品数据集

    2025年4月15日   

    Net-a-Porter与MrPorter奢侈时尚商品数据集 数据来源:互联网公开数据 标签:奢侈时尚,电商,Net-a-Porter,Mr Porter,品牌分析,市场趋势,价格,商品描述,时尚零售 数据概述: 本数据集包含了来自Net-a-Porter和Mr Porter两大在线奢侈时尚零售商的商品信息。Net-a-...
    packageimg
  • 自然语言问答数据集QDMR分解结构分析数据集

    2025年4月15日   

    自然语言问答数据集QDMR分解结构分析数据集 数据来源:互联网公开数据 标签:自然语言处理,问答系统,语义分解,QDMR,数据集,文本分析,机器学习,计算机科学 数据概述:...
    packageimg
  • 引言数据集

    2025年4月15日   

    引言数据集 数据来源:互联网公开数据 标签:引言,文本分析,内容推荐系统,自然语言处理,用户偏好,数据分析 数据概述: 本数据集收录了大量引言文本,旨在用于构建基于内容的推荐系统。数据集包括不同来源的引言,涵盖广泛的主题和风格,为文本数据的分析和处理提供了丰富的材料。 数据用途概述:...
    packageimg
  • 荷马伊利亚特文本数据集

    2025年4月15日   

    荷马伊利亚特文本数据集 数据来源:互联网公开数据 标签:荷马,伊利亚特,双语文本,希腊语,英语,翻译,文学分析,语言学,比较文学 数据概述: 本数据集包含荷马史诗《伊利亚特》的双语文本,分别为希腊语原文和英文翻译。数据集由三个表格组成,每个表格包含分析《伊利亚特》所需的必要信息。 希腊文本表:...
    packageimg
  • TREC问题分类数据集

    2025年4月15日   

    TREC问题分类数据集 数据来源:互联网公开数据 标签:问题分类,机器学习,自然语言处理,信息检索,数据集,文本分析,学术研究 数据概述:...
    packageimg
  • 阿拉伯语方言社交媒体情感分析数据集

    2025年4月15日   

    阿拉伯语方言社交媒体情感分析数据集 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,社交媒体,自然语言处理,机器学习,文本挖掘 数据概述:...
    packageimg
  • CEFR级别英语文本数据集

    2025年4月15日   

    CEFR级别英语文本数据集 数据来源:互联网公开数据 标签:CEFR, 英语学习, 阅读理解, 对话, 描述, 短故事, 新闻报道, 教育资源 数据概述: 本数据集包含约1500篇英语文本,每篇文本都根据欧洲共同语言参考框架(CEFR)水平(A1, A2, B1, B2, C1,...
    packageimg