找到11,799个数据集

标签: 自然语言处理

过滤结果
  • 亚马逊商品英文评论及其法语翻译数据集

    2025年4月27日   

    亚马逊商品英文评论及其法语翻译数据集 数据来源:互联网公开数据 标签:亚马逊评论,英文,法语,翻译,自然语言处理,多语言数据,商品评价 数据概述: 本数据集包含从1996年至2014年间亚马逊商品的英文评论,并提供了这些评论的法语翻译。数据集涵盖了多种商品类别,每条评论均包含原始英文文本及其对应的法语翻译,为研究多语言自然语言处理提供了丰富的数据资源。...
    packageimg
  • NLP模型偏差分析与因果推断实验数据集

    2025年4月27日   

    NLP模型偏差分析与因果推断实验数据集 数据来源:互联网公开数据 标签:因果推断,自然语言处理,NLP,反事实分析,模型评估,因果效应,分类模型 数据概述...
    packageimg
  • 泰米尔语新闻分类数据集

    2025年4月27日   

    泰米尔语新闻分类数据集 数据来源:互联网公开数据 标签:泰米尔语,新闻分类,文本分类,自然语言处理,新闻文章,文本数据,机器学习 数据概述:...
    packageimg
  • 多文档摘要对话语料集

    2025年4月27日   

    多文档摘要对话语料集 数据来源:互联网公开数据 标签:多文档摘要,对话结构,元评论生成,学术论文,自然语言处理,文本摘要,机器学习 数据概述:...
    packageimg
  • 英泰翻译质量评估数据集

    2025年4月27日   

    英泰翻译质量评估数据集 数据来源:互联网公开数据 标签:翻译质量,机器翻译,情感分析,英泰双语,自然语言处理,NLP 数据概述:...
    packageimg
  • 信德语文章数据集

    2025年4月27日   

    信德语文章数据集 数据来源:互联网公开数据 标签:信德语,自然语言处理,NLP,文本分析,聚类,时间序列,语言数据,文章数据 数据概述:...
    packageimg
  • 土耳其情感分析数据集

    2025年4月27日   

    土耳其情感分析数据集 数据来源:互联网公开数据 标签:情感分析,土耳其,文本数据,正向情感,负向情感,中性情感,自然语言处理 数据概述:...
    packageimg
  • 政治邮件数据集

    2025年4月27日   

    政治邮件数据集 数据来源:互联网公开数据 标签:政治邮件,文本分析,选举研究,政治话语,数据挖掘,自然语言处理 数据概述:...
    packageimg
  • 社交媒体情感分析Twitter推文数据集-2023年

    2025年4月27日   

    社交媒体情感分析Twitter推文数据集-2023年 数据来源:互联网公开数据 标签:Twitter,推文,情感分析,社交媒体,文本数据,自然语言处理,机器学习,舆情分析 数据概述:...
    packageimg
  • AI竞赛DAIGT文本生成检测数据集

    2025年4月27日   

    AI竞赛DAIGT文本生成检测数据集 数据来源:互联网公开数据 标签:文本生成, AI检测, 竞赛数据, 自然语言处理, 逆向工程, 替换映射, 文本匹配 数据概述:...
    packageimg
  • 推特名人推文嵌入数据集

    2025年4月27日   

    推特名人推文嵌入数据集 数据来源:互联网公开数据 标签:推特,名人,自然语言处理,文本嵌入,社交媒体分析,机器学习,数据科学 数据概述: 本数据集包含了推特平台上排名前1000位知名名人账户的推文及其对应的文本嵌入向量。数据集共包含915位名人用户的推文,推文内容通过tweepy(Python语言的Twitter...
    packageimg
  • 阅读理解竞赛数据集

    2025年4月27日   

    阅读理解竞赛数据集 数据来源:互联网公开数据 标签:阅读理解,竞赛,教育,自然语言处理,文本分析,机器学习,英语学习 数据概述:...
    packageimg
  • AES-2回译多语种数据集

    2025年4月27日   

    AES-2回译多语种数据集 数据来源:互联网公开数据 标签:回译,多语种,数据增强,自然语言处理,机器翻译,AES-2竞赛,跨语言分析 数据概述:...
    packageimg
  • Reddit社区百万笑话文本数据集-r-jokes-2024

    2025年4月27日   

    Reddit社区百万笑话文本数据集-r-jokes-2024 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,自然语言处理,情感分析,机器学习,幽默,社交媒体 数据概述:...
    packageimg
  • 泰语语料库数据集

    2025年4月27日   

    泰语语料库数据集 数据来源:互联网公开数据 标签:泰语,语料库,自然语言处理,机器学习,文本分析,泰文字体,分词算法 数据概述:...
    packageimg
  • 问答模型训练与测试数据集

    2025年4月27日   

    问答模型训练与测试数据集 数据来源:互联网公开数据 标签:问答模型,训练数据,测试数据,机器学习,自然语言处理,对话系统,教育材料,信息检索,客户支持,语言生成 数据概述: 本数据集用于训练和测试问答模型,包含多个列,为每个条目提供重要的信息。这些列包括: - instruction:模型生成响应的具体指令。 -...
    packageimg
  • 文本处理能力提升数据集

    2025年4月27日   

    文本处理能力提升数据集 数据来源:互联网公开数据 标签:文本处理,自然语言处理,编码技能,学习资源,技术培训,数据清洗,特征提取,文本分析,机器学习 数据概述:...
    packageimg
  • IMDB电影类型分类数据集1963-2021

    2025年4月26日   

    IMDB电影类型分类数据集1963-2021 数据来源:互联网公开数据 标签:电影,类型分类,自然语言处理,机器学习,数据可视化,推荐系统,文本分析 数据概述:...
    packageimg
  • MyAnimeList动漫评论情感分析数据集MALCoD-2006-2019

    2025年4月26日   

    MyAnimeList动漫评论情感分析数据集MALCoD-2006-2019 数据来源:互联网公开数据 标签:动漫评论,MyAnimeList,情感分析,自然语言处理,动漫趋势,动漫流派,用户评论 数据概述: 本数据集包含了MyAnimeList.net网站自2006年以来超过13万条的动漫评论。这些评论是通过开源爬虫程序MyAnimeList-...
    packageimg
  • 社交媒体情绪分析推文数据集-2009年

    2025年4月26日   

    社交媒体情绪分析推文数据集-2009年 数据来源:互联网公开数据 标签:情绪分析,推文,社交媒体,自然语言处理,情感分类,机器学习,文本数据,Twitter 数据概述:...
    packageimg