找到560个数据集

标签: NLP

过滤结果
  • 句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513

    2025年4月24日   

    句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,语义分析,语言模型,NLP,数据集,语义相似度 数据概述:该数据集包含来自PAWS项目(Paraphrase Adversarial...
    packageimg
  • Python自然语言处理实践数据集-ndrianahani

    2025年4月24日   

    Python自然语言处理实践数据集-ndrianahani 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,数据集,Python,机器学习,语言模型,文本挖掘 数据概述: 该数据集包含用于Python自然语言处理实践的文本数据,涵盖了多种NLP任务和应用场景。主要特征如下: 时间跨度: 数据记录的时间范围不限,数据集内容持续更新。...
    packageimg
  • 简化虚假新闻数据集

    2025年4月24日   

    简化虚假新闻数据集 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,二分类问题,数据清洗,特征提取,新闻真实性分析 数据概述: 本数据集是虚假新闻与真实新闻数据集的简化版本,旨在为文本分类任务提供训练集。数据集已标注,包含真实新闻与虚假新闻的文本内容,适合作为自然语言处理(NLP)任务的基础数据。数据集经过初步处理,确保数据质量与一致性。...
    packageimg
  • 阿拉伯语情感分析数据集-ouaraskhelilrafik

    2025年4月24日   

    阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。...
    packageimg
  • 乌拉尔联邦大学UrFU自然语言处理NLP作业数据集2022年-vladimirkatin

    2025年4月24日   

    乌拉尔联邦大学UrFU自然语言处理NLP作业数据集2022年-vladimirkatin 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,情感分析,数据集,俄语,机器学习,乌拉尔联邦大学 数据概述: 该数据集包含来自乌拉尔联邦大学(UrFU)自然语言处理课程的作业数据,记录了学生在自然语言处理相关任务中的文本数据和结果。主要特征如下:...
    packageimg
  • 欢乐朋友们对话数据集-jahysama

    2025年4月24日   

    欢乐朋友们对话数据集-jahysama 数据来源:互联网公开数据 标签:欢乐朋友们,对话,剧本,自然语言处理,NLP,电视剧,娱乐,文本数据 数据概述: 本数据集包含电视剧《欢乐朋友们》(Smiling...
    packageimg
  • 中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers

    2025年4月24日   

    中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,中文分词,数据集,文本分析,机器学习,语言处理,NLP,中文处理 数据概述: 该数据集包含中文文本的分词数据,记录了从01月01日到03月31日之间的中文文本的分词结果。主要特征如下:...
    packageimg
  • EMPOLITICON政治演说情感与背景分类数据集-2010年-efatazher

    2025年4月24日   

    EMPOLITICON政治演说情感与背景分类数据集-2010年-efatazher 数据来源:互联网公开数据 标签:EMPOLITICON,政治演说,情感分析,背景分类,NLP,机器学习,美国总统,英国首相,中国总理,俄罗斯总统 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD-donutkashvi

    2025年4月24日   

    斯坦福问答数据集SQuAD-donutkashvi 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器阅读理解,文本理解,深度学习,人工智能,NLP 数据概述: 该数据集包含了斯坦福大学开发的问答数据集,用于评估机器阅读理解能力。主要特征如下:...
    packageimg
  • LinkedIn用户评论情感分析数据集-社交互动与情感洞察-preeti0806

    2025年4月24日   

    LinkedIn用户评论情感分析数据集-社交互动与情感洞察-preeti0806 数据来源:互联网公开数据 标签:LinkedIn,用户评论,情感分析,NLP,社交媒体,用户行为,文本挖掘,情感识别 数据概述:...
    packageimg
  • 自然语言处理作业三测试数据集-hangman1998

    2025年4月24日   

    自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。...
    packageimg
  • 孟加拉语社交媒体新闻操控识别数据集2023-mozaman36

    2025年4月24日   

    孟加拉语社交媒体新闻操控识别数据集2023-mozaman36 数据来源:互联网公开数据 标签:孟加拉语,社交媒体,新闻操控,数据集,NLP,信息识别,假新闻检测,计算术语 数据概述:...
    packageimg
  • MBTI人格类型与恋爱主题文本数据集-yamaerenay

    2025年4月24日   

    MBTI人格类型与恋爱主题文本数据集-yamaerenay 数据来源:互联网公开数据 标签:MBTI,人格类型,恋爱,文本分析,NLP,分类,关键词提取,Enneagram,心理学 数据概述:...
    packageimg
  • AlpacaGPT-4指令跟随推理数据集-2023-thedevastator

    2025年4月24日   

    AlpacaGPT-4指令跟随推理数据集-2023-thedevastator 数据来源:互联网公开数据 标签:NLP,指令跟随,自然语言处理,机器学习,研究,教育,人工智能,科学,推理 数据概述:...
    packageimg
  • 美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh

    2025年4月24日   

    美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh 数据来源:互联网公开数据 标签:事实核查,言论真实性,美国,政治,新闻,数据,分析,NLP 数据概述:...
    packageimg
  • WordNet超义词数据集-2006-duketemon

    2025年4月24日   

    WordNet超义词数据集-2006-duketemon 数据来源:互联网公开数据 标签:WordNet,超义词,语义关系,自然语言处理,NLP,语言学,数据集 数据概述:...
    packageimg
  • 英-马尔地语双语翻译数据集-mayakaripel

    2025年4月24日   

    英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-...
    packageimg
  • 动漫名言数据集-2023-thegame

    2025年4月24日   

    动漫名言数据集-2023-thegame 数据来源:互联网公开数据 标签:动漫,名言,角色,情感分析,NLP,生成式AI,对话系统 数据概述: 本数据集包含来自822部不同动漫作品的约8500条独特名言,涉及2,391个不同的角色。每条记录包括动漫名称、角色姓名以及该角色所说的话语。数据集涵盖了广泛的主题和风格,为自然语言处理任务提供了丰富的素材。...
    packageimg
  • PDF文档摘要提取数据集DrivePDFDataset-atif10

    2025年4月24日   

    PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。...
    packageimg
  • 英法翻译数据集English-FrenchTranslationDataset-endofnight17j03

    2025年4月24日   

    英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:...
    packageimg