找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 数据2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh

    2025年4月24日   

    2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh 数据来源:互联网公开数据 标签:多语言模型,自然语言处理,数据集,机器学习,文本标注,基准测试,人工智能,语言技术 数据概述: 该数据集由2025年大规模多语言模型基准(MMLM...
    packageimg
  • 讯飞农业领域数据集-xuyatian

    2025年4月24日   

    讯飞农业领域数据集-xuyatian 数据来源:互联网公开数据 标签:农业,数据集,自然语言处理,人工智能,文本分析,农业科技,信息抽取,命名实体识别 数据概述:该数据集包含来自讯飞公开的农业领域相关数据,涵盖了农业领域的技术文档,新闻报道,专家访谈,学术论文等多种文本类型。主要特征如下:...
    packageimg
  • 孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse

    2025年4月24日   

    孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,孟加拉语,文本分类,机器学习,情感识别,文本挖掘 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务,旨在识别和分类文本中的情感倾向。主要特征如下:...
    packageimg
  • Python问题与答案数据集PythonQuestionandAnswerDataset-suhawni

    2025年4月24日   

    Python问题与答案数据集PythonQuestionandAnswerDataset-suhawni 数据来源:互联网公开数据 标签:编程,数据集,Python,问答系统,自然语言处理,教育技术,机器学习,技术支持 数据概述: 该数据集包含来自互联网的Python编程相关的问答数据,记录了用户提出的问题及其对应的答案。主要特征如下:...
    packageimg
  • H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej

    2025年4月24日   

    H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej 数据来源:互联网公开数据 标签:时尚,零售,产品,文章,数据集,文本分析,自然语言处理,推荐系统 数据概述: 该数据集包含 H&M 集团的产品文章数据,记录了 H&M 集团发布的关于服装和其他产品的文章信息。主要特征如下:...
    packageimg
  • 股票新闻情绪分析数据集-ahmedashrafahmed

    2025年4月24日   

    股票新闻情绪分析数据集-ahmedashrafahmed 数据来源:互联网公开数据 标签:股票,新闻,情绪分析,自然语言处理,金融,文本挖掘,机器学习,投资 数据概述:该数据集包含来自互联网的股票新闻数据,记录了新闻标题,发布时间,新闻内容以及相应的情绪评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 姓名性别数据集Name-GenderDataset-shivanshpandeys

    2025年4月24日   

    姓名性别数据集Name-GenderDataset-shivanshpandeys 数据来源:互联网公开数据 标签:姓名分析,性别识别,数据集,文本处理,机器学习,自然语言处理,人口统计,数据分析 数据概述: 该数据集包含来自公开来源的姓名和性别数据,记录了不同姓名对应的性别信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,涵盖历史和现代姓名。...
    packageimg
  • 基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873

    2025年4月24日   

    基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,语言模型,人工智能,文本生成,情感分析 数据概述: 该数据集由基因模型优化项目提供,主要记录了微型聊天机器人在不同对话场景下的交互数据。主要特征如下:...
    packageimg
  • 越南语有害评论数据集ToxicCommentVietnameseDataset-trandong2932002

    2025年4月24日   

    越南语有害评论数据集ToxicCommentVietnameseDataset-trandong2932002 数据来源:互联网公开数据 标签:有害评论,文本分析,数据集,机器学习,自然语言处理,情感分析,语言技术,网络安全 数据概述: 该数据集包含来自越南语互联网平台的评论数据,记录了用户发布的有害内容,如仇恨言论,骚扰,歧视等。主要特征如下:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集Ham-SpamClassificationDataset-venkat1002

    2025年4月24日   

    垃圾邮件与非垃圾邮件分类数据集Ham-SpamClassificationDataset-venkat1002 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,机器学习,自然语言处理,分类算法,数据挖掘 数据概述: 该数据集包含来自公开邮件数据源的数据,记录了邮件内容及其分类标签(垃圾邮件或非垃圾邮件)。主要特征如下:...
    packageimg
  • 英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir

    2025年4月24日   

    英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,乌尔都语,英语,文本翻译,多语言 数据概述: 该数据集包含来自多个公开来源的英语到乌尔都语的平行语料,记录了双语句子对。主要特征如下:...
    packageimg
  • 信件特征数据集LettersFeaturesDataset-mingfengli1024

    2025年4月24日   

    信件特征数据集LettersFeaturesDataset-mingfengli1024 数据来源:互联网公开数据 标签:信件特征,数据集,文本分析,自然语言处理,机器学习,通信学,学术研究,邮件分类 数据概述:该数据集包含来自多个来源的信件特征数据,记录了不同信件的文本特征信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 奥斯卡颁奖典礼推文数据集OscarTweetsDataset-vechoo

    2025年4月24日   

    奥斯卡颁奖典礼推文数据集OscarTweetsDataset-vechoo 数据来源:互联网公开数据 标签:奥斯卡,推文,社交媒体,情感分析,自然语言处理,电影,数据集,文本分析 数据概述: 该数据集包含来自Twitter的关于奥斯卡颁奖典礼的推文数据,记录了用户在颁奖典礼期间的实时互动和观点。主要特征如下:...
    packageimg
  • 圣经多语言阿拉伯语-法语数据集-oumarbenlol

    2025年4月24日   

    圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...
    packageimg
  • 中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845

    2025年4月24日   

    中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845 数据来源:互联网公开数据 标签:自然语言处理,数学应用题,数据集,语义理解,机器阅读理解,人工智能,教育,文本分析 数据概述: 该数据集由台湾中央研究院(Academia...
    packageimg
  • 结合NIPS会议论文数据的9个特征数据集CombinedNIPS9FeaturesDataset-highdopamine

    2025年4月24日   

    结合NIPS会议论文数据的9个特征数据集CombinedNIPS9FeaturesDataset-highdopamine 数据来源:互联网公开数据 标签:学术研究,数据集,机器学习,特征工程,论文分析,人工智能,自然语言处理,数据挖掘 数据概述: 该数据集结合了NIPS会议论文数据,提取了9个关键特征,记录了论文的详细信息。主要特征如下:...
    packageimg
  • 亚马逊商品评价数据集AspectReviewsDataset-costleyosaro

    2025年4月24日   

    亚马逊商品评价数据集AspectReviewsDataset-costleyosaro 数据来源:互联网公开数据 标签:商品评价,情感分析,自然语言处理,文本挖掘,机器学习,用户行为,电商,数据集 数据概述: 该数据集包含了来自亚马逊的商品评价数据,旨在用于情感分析,用户行为分析等研究。主要特征如下: 时间跨度:...
    packageimg
  • X平台推特上针对罗兴亚难民的情感分析数据集-nuzulgustitiarafitri

    2025年4月24日   

    X平台推特上针对罗兴亚难民的情感分析数据集-nuzulgustitiarafitri 数据来源:互联网公开数据 标签:情感分析,社交媒体,推特,罗兴亚难民,自然语言处理,文本挖掘,社会学,人权 数据概述: 该数据集包含了来自X平台(推特,原推特)的推文数据,记录了用户对罗兴亚难民的态度和情感。主要特征如下:...
    packageimg
  • 德国新闻文本命名实体识别数据集-rodionshkokov

    2025年4月24日   

    德国新闻文本命名实体识别数据集-rodionshkokov 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,德语,NLP,文本分析,信息抽取,机器学习 数据概述: 该数据集包含来自德国新闻网站的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下: 时间跨度: 数据记录的时间范围未明确给出,但数据内容主要来源于新闻报道。...
    packageimg
  • ChatGPT社交媒体发布讨论数据集-2022年11月30日-2023年2月11日

    2025年4月24日   

    ChatGPT社交媒体发布讨论数据集-2022年11月30日-2023年2月11日 数据来源:互联网公开数据 标签:ChatGPT, 推特, 社交媒体, 人工智能, 自然语言处理, 情感分析, 观点挖掘, 科技, 文本数据 数据概述:...
    packageimg