找到11,983个数据集

标签: 自然语言处理

过滤结果
  • Mercari商品价格预测数据集MercariSubmission3-ProductPricePredictionDataset-niranjanmaisnam

    2025年4月22日   

    Mercari商品价格预测数据集MercariSubmission3-ProductPricePredictionDataset-niranjanmaisnam 数据来源:互联网公开数据 标签:电子商务,价格预测,数据集,机器学习,零售业,自然语言处理,商品分类,商业智能 数据概述:...
    packageimg
  • 关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116

    2025年4月22日   

    关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,文本分析,数据集,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含来自多个公开来源的文本数据,专注于关键词提取和文本分析任务。主要特征如下:...
    packageimg
  • 肯尼亚摩托出租车推特数据BodaBodaMenaceinKenyaFilteredTweets数据集-marthamwaura

    2025年4月22日   

    肯尼亚摩托出租车推特数据BodaBodaMenaceinKenyaFilteredTweets数据集-marthamwaura 数据来源:互联网公开数据 标签:推特数据,社交媒体,肯尼亚,摩托出租车,社会问题,文本分析,自然语言处理,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了关于肯尼亚摩托出租车(Boda...
    packageimg
  • 图书销量与评论数据集BooksSalesandReviewsDataset-cucudas

    2025年4月22日   

    图书销量与评论数据集BooksSalesandReviewsDataset-cucudas 数据来源:互联网公开数据 标签:图书,销量,评论,数据集,文本分析,自然语言处理,推荐系统,市场分析 数据概述: 该数据集包含来自互联网的图书销售和评论数据,记录了图书的销售情况,用户评论以及相关信息。主要特征如下: 时间跨度:...
    packageimg
  • 孟加拉语命名实体识别数据集-koushikdeb

    2025年4月22日   

    孟加拉语命名实体识别数据集-koushikdeb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,孟加拉语,数据集,语言学,文本分析,机器学习,NLP 数据概述: 该数据集包含孟加拉语文本,用于命名实体识别(NER)任务。主要特征如下: 时间跨度: 数据集未明确时间范围,但涵盖了不同年代和主题的文本。 地理范围:...
    packageimg
  • 基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan

    2025年4月22日   

    基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:...
    packageimg
  • 灾难推文真假预测数据集NLPDisasterTweetsDataset-asepsaputra

    2025年4月22日   

    灾难推文真假预测数据集NLPDisasterTweetsDataset-asepsaputra 数据来源:互联网公开数据 标签:自然语言处理,推文,灾难,预测,文本分类,机器学习,社交媒体,情感分析 数据概述: 该数据集包含来自Twitter的推文数据,旨在用于预测推文是否与真实的灾难事件相关。主要特征如下:...
    packageimg
  • 专利文本挖掘与预测竞赛PTPM排行榜数据集PatentTextMiningandPredictionCompetitionLeaderboardsData...

    2025年4月22日   

    专利文本挖掘与预测竞赛PTPM排行榜数据集PatentTextMiningandPredictionCompetitionLeaderboardsDataset-fritzcremer 数据来源:互联网公开数据 标签:专利分析,文本挖掘,数据集,机器学习,自然语言处理,预测模型,人工智能,竞赛数据 数据概述:...
    packageimg
  • 微博立场分析数据集WeiboStanceAnalysisDataset-cuiximaiguidi0329

    2025年4月22日   

    微博立场分析数据集WeiboStanceAnalysisDataset-cuiximaiguidi0329 数据来源:互联网公开数据 标签:社交媒体,立场分析,数据集,文本挖掘,自然语言处理,情感分析,机器学习,数据科学 数据概述: 该数据集包含来自微博平台的数据,记录了用户对特定话题的立场表达。主要特征如下:...
    packageimg
  • 文本评论数据分析数据集ReviewDataTextDataset-asjad2024

    2025年4月22日   

    文本评论数据分析数据集ReviewDataTextDataset-asjad2024 数据来源:互联网公开数据 标签:文本分析,数据集,评论数据,情感分析,自然语言处理,机器学习,市场研究,消费者行为 数据概述: 该数据集包含来自互联网公开平台的文本评论数据,记录了用户对产品,服务或内容的多维度评价。主要特征如下:...
    packageimg
  • 泰国图像描述数据集ThaiCaptionDataset-blacksilva

    2025年4月22日   

    泰国图像描述数据集ThaiCaptionDataset-blacksilva 数据来源:互联网公开数据 标签:图像描述,计算机视觉,自然语言处理,数据集,机器学习,视觉识别,多模态学习,人工智能 数据概述: 该数据集包含来自泰国地区的图像及其对应的泰文描述文本,记录了图像内容与泰文描述之间的关联。主要特征如下:...
    packageimg
  • 电子病历文本数据集EHRTextDataset-dawid9632

    2025年4月22日   

    电子病历文本数据集EHRTextDataset-dawid9632 数据来源:互联网公开数据 标签:医疗健康,电子病历,自然语言处理,临床数据,数据集,文本挖掘,机器学习,人工智能 数据概述: 该数据集包含来自医疗机构的电子病历文本数据,记录了患者的临床信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 超大规模对话训练数据集Ultrachat训练数据集-mingky11

    2025年4月22日   

    超大规模对话训练数据集Ultrachat训练数据集-mingky11 数据来源:互联网公开数据 标签:对话数据,自然语言处理,数据集,机器学习,人工智能,对话系统,语言模型,训练数据 数据概述:该数据集包含来自多个来源的超大规模对话数据,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2023年。...
    packageimg
  • 问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20

    2025年4月22日   

    问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,知识图谱,信息检索,人工智能 数据概述: 该数据集包含来自互联网的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下:...
    packageimg
  • 新闻标题预测数据集HeadlinePredictionDataset-bohraboxer

    2025年4月22日   

    新闻标题预测数据集HeadlinePredictionDataset-bohraboxer 数据来源:互联网公开数据 标签:新闻媒体,文本分析,数据集,机器学习,自然语言处理,预测模型,信息提取,深度学习 数据概述: 该数据集记录了来自新闻媒体平台的新闻标题及相关文本数据,主要包含新闻标题,正文片段,发布时间等特征。主要特征如下:...
    packageimg
  • 心理健康治疗全程对话数据集End-to-EndMentalHealthTherapyConversationsDataset-idowuadamo

    2025年4月22日   

    心理健康治疗全程对话数据集End-to-EndMentalHealthTherapyConversationsDataset-idowuadamo 数据来源:互联网公开数据 标签:心理健康,治疗对话,数据集,情感分析,自然语言处理,心理学,机器学习,情感计算 数据概述:...
    packageimg
  • 恶意评论分类挑战数据集ToxicCommentsClassificationChallengeDataset-ksayantani

    2025年4月22日   

    恶意评论分类挑战数据集ToxicCommentsClassificationChallengeDataset-ksayantani 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意评论,情感分析,深度学习,在线社区,文本挖掘 数据概述:...
    packageimg
  • ChatGPT模型评估数据集ChatGPTModelEvaluationDataset-nishathmhd

    2025年4月22日   

    ChatGPT模型评估数据集ChatGPTModelEvaluationDataset-nishathmhd 数据来源:互联网公开数据 标签:自然语言处理,模型评估,数据集,机器学习,人工智能,语言模型,对话系统,质量评估 数据概述: 该数据集包含来自ChatGPT模型的评估数据,记录了模型在不同任务中的表现和评估结果。主要特征如下:...
    packageimg
  • 合成虚拟人物对话数据集SyntheticPersonaChatDataset-kawinduwijewardhane

    2025年4月22日   

    合成虚拟人物对话数据集SyntheticPersonaChatDataset-kawinduwijewardhane 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,聊天机器人,虚拟人物,语言模型 数据概述: 该数据集包含合成虚拟人物的对话数据,记录了不同虚拟人物之间的自然语言对话内容。主要特征如下:...
    packageimg
  • 多标签孟加拉语有害评论数据集Multi-labeledBengaliToxicCommentsDataset-carracingbd

    2025年4月22日   

    多标签孟加拉语有害评论数据集Multi-labeledBengaliToxicCommentsDataset-carracingbd 数据来源:互联网公开数据 标签:自然语言处理,有害内容,数据集,机器学习,情感分析,文本分类,多标签分类,语言处理 数据概述:...
    packageimg