找到11,992个数据集

标签: 自然语言处理

过滤结果
  • 性别分类数据集GenderClassifierDataset-kaamyasarda

    2025年4月24日   

    性别分类数据集GenderClassifierDataset-kaamyasarda 数据来源:互联网公开数据 标签:性别分类,数据分析,机器学习,文本挖掘,自然语言处理,数据集,分类算法,模式识别 数据概述: 该数据集包含来自社交媒体平台(如Twitter)的用户数据,记录了用户的性别分类信息及相关特征。主要特征如下:...
    packageimg
  • 新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag

    2025年4月24日   

    新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag 数据来源:互联网公开数据 标签:新冠疫情,齐夫定律,文本分析,数据集,自然语言处理,流行病学,数据科学,词频分析 数据概述: 该数据集包含从新冠疫情期间收集的文本数据,用于验证齐夫定律在疫情语境下的适用性。主要特征如下:...
    packageimg
  • 说服力与影响力分析数据集Persuade-2-0Dataset-garried

    2025年4月24日   

    说服力与影响力分析数据集Persuade-2-0Dataset-garried 数据来源:互联网公开数据 标签:说服力,影响力,数据集,自然语言处理,文本分析,情感分析,机器学习,心理学 数据概述: 该数据集包含来自Persuade-2.0项目的数据,记录了不同情境下的说服性文本及其效果评估。主要特征如下:...
    packageimg
  • 医疗人工智能大模型数据集MedicaAILLMDatasetandModel-emirhanai

    2025年4月24日   

    医疗人工智能大模型数据集MedicaAILLMDatasetandModel-emirhanai 数据来源:互联网公开数据 标签:医疗人工智能,大模型,数据集,机器学习,自然语言处理,文本分析,健康医疗,医疗研究 数据概述:该数据集为MedicaAI项目的一部分,主要记录了医疗相关文本数据,适用于医疗人工智能大模型的训练和应用。主要特征如下:...
    packageimg
  • 地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan

    2025年4月24日   

    地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan 数据来源:互联网公开数据 标签:地理信息,地名识别,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息提取 数据概述: 该数据集包含来自网络文本和地理信息资源的地名数据,记录了不同文本中的地名及其位置信息。主要特征如下: 时间跨度:...
    packageimg
  • 尼泊尔语命名实体识别数据集NepaliNERDataset-rajanghimire

    2025年4月24日   

    尼泊尔语命名实体识别数据集NepaliNERDataset-rajanghimire 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,尼泊尔语,机器学习,文本分析,序列标注,语言技术 数据概述: 该数据集包含尼泊尔语的命名实体识别数据,记录了尼泊尔语文本中的人名,地名,组织名等实体信息。主要特征如下:...
    packageimg
  • 数据7年自发性行为数据集BE-SPONT7YearsDataset-wooyakob

    2025年4月24日   

    7年自发性行为数据集BE-SPONT7YearsDataset-wooyakob 数据来源:互联网公开数据 标签:行为分析,数据集,社交媒体,用户行为,情感分析,自然语言处理,机器学习,时间序列 数据概述: 该数据集包含了来自社交媒体平台的用户自发性行为数据,记录了用户在七年内的各种行为,例如帖子,评论,点赞,分享等。主要特征如下: 时间跨度:...
    packageimg
  • 巴勒莫餐厅评价数据集RestaurantsPalermoPonderadoDataset-puedefallar

    2025年4月24日   

    巴勒莫餐厅评价数据集RestaurantsPalermoPonderadoDataset-puedefallar 数据来源:互联网公开数据 标签:餐厅,评价,数据集,意大利,餐饮业,情感分析,自然语言处理,美食 数据概述: 该数据集包含了来自意大利巴勒莫地区的餐厅评价数据,记录了用户对当地餐厅的详细评价信息。主要特征如下:...
    packageimg
  • 两步Wave-Net语音合成数据集-garganany

    2025年4月24日   

    两步Wave-Net语音合成数据集-garganany 数据来源:互联网公开数据 标签:语音合成,深度学习,数据集,音频处理,人工智能,自然语言处理,WaveNet,语音生成 数据概述: 该数据集包含用于训练两步 WaveNet 模型的数据,主要用于语音合成任务。主要特征如下: 时间跨度:数据记录了音频的录制时间,具体时间跨度取决于原始数据。...
    packageimg
  • 隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14

    2025年4月24日   

    隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,情感分析,机器学习,自然语言处理,社会研究,内容审核 数据概述:该数据集包含来自多个在线平台的文本数据,记录了带有隐含仇恨言论的言论内容及其对应的排名。主要特征如下:...
    packageimg
  • 电影相似度分析数据集MoviesSimilarityDataset-devendra45

    2025年4月24日   

    电影相似度分析数据集MoviesSimilarityDataset-devendra45 数据来源:互联网公开数据 标签:电影分析,相似度计算,数据集,推荐系统,机器学习,数据挖掘,娱乐产业,自然语言处理 数据概述: 该数据集包含来自多个电影数据库的电影信息,记录了电影之间的相似度关系及相关特征。主要特征如下:...
    packageimg
  • LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881

    2025年4月24日   

    LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881 数据来源:互联网公开数据 标签:LaTeX, 文档分析, 数据集, 语法结构, 文学研究, 自然语言处理, 计算机科学, 学术资源 数据概述:...
    packageimg
  • 用户评论情感分析数据集CommentsScoreDataset-esgintn

    2025年4月24日   

    用户评论情感分析数据集CommentsScoreDataset-esgintn 数据来源:互联网公开数据 标签:评论分析,情感分析,数据集,自然语言处理,机器学习,文本挖掘,用户行为,社交媒体 数据概述:该数据集包含来自各种来源的用户评论数据,记录了用户对特定主题或产品的评论及其对应的情感评分。主要特征如下:...
    packageimg
  • RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch

    2025年4月24日   

    RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch 数据来源:互联网公开数据 标签:社交媒体,金融,股票,投资,文本分析,自然语言处理,舆情分析,机器学习 数据概述: 该数据集包含来自 Reddit 网站 WallStreetBets(WSB)子版块的帖子数据,记录了用户在 WSB...
    packageimg
  • 俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32

    2025年4月24日   

    俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32 数据来源:互联网公开数据 标签:虚假新闻,翻译,数据集,俄语,英语,自然语言处理,机器翻译,文本分析 数据概述: 该数据集包含了俄语(RUS)到英语(EN)的虚假新闻翻译数据,旨在促进虚假信息检测和跨语言分析的研究。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998

    2025年4月24日   

    电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,电影评论,人工智能,大数据 数据概述:...
    packageimg
  • 合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy

    2025年4月24日   

    合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:...
    packageimg
  • 数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

    2025年4月24日   

    2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07

    2025年4月24日   

    改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:...
    packageimg
  • 数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag

    2025年4月24日   

    数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag 数据来源:互联网公开数据 标签:数学竞赛,解题,API,数据集,人工智能,自然语言处理,数学建模,编程 数据概述: 该数据集包含通过API解决数学竞赛问题的相关数据,记录了使用API解答数学竞赛试题的过程和结果。主要特征如下:...
    packageimg