找到11,688个数据集

标签: 自然语言处理

过滤结果
  • 埃及2025年1月Wuzzuf职位招聘信息数据集

    2025年4月14日   

    埃及2025年1月Wuzzuf职位招聘信息数据集 数据来源:互联网公开数据 标签:职位信息,埃及,就业市场,数据分析,自然语言处理,招聘算法,行业趋势,职业预测 数据概述:...
    packageimg
  • 拉丁裔作者好读书籍数据集

    2025年4月14日   

    拉丁裔作者好读书籍数据集 数据来源:互联网公开数据 标签:拉丁裔,作者,书籍,教育,数据科学,自然语言处理,好读 数据概述: 本数据集来源于Goodreads网站上的拉丁裔作者书籍列表,由Data...
    packageimg
  • Coleridge竞赛数据集标签挖掘与整理数据集

    2025年4月14日   

    Coleridge竞赛数据集标签挖掘与整理数据集 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本挖掘,机器学习,命名实体识别,Coleridge竞赛,标签提取,数据标注 数据概述:...
    packageimg
  • DevinAIYouTube评论互动数据集-发布至今

    2025年4月14日   

    DevinAIYouTube评论互动数据集-发布至今 数据来源:互联网公开数据 标签:Devin AI,人工智能,软件工程师,YouTube评论,情感分析,社交媒体,评论互动,自然语言处理 数据概述: 本数据集收录了YouTube平台上关于人工智能软件工程师Devin...
    packageimg
  • 性别偏见核心指代数据集-职业刻板印象研究-2023

    2025年4月14日   

    性别偏见核心指代数据集-职业刻板印象研究-2023 数据来源:互联网公开数据 标签:性别偏见,核心指代,职业刻板印象,WinoBias,Huggingface,自然语言处理,数据集,科研,教育 数据概述:...
    packageimg
  • IMDB电影及其关键词分析数据集

    2025年4月14日   

    IMDB电影及其关键词分析数据集 数据来源:互联网公开数据 标签:IMDB, 电影, 关键词提取, 自然语言处理, 影视分析 数据概述: 本数据集基于IMDB(Internet Movie...
    packageimg
  • 印度艾哈迈达巴德酒店用户点评数据集

    2025年4月14日   

    印度艾哈迈达巴德酒店用户点评数据集 数据来源:互联网公开数据 标签:酒店点评,用户评价,艾哈迈达巴德,印度,酒店排名,情感分析,自然语言处理,文本分析,酒店管理 数据概述:...
    packageimg
  • 数据200-20新闻组文本分类数据集

    2025年4月14日   

    数据200-20新闻组文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,新闻组,文本预处理,机器学习,监督学习 数据概述: 本数据集是一个经过预处理的文本数据集合,来源为scikit-learn提供的20...
    packageimg
  • 印度Reddit社区帖子内容分类数据集

    2025年4月14日   

    印度Reddit社区帖子内容分类数据集 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,帖子,内容分析,分类,机器学习,自然语言处理,社区,标签 数据概述: 本数据集包含了来自印度Reddit社区的帖子数据。数据通过Reddit...
    packageimg
  • 阿拉伯文文本摘要数据集

    2025年4月14日   

    阿拉伯文文本摘要数据集 数据来源:互联网公开数据 标签:阿拉伯文,文本摘要,自然语言处理,机器学习,数据集,Kaggle 数据概述:...
    packageimg
  • 孟加拉医学数据集

    2025年4月14日   

    孟加拉医学数据集 数据来源:互联网公开数据 标签:孟加拉语,医学,命名实体识别,专科分类,自然语言处理,医疗保健,症状识别,健康问题 数据概述:...
    packageimg
  • 全球商品目录数据集2023

    2025年4月14日   

    全球商品目录数据集2023 数据来源:互联网公开数据 标签:商品目录,产品分类,市场研究,自然语言处理,电子商务,文本分析 数据概述:...
    packageimg
  • 老友记所有对白数据集

    2025年4月14日   

    老友记所有对白数据集 数据来源:互联网公开数据 标签:老友记,对白,剧本,对话分析,情感分析,自然语言处理,聊天机器人 数据概述:...
    packageimg
  • 单词难度数据集

    2025年4月14日   

    单词难度数据集 数据来源:互联网公开数据 标签:单词难度,语言学习,教育研究,自然语言处理,难度评估,学习者分析,教育工具,英语学习,认知科学,词汇研究 数据概述:...
    packageimg
  • YouTube评论仇恨言论检测数据集-KevinSamuels视频评论-LLaMa模型标注

    2025年4月14日   

    YouTube评论仇恨言论检测数据集-KevinSamuels视频评论-LLaMa模型标注 数据来源:互联网公开数据 标签:仇恨言论, YouTube评论, 女性歧视, 情感分析, 自然语言处理, 机器学习, Kevin Samuels, 社交媒体, 文本数据 数据概述: 本数据集通过抓取Kevin...
    packageimg
  • 阿拉伯诗歌情感分析数据集2021

    2025年4月14日   

    阿拉伯诗歌情感分析数据集2021 数据来源:互联网公开数据 标签:阿拉伯诗歌,情感分析,自然语言处理,文学研究,情感分类 数据概述: 本数据集收录了超过9000首阿拉伯诗歌,并由三类情感标签进行标注,即积极、消极和中性。这些诗歌涵盖了广泛的文学时期和风格,为情感分析和自然语言处理研究提供了丰富的资源。 数据用途概述:...
    packageimg
  • 讽刺语句分析数据集

    2025年4月14日   

    讽刺语句分析数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,文本分析,情感分析,机器学习,语义理解 数据概述: 本数据集包含1950条评论,每条评论由人工标注为讽刺性(1)或非讽刺性(-1)。数据集旨在提供一个用于讽刺语句识别的基准集合,帮助研究人员和开发者训练和评估文本分析模型。 数据用途概述:...
    packageimg
  • WinoGrande-常识推理挑战数据集

    2025年4月14日   

    WinoGrande-常识推理挑战数据集 数据来源:互联网公开数据 标签:自然语言处理,常识推理,文本理解,完形填空,机器阅读理解,AI,NLP 数据概述: WinoGrande是一个包含44,000个问题的集合,灵感来源于Winograd Schema...
    packageimg
  • 土耳其教育数据集用于LLM微调

    2025年4月14日   

    土耳其教育数据集用于LLM微调 数据来源:互联网公开数据 标签:土耳其教育,LLM微调,自然语言处理,巴塔然阿斯兰,巴图汗凯莱姆,奥默法鲁克切利克,T3 AI,教育系统,微调数据集 数据概述: 本数据集旨在用于微调T3 AI土耳其LLM。该数据集由巴塔然阿斯兰、巴图汗凯莱姆和奥默法鲁克切利克为T3...
    packageimg
  • 马拉维新闻分类挑战数据集

    2025年4月14日   

    马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio...
    packageimg