找到11,976个数据集

标签: 自然语言处理

过滤结果
  • StackOverflow开发者问答数据分析与标签分类数据集

    2025年4月20日   

    StackOverflow开发者问答数据分析与标签分类数据集 数据来源:互联网公开数据 标签:Stack Overflow, 开发者问答, 编程, 技术, 标签, 数据分析, 自然语言处理, 信息检索 数据概述: 本数据集包含了从Stack Overflow网站抓取的大量问题数据,数据内容涵盖了开发者在Stack...
    packageimg
  • 阿塞拜疆Interpress新闻网站新闻文章数据集-2014年12月31日至2024年3月24日

    2025年4月20日   

    阿塞拜疆Interpress新闻网站新闻文章数据集-2014年12月31日至2024年3月24日 数据来源:互联网公开数据 标签:新闻文章,阿塞拜疆,Interpress,新闻,媒体,内容分析,文本挖掘,自然语言处理,新闻报道 数据概述:...
    packageimg
  • 英语单词与定义扩展词典数据集

    2025年4月20日   

    英语单词与定义扩展词典数据集 数据来源:互联网公开数据 标签:英语单词,定义,词汇表,自然语言处理,NLP,词义解释,教育工具,语言学习,学术研究 数据概述:...
    packageimg
  • 情绪分类葡萄牙语数据集

    2025年4月20日   

    情绪分类葡萄牙语数据集 数据来源:互联网公开数据 标签:情绪分析,自然语言处理,葡萄牙语,情感分类,社交媒体,文本数据,深度学习,情感识别 数据概述...
    packageimg
  • 阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用

    2025年4月20日   

    阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用 数据来源:互联网公开数据 标签:阿拉伯语,作文评分,自然语言处理,机器学习,数据集,文本分类,多语言,Open Orca, GPT-3.5, GPT-4, RAG, 翻译 数据概述:...
    packageimg
  • 检测LLM生成文本数据集

    2025年4月20日   

    检测LLM生成文本数据集 数据来源:互联网公开数据 标签:LLM,生成文本检测,文本分类,自然语言处理,数据集合并,文本生成评估 数据概述: 本数据集是一个整合了多个数据集的综合集合,主要用于“LLM - Detect AI Generated...
    packageimg
  • 维基百科电影剧情摘要数据集

    2025年4月20日   

    维基百科电影剧情摘要数据集 数据来源:互联网公开数据 标签:电影,剧情,摘要,自然语言处理,文本分析,电影推荐,文化研究 数据概述: 本数据集基于JustinR在Kaggle发布的维基百科电影剧情数据集,包含了数以千计的电影及其完整剧情。在此基础上,我们使用DistilBART-...
    packageimg
  • 毒评分类挑战训练与测试数据集带标签

    2025年4月20日   

    毒评分类挑战训练与测试数据集带标签 数据来源:互联网公开数据 标签:毒评分类,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于毒评分类挑战,包含了合并的训练数据和带标签的测试数据。数据集中的每条评论都被标记为包含或不包含毒评,未标记的测试数据已从数据集中移除。该数据集旨在用于机器学习模型的训练和评估,特别是针对文本分类任务中的毒评检测。...
    packageimg
  • Twitter用户情感分析数据集-2009年

    2025年4月20日   

    Twitter用户情感分析数据集-2009年 数据来源:互联网公开数据 标签:情感分析,社交媒体,Twitter,文本数据,情绪识别,自然语言处理,机器学习,用户行为 数据概述:...
    packageimg
  • 印度维基百科文章数据集

    2025年4月20日   

    印度维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,印度,自然语言处理,文本挖掘,语言模型,文本数据,机器学习 数据概述: 本数据集包含172,000篇经过清洗的印度维基百科文章,已转换为CSV格式,便于直接作为Pandas...
    packageimg
  • 阿拉伯语医疗问答数据集

    2025年4月20日   

    阿拉伯语医疗问答数据集 数据来源:互联网公开数据 标签:医疗问答,阿拉伯语,NLP,自然语言处理,健康咨询,医疗分类,问答系统 数据概述:...
    packageimg
  • StackExchange园艺与景观问答社区主题数据集-2023年12月

    2025年4月19日   

    StackExchange园艺与景观问答社区主题数据集-2023年12月 数据来源:互联网公开数据 标签:园艺,景观,问答,Stack Exchange,社区,问题,答案,标签,文本嵌入,自然语言处理 数据概述: 本数据集收录了截至2023年12月31日,来自Stack...
    packageimg
  • 标准对话日志数据集

    2025年4月19日   

    标准对话日志数据集 数据来源:互联网公开数据 标签:对话日志,自然语言处理,机器学习,聊天机器人,情感分析,文本分类,对话分析,OpenAI 数据概述:...
    packageimg
  • 文本特征提取数据集1963-2021

    2025年4月19日   

    文本特征提取数据集1963-2021 数据来源:互联网公开数据 标签:文本特征,自然语言处理,情感分析,可读性分析,语法结构,词性标注,命名实体识别 数据概述:...
    packageimg
  • Basalam产品实体分类数据集

    2025年4月19日   

    Basalam产品实体分类数据集 数据来源:互联网公开数据 标签:实体分类,产品分类,波斯语文本,电子商务,多语言数据,市场分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 巴西ATribuna报纸新闻文本分类数据集

    2025年4月19日   

    巴西ATribuna报纸新闻文本分类数据集 数据来源:互联网公开数据 标签:新闻文本,分类,巴西,报纸,文本挖掘,机器学习,自然语言处理 数据概述: 本数据集源自巴西报纸“A...
    packageimg
  • COVID-19研究论文数据集

    2025年4月19日   

    COVID-19研究论文数据集 数据来源:互联网公开数据 标签:COVID-19,研究论文,PubMed,DOI,医学研究,机器学习,自然语言处理,数据挖掘,疫情分析 数据概述: 本数据集收录了超过15万篇关于COVID-19的研究论文,每篇论文包含PubMed...
    packageimg
  • 财经情感分析数据集

    2025年4月19日   

    财经情感分析数据集 数据来源:互联网公开数据 标签:财经新闻,情感分析,股票影响,自然语言处理,金融建模,市场预测,投资决策 数据概述:...
    packageimg
  • 印度新冠疫情推文数据集

    2025年4月19日   

    印度新冠疫情推文数据集 数据来源:互联网公开数据 标签:推文数据,新冠疫情,印度,社交媒体分析,文本挖掘,自然语言处理,情感分析 数据概述: 本数据集包含2021年1月至3月期间从Twitter抓取的与“COVID...
    packageimg
  • 古兰经与塔夫西尔数据集

    2025年4月19日   

    古兰经与塔夫西尔数据集 数据来源:互联网公开数据 标签:古兰经,塔夫西尔,宗教文本,阿拉伯语,自然语言处理,文本分析,机器学习 数据概述:...
    packageimg