找到5,882个数据集

标签: 文本分析

过滤结果
  • 俄罗斯诗歌文本数据集

    2025年4月14日   

    俄罗斯诗歌文本数据集 数据来源:互联网公开数据 标签:俄罗斯诗歌,文学,文本分析,语言学,文化研究 数据概述: 本数据集包含了俄罗斯诗歌的文本数据,涵盖了多个世纪和多位著名诗人的作品。数据集旨在提供一个全面的资源,用于研究俄罗斯文学、语言学和文化背景。文本数据包括诗歌的标题、作者、创作年代和完整的诗歌内容。 数据用途概述:...
    packageimg
  • 孟加拉语讽刺检测数据集2022

    2025年4月14日   

    孟加拉语讽刺检测数据集2022 数据来源:互联网公开数据 标签:讽刺检测,孟加拉语,自然语言处理,文本分析,深度学习,BERT,可解释AI 数据概述:...
    packageimg
  • F-R-I-E-N-D-S情景喜剧数据集

    2025年4月14日   

    F-R-I-E-N-D-S情景喜剧数据集 数据来源:互联网公开数据 标签:情景喜剧,数据集,文本分析,电视节目,对话记录,角色分析,社交互动 数据概述:...
    packageimg
  • Telegram消息垃圾信息与正常信息分类数据集

    2025年4月14日   

    Telegram消息垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:Telegram,消息分类,垃圾信息,自然语言处理,文本分析,机器学习,数据,Spam,Ham 数据概述:...
    packageimg
  • 推特话题汇总数据集

    2025年4月14日   

    推特话题汇总数据集 数据来源:互联网公开数据 标签:推特,话题汇总,自然语言处理,文本分析,社会媒体,教育,研究,自动化摘要 数据概述: 本数据集包含了来自不同话题标签的推文摘要,总计1950条记录。这些推文摘要通过先进的自然语言处理模型ChatGPT系统生成,为教育和研究提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • YTS电影数据集1900-2023

    2025年4月14日   

    YTS电影数据集1900-2023 数据来源:互联网公开数据 标签:电影,数据预处理,文本分析,电影信息,电影发布年份,图像数据 数据概述: 本数据集来源于YTS...
    packageimg
  • 社交智能问答数据集-社会互动情境问答数据集

    2025年4月14日   

    社交智能问答数据集-社会互动情境问答数据集 数据来源:互联网公开数据 标签:社交智能,问答,常识推理,自然语言处理,机器学习,社会情境,文本分析 数据概述: 本数据集名为“Social IQa (Social Interaction Q&A)”,是一个用于评估模型社会常识推理能力的问答基准。与以往侧重于物理或分类知识的基准不同,Social...
    packageimg
  • 古兰经阿拉伯文原始文本数据集

    2025年4月14日   

    古兰经阿拉伯文原始文本数据集 数据来源:互联网公开数据 标签:古兰经,阿拉伯文,宗教,文本分析,伊斯兰教,经文解析,宗教研究 数据概述: 本数据集基于赛义德·易卜拉欣·泽沙恩·乌尔·哈桑·优素福尼整理的《古兰经》阿拉伯文部分。数据集经过解析,将苏拉编号、经文编号和经文内容分列到不同的列中,便于进一步的分析和研究。 数据用途概述:...
    packageimg
  • 机械键盘品牌讨论热度分析数据集-Reddit社区-2024年

    2025年4月14日   

    机械键盘品牌讨论热度分析数据集-Reddit社区-2024年 数据来源:互联网公开数据 标签:机械键盘,品牌,Reddit,社区,讨论,文本分析,消费者行为,数据挖掘 数据概述:...
    packageimg
  • 罗马乌尔都语仇恨言论检测数据集

    2025年4月14日   

    罗马乌尔都语仇恨言论检测数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,仇恨言论,社交媒体评论,数据融合,文本分析,自然语言处理 数据概述: 本数据集是由三个数据集合并而成,分别是RomanUrduDataSet、HS-RU-20和roman-Urdu-abusive-comment-...
    packageimg
  • 特拉维夫短租Facebook帖子数据集-2015年

    2025年4月14日   

    特拉维夫短租Facebook帖子数据集-2015年 数据来源:互联网公开数据 标签:短租,特拉维夫,Facebook,社交媒体,房地产,希伯来语,NLP,文本分析,价格分析 数据概述: 本数据集收录了2015年从Facebook群组“特拉维夫短租” (希伯来语:סאבלטים בתל אביב לתקופות קצרות)...
    packageimg
  • 韩国大学人文论文数据集

    2025年4月14日   

    韩国大学人文论文数据集 数据来源:互联网公开数据 标签:韩国大学,人文论文,教育,学术研究,自然语言处理,文本分析,教育趋势 数据概述:...
    packageimg
  • 康德著作数据集

    2025年4月14日   

    康德著作数据集 数据来源:互联网公开数据 标签:康德,哲学,伦理学,道德学,形而上学,自然语言处理,文本分析 数据概述: 本数据集收录了伊曼努尔·康德的主要著作,涵盖了伦理学、道德学和形而上学等领域。数据集包含一个自增列和四个重要的信息列,包括著作标题、出版日期以及原始文本和清理后的文本。这些文本数据为研究康德哲学思想提供了丰富的资源。 数据用途概述:...
    packageimg
  • 网络攻击性言论数据集

    2025年4月14日   

    网络攻击性言论数据集 数据来源:互联网公开数据 标签:仇恨言论,攻击性言论,社交媒体,内容审核,自然语言处理,文本分析,社会问题 数据概述:...
    packageimg
  • Steam游戏评论关键要素标注数据集-英语评论-2024

    2025年4月14日   

    Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg
  • 抑郁症检测数据集

    2025年4月14日   

    抑郁症检测数据集 数据来源:互联网公开数据 标签:抑郁症,社交媒体,情感分析,心理健康,文本分析 数据概述: 本数据集包含两个字段:推文文本和标签。推文文本字段记录了用户的社交媒体内容,标签字段则标注了该推文是否涉及抑郁症。数据集提供了广泛的社会媒体文本数据,为抑郁症检测模型的开发与训练提供了必要的基础。 数据用途概述:...
    packageimg
  • 学术引用意图分类数据集

    2025年4月14日   

    学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface...
    packageimg
  • 印度尼西亚垃圾邮件检测短信数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾邮件检测短信数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件检测,短信数据,文本分析,分类模型,电子邮件,合法邮件,印度尼西亚 数据概述:...
    packageimg
  • 垃圾邮件分类邮件数据集

    2025年4月14日   

    垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:...
    packageimg