找到5,692个数据集

标签: 文本分析

过滤结果
  • 迷宫逃生电影评论情感分析数据集

    2025年4月15日   

    迷宫逃生电影评论情感分析数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分析,正面评价,负面评价 数据概述: 本数据集收录了500条关于电影《迷宫逃生》的在线评论,涵盖正面和负面两种情感倾向。数据来源于网页抓取,适用于文本分析和情感分类研究。 数据用途概述:...
    packageimg
  • 尼采著作文本数据集1885-1905

    2025年4月15日   

    尼采著作文本数据集1885-1905 数据来源:互联网公开数据 标签:尼采,哲学,文本分析,自然语言处理,词频分析,推荐系统,人文研究 数据概述:...
    packageimg
  • TED-Ed视频互动与内容分析数据集-YouTubeAPI采集

    2025年4月15日   

    TED-Ed视频互动与内容分析数据集-YouTubeAPI采集 数据来源:互联网公开数据 标签:TED-Ed, YouTube, 视频分析, 评论数据, 观众互动, 元数据, 教育视频, 文本分析 数据概述: 本数据集通过Google YouTube Data API (v3.0)采集,包含了TED-...
    packageimg
  • 印度象棋策略书籍文本与游戏数据集1963-2021

    2025年4月15日   

    印度象棋策略书籍文本与游戏数据集1963-2021 数据来源:互联网公开数据 标签:国际象棋,策略书籍,NLP,文本分析,游戏分析,主题建模,文档聚类,文本生成 数据概述: 本数据集收录了国际象棋大师Edward...
    packageimg
  • 意大利启蒙运动问答数据集

    2025年4月15日   

    意大利启蒙运动问答数据集 数据来源:互联网公开数据 标签:意大利启蒙运动,哲学,文化,问答,文本分析,语言研究,历史文献 数据概述: 本数据集包含意大利启蒙运动时期作者的文本片段。这些文本用于微调Gemma 2模型,以保留意大利启蒙运动的思想和语言特色。意大利启蒙运动起源于十八世纪下半叶,是一场涉及认识论、伦理学和政治学等领域讨论的文化和哲学运动。...
    packageimg
  • YouTube视频内容分类文本分析数据集

    2025年4月15日   

    YouTube视频内容分类文本分析数据集 数据来源:互联网公开数据 标签:视频分类,文本分析,机器学习,自然语言处理,多类别分类,数据标注,Youtube API 数据概述: 本数据集基于YouTube...
    packageimg
  • 印度奢侈品服装数据集1963-2021

    2025年4月15日   

    印度奢侈品服装数据集1963-2021 数据来源:互联网公开数据 标签:奢侈品服装,产品分类,产品描述,时尚行业,文本分析,多分类模型,市场研究 数据概述:...
    packageimg
  • 动漫数据集适用于NLP项目

    2025年4月15日   

    动漫数据集适用于NLP项目 数据来源:互联网公开数据 标签:动漫,推荐系统,NLP,文本分析,数据挖掘,自然语言处理,娱乐分析 数据概述: 本数据集主要用于构建著名的动漫推荐系统——Anime Odyssey。数据集涵盖了丰富的动漫信息,包括但不限于动漫名称、简介、类型、评分、评论等内容,为自然语言处理和文本分析提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • 电子邮件垃圾邮件检测特征数据集

    2025年4月15日   

    电子邮件垃圾邮件检测特征数据集 数据来源:互联网公开数据 标签:垃圾邮件检测,电子邮件特征,机器学习,分类模型,关键词识别,文本分析 数据概述: 本数据集包含了用于电子邮件垃圾邮件检测的各种特征数据,涵盖了邮件的多个维度信息,如主题长度、单词数量、关键词出现情况等。这些特征为构建垃圾邮件分类模型提供了必要的数据基础。 数据用途概述:...
    packageimg
  • 特朗普推特历史文本内容数据集-2009年5月4日至2017年11月1日

    2025年4月15日   

    特朗普推特历史文本内容数据集-2009年5月4日至2017年11月1日 数据来源:互联网公开数据 标签:特朗普,推特,社交媒体,政治,文本分析,舆情分析,时间序列,美国 数据概述:...
    packageimg
  • 社交媒体语境下文本毒性评估数据集

    2025年4月15日   

    社交媒体语境下文本毒性评估数据集 数据来源:互联网公开数据 标签:文本分析,自然语言处理,毒性检测,社交媒体,语境理解,情感分析,机器学习 数据概述:...
    packageimg
  • 生活大爆炸剧集对话内容分析数据集

    2025年4月15日   

    生活大爆炸剧集对话内容分析数据集 数据来源:互联网公开数据 标签:情景喜剧,剧集,对话,文本分析,娱乐,文化研究,社交,喜剧,角色,生活大爆炸 数据概述: 本数据集包含了热门情景喜剧《生活大爆炸》的剧集对话内容,数据来源于网络剧本。数据集涵盖了该剧的多个季度的对话内容,为研究剧集内容、角色互动、语言风格等提供了基础。 数据用途概述:...
    packageimg
  • IMDb电影流派分类数据集

    2025年4月15日   

    IMDb电影流派分类数据集 数据来源:互联网公开数据 标签:电影,流派,分类,IMDb,电影数据库,文本分析,机器学习,自然语言处理 数据概述: 本数据集基于互联网电影数据库(IMDb, Internet Movie Database)构建,包含了大量电影的流派信息。...
    packageimg
  • 西班牙语有毒评论分析数据集

    2025年4月15日   

    西班牙语有毒评论分析数据集 数据来源:互联网公开数据 标签:有毒评论,文本分析,自然语言处理,机器学习,多语言数据,情感分析,社交媒体分析 数据概述: 本数据集由两个原始数据集合并并翻译成西班牙语而成。第一个数据集来自Kaggle的Jigsaw有毒评论分类挑战赛,包含标记为有毒或非有毒的英语评论。第二个数据集来自PAN 21...
    packageimg
  • 国际妇女劳动节推文数据集2021

    2025年4月15日   

    国际妇女劳动节推文数据集2021 数据来源:互联网公开数据 标签:国际妇女劳动节,推特数据,社会议题,女性权益,性别平等,文本分析,社交媒体监控 数据概述:...
    packageimg
  • NIL数据集-识别关注宣言的数据集1963-2021

    2025年4月15日   

    NIL数据集-识别关注宣言的数据集1963-2021 数据来源:互联网公开数据 标签:宣言识别,NLP,文本分析,事件研究,情绪分析,社会运动 数据概述:...
    packageimg
  • 特朗普演讲字幕数据集

    2025年4月15日   

    特朗普演讲字幕数据集 数据来源:互联网公开数据 标签:特朗普演讲,字幕,语音识别,文本分析,心理学,语言研究,自动字幕,YouTube 数据概述:...
    packageimg
  • 酒店评论文本分析数据集1963-2021

    2025年4月15日   

    酒店评论文本分析数据集1963-2021 数据来源:互联网公开数据 标签:酒店评论,文本分析,客户反馈,日期,地理位置 数据概述: 本数据集包含客户在酒店住宿后提交的评论文本,涵盖评论内容、评论日期及评论来源地等信息。数据集适用于文本分析,帮助了解客户对酒店的反馈和评价。 数据用途概述:...
    packageimg
  • 数据2023年战争民众观点数据集

    2025年4月15日   

    数据2023年战争民众观点数据集 数据来源:互联网公开数据 标签:战争评论, 情感分析, 地缘政治, 公众意见, 社会情绪, 文本分析 数据概述:...
    packageimg
  • arXiv计算机科学论文摘要与结构化文本数据集-2020年

    2025年4月15日   

    arXiv计算机科学论文摘要与结构化文本数据集-2020年 数据来源:互联网公开数据 标签:arXiv,计算机科学,论文,摘要,引言,结论,文本分析,自然语言处理,研究,学术 数据概述:...
    packageimg