找到16,256个数据集

标签: 自然语言处理

过滤结果
  • 维基百科页面LLM科学考试训练数据集

    2025年4月15日   

    维基百科页面LLM科学考试训练数据集 数据来源:互联网公开数据 标签:维基百科,LLM,科学考试,训练数据,物理概念,文本提取,教育研究 数据概述:...
    packageimg
  • 洋葱新闻讽刺文章数据集

    2025年4月15日   

    洋葱新闻讽刺文章数据集 数据来源:互联网公开数据 标签:讽刺新闻,洋葱,媒体分析,文本数据,图像数据,新闻趋势,幽默文化 数据概述: 本数据集收录了来自《洋葱》(The...
    packageimg
  • SFU评论语料库-否定标注数据集

    2025年4月15日   

    SFU评论语料库-否定标注数据集 数据来源:互联网公开数据 标签:自然语言处理,情感分析,否定标注,文本语料,电影书评,消费者评价,机器学习 数据概述:...
    packageimg
  • 印度政治舆情分析数据集2020-2023

    2025年4月15日   

    印度政治舆情分析数据集2020-2023 数据来源:互联网公开数据 标签:印度政治,舆情分析,社会媒体,公众意见,情感分析,趋势分析,政治研究,NLP 数据概述:...
    packageimg
  • 卡比尔辛格电影推特数据集

    2025年4月15日   

    卡比尔辛格电影推特数据集 数据来源:互联网公开数据 标签:卡比尔辛格,电影评论,歌曲评论,演员表现,票房表现,性别议题,推特数据,印度电影 数据概述:...
    packageimg
  • 权力的游戏全季剧本数据集

    2025年4月15日   

    权力的游戏全季剧本数据集 数据来源:互联网公开数据 标签:权力的游戏, 剧本, 季节, 对话分析, 文本挖掘, 文本数据, 剧情研究 数据概述: 本数据集收录了《权力的游戏》(Game of...
    packageimg
  • Commonlit阅读理解文章难度评估数据集-2020年8月

    2025年4月15日   

    Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:...
    packageimg
  • Reddit读书建议社区书籍推荐数据集-时间跨度待定

    2025年4月15日   

    Reddit读书建议社区书籍推荐数据集-时间跨度待定 数据来源:互联网公开数据 标签:书籍推荐, Reddit, 社交媒体, 文本分析, 自然语言处理, 情感分析, 图书评论, 读者互动 数据概述: 本数据集来源于Reddit社交平台上的r/booksuggestions子版块,该版块汇集了用户关于书籍的讨论与推荐。数据通过Python Reddit...
    packageimg
  • 印度尼西亚股票市场预测新闻与股价数据集2008-2016

    2025年4月15日   

    印度尼西亚股票市场预测新闻与股价数据集2008-2016 数据来源:互联网公开数据 标签:股票市场,预测,新闻分析,深度学习,NLP,时间序列,金融市场 数据概述:...
    packageimg
  • 怀疑论播客节目文字稿数据集1998-2023

    2025年4月15日   

    怀疑论播客节目文字稿数据集1998-2023 数据来源:互联网公开数据 标签:怀疑论,播客,科学,批判性思维,阴谋论,替代医学,超自然现象 数据概述: 本数据集收录了超过900集的怀疑论播客节目《怀疑论》(Skeptoid)的文字稿及其相关元数据。节目由Brian...
    packageimg
  • 比约克歌曲数据集

    2025年4月15日   

    比约克歌曲数据集 数据来源:互联网公开数据 标签:比约克,音乐分析,歌曲特征,歌词内容,艺术研究,音乐趋势,音乐技术 数据概述:...
    packageimg
  • 德安德烈歌词数据集

    2025年4月15日   

    德安德烈歌词数据集 数据来源:互联网公开数据 标签:德安德烈,歌词,音乐,诗歌,意大利文学,艺术,文化研究 数据概述: 本数据集收录了意大利著名诗人和作曲家法布里齐奥·德安德烈的歌曲歌词,涵盖了他的录音室专辑和单曲作品。歌词来源于genius.com网站。请注意,某些歌曲可能未包含在数据集中。 数据用途概述:...
    packageimg
  • 土耳其与英语对照词典数据集

    2025年4月15日   

    土耳其与英语对照词典数据集 数据来源:互联网公开数据 标签:土耳其语,英语,词汇,翻译,语言学习,词典,跨语言研究 数据概述: 本数据集收录了土耳其语与英语之间的对照词汇,包含土耳其语词汇、对应的英语翻译以及使用场景的分类信息。数据集涵盖多个使用场景,为跨语言研究、翻译工具开发和语言学习提供了可靠的语言对照资源。 数据用途概述:...
    packageimg
  • 全球新闻数据集2018年10月23日-11月23日

    2025年4月15日   

    全球新闻数据集2018年10月23日-11月23日 数据来源:互联网公开数据 标签:全球新闻,情感分析,新闻聚合,地域分布,时间序列,情感词典 数据概述:...
    packageimg
  • 手机评论数据集

    2025年4月15日   

    手机评论数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,文本数据,评分系统,自然语言处理,数据清洗,机器学习 数据概述: 本数据集包含手机评论的原始数据,覆盖了从旧款到新款手机的用户反馈,每条评论均配有1到5星的评分。数据集以原始形式呈现,包含缺失值、异常值以及重复数据。这些原始数据为后续的数据处理和分析提供了基础。 数据用途概述:...
    packageimg
  • 全球流行音乐歌词与艺术家数据集1963-2021

    2025年4月15日   

    全球流行音乐歌词与艺术家数据集1963-2021 数据来源:互联网公开数据 标签:音乐歌词,艺术家信息,音乐流派,摇滚,乡村,嘻哈,节奏布鲁斯,英语歌词,多语言支持 数据概述:...
    packageimg
  • 意大利法律条款数据集1963-2021

    2025年4月15日   

    意大利法律条款数据集1963-2021 数据来源:互联网公开数据 标签:意大利法律,条款,法规,法律条文,法律文本,立法历史,司法研究 数据概述:...
    packageimg
  • 印度技术挑战赛问答数据集2023

    2025年4月15日   

    印度技术挑战赛问答数据集2023 数据来源:互联网公开数据 标签:问答数据集,印度技术挑战赛,问题解决,自然语言处理,机器学习,教育应用 数据概述: 本数据集来源于2023年印度技术挑战赛(Inter IIT Tech Meet 11.0),由印度理工学院坎普尔(IIT...
    packageimg
  • 欧洲歌唱大赛YouTube评论数据集-比利时歌曲2013

    2025年4月15日   

    欧洲歌唱大赛YouTube评论数据集-比利时歌曲2013 数据来源:互联网公开数据 标签:欧洲歌唱大赛,YouTube评论,语言学研究,多语言,用户评论,语言态度,文化分析 数据概述:...
    packageimg
  • NASA天文学图片每日一图数据集

    2025年4月15日   

    NASA天文学图片每日一图数据集 数据来源:互联网公开数据 标签:NASA,天文学,图片,每日一图,教育,研究,图像处理,文本分析,关键词提取,实体识别 数据概述: 本数据集包含了NASA自1995年6月以来在其“Astronomy Picture of the...
    packageimg