星座运势文本数据分析-2020年6月16日至2021年6月16日-shahp7575

星座运势文本数据分析-2020年6月16日至2021年6月16日-shahp7575 数据来源:互联网公开数据 标签:星座运势,占星,预测,情感,事业,健康,生日,文本分析,自然语言处理 数据概述: 本数据集收录了2020年6月16日至2021年6月16日期间,从Horoscope.com抓取的十二星座运势数据。数据涵盖了每个星座在五个不同类别下的运势预测,包括:总体运势(general)、事业运势(career)、爱情运势(love)、健康运势(wellness)和生日运势(birthday)。

数据结构如下: * 总行数:21,960行 * 总列数:4列 * Sign(星座):十二星座的名称。 * Category(类别):运势预测的类别,包括general、career、love、wellness、birthday。 * Date(日期):运势预测的日期,从2020年6月16日至2021年6月16日。 * Horoscope(运势文本):对应的运势预测文本。

数据来源为Horoscope.com。用于抓取该数据集的Python脚本可在GitHub仓库中找到。

数据用途概述: 该数据集可用于多种分析和应用场景,包括:运势文本的情感分析、星座运势预测模式研究、基于文本生成的模型训练等。例如,可以用于训练GPT-2模型,以生成特定星座和类别下的运势文本。此外,该数据也可用于探索不同星座在不同类别下的运势变化趋势,以及分析星座运势文本的语言特点。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.92 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。