数据集概述
本数据集是基于Twitter平台的在线贷款(Pinjaman Online)主题数据,通过twint库采集,包含3个文件,覆盖原始与处理后的推文内容,涉及推文基本信息、互动数据及预处理文本,可用于分析在线贷款相关的社交媒体讨论特征。
文件详解
- 文件名称:pinjol_fix.csv
- 文件格式:CSV
- 字段映射介绍:包含id、conversation_id、created_at、date、time、timezone、user_id、username、name、place、tweet、language、mentions、urls、photos、replies_count、retweets_count、likes_count、hashtags、cashtags、link、retweet、quote_url、video等推文原始字段
- 文件名称:test_pinjol_dataset.csv
- 文件格式:CSV
- 字段映射介绍:包含id、date、username、tweet、replies_count、retweets_count、likes_count、link、tweet_preprocessed等字段,含预处理后的推文文本
- 文件名称:train_pinjol_dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:推测为训练用数据集,结构与测试集类似,包含在线贷款主题推文的相关结构化信息
数据来源
通过twint库采集的Twitter数据
适用场景
- 在线贷款社交媒体舆情分析: 分析Twitter平台上关于在线贷款的讨论热度、用户态度及传播特征
- 金融科技用户行为研究: 基于推文内容和互动数据,研究在线贷款用户的社交行为模式
- 借贷产品口碑监测: 提取推文中的用户反馈,评估在线贷款产品的公众口碑与潜在风险
- 自然语言处理模型训练: 利用预处理后的推文文本,训练在线贷款主题的文本分类、情感分析模型