数据集概述
本数据集围绕应用评论需求分析展开,包含训练集、测试集、基准数据集、实验结果文件、代码文件及提示词文档,共9个文件,覆盖数据、代码、文档三类文件类型,用于应用评论需求分析相关的实验研究。
文件详解
- 数据文件(.xlsx格式,共5个)
- test_set_470reviews.xlsx:测试集数据,包含470条应用评论
- Benchmarking_Dataset.xlsx:基准数据集
- results_GPT_on_testset.xlsx:GPT在测试集上的实验结果
- train_set_1410reviews.xlsx:训练集数据,包含1410条应用评论
- results.xlsx:实验结果汇总
- 代码文件(.ipynb格式,共3个)
- comparison_non-LLMs.ipynb:非大语言模型对比分析代码
- GPT_zeroshot.ipynb:GPT零样本学习实验代码
- analysis.ipynb:数据分析代码
- 文档文件(.docx格式,共1个)
- prompts.docx:实验所用提示词文档
适用场景
- 应用评论需求分析研究:利用训练集、测试集开展应用评论需求提取与分析实验
- 大语言模型与非大语言模型对比研究:通过代码文件实现不同模型在应用评论需求分析任务上的性能对比
- 零样本学习实验:基于GPT_zeroshot.ipynb代码文件开展大语言模型零样本学习在应用评论需求分析中的应用研究
- 实验结果分析:借助results.xlsx等结果文件分析实验效果与规律