手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

电商评论情感分析及销量预测方法研究

马欣

  随着互联网技术迅猛发展,人们逐渐开始接受并热衷于网络购物,同时习惯于查看商品评论信息来决定是否购买。这些评论数据中不仅蕴含着用户的兴趣与偏好信息,还包含着商品信息。因此如何通过商品评论数据获取到有价值的信息成为一个亟待解决的问题。首先爬取亚马逊平台的手机评论信息,对爬取到的数据进行预处理,包括数据清洗以及缺失值处理等工作,之后对数据进行文本分词、词性标注以及去停用词等文本语言化处理工作。实验中进行名词过滤以及同义词合并的操作,缩小商品特征词的筛选范围,利用隐狄利克雷分配模型来获取商品特征信息,筛选出出现次数较多的特征词。然后通过将知网HowNet、台湾大学NTUSD、清华大学李军中文褒贬义词典以及一部分未标注来源的词典中的正负向情感词分开整合,同时加入知网词典中的副词,从而构成一个完整的情感词典。为了计算商品特征词情感极性值,需要为情感词典中的不同词赋予不同的权重。使用主成分分析算法对建模数据进行降维,保留数据中有用信息,去除噪声数据。将情感因子加入多元线性回归模型、支持向量机回归以及极端梯度提升算法对商品销量做预测。实验中销量是通过商品销量排名来体现,所以实验中具体是对销量排名进行预测。在使用多元线性回归模型进行预测时,预测结果出现了过拟合。使用支持向量机回归与极端梯度提升算法建模时,同时结合k折交叉验证的方法,最终得到的销量预测结果的准确度进一步提升,缓解了过拟合的情况。最后利用R语言做一个可视化的平台,因为R语言的可视化是非常好的,可以更加清晰美观地展示实验结果,主要是利用R语言的shiny制作。……   
[关键词]:电商评论;情感分析;销量预测
[文献类型]:硕士论文
[文献出处]:大连海事大学2019年