计算机软件及计算机应用
基于文本挖掘和SVM的股票市场择时交易研究
2017-12-05
近年来,随着计算机计算能力的提高以及人工智能的飞速发展,量化投资开始在中国金融市场崭露头角。借助于大数据的发展趋势,机器学习逐渐在量化投资领域发挥出优势。本文主要研究机器学习技术在量化投资领域的应用。学术研究表明,投资者的情绪能够影响股票市场的未来走势。为合理量化投资者情绪,本文首先利用Python编写网络爬虫程序,在东方财富网"股吧"爬取了200万条标题文本数据,进行分词处理、词频统计后,得到初始关键词库。之后利用百度指数相关搜索词功能将关键词的个数扩充至69个,并通过Elastic Net和主成分分析法构造投资者情绪指数。同时,本文使用上证指数2011年3月24日至2017年5月24日共1500个交易日的数据,经过特征工程处理,建立了基于支持向量机(SVM)的股票市场择时交易模型,使用Sliding Window法进行最优参数的学习,从而对股市的未来趋势进行预测,得到未来每个交易日的操作信号。最后,将基于文本挖掘所构建的投资者情绪指数作为数据的一个特征代入SVM中,探讨其是否能提升模型的预测性能。本文经过研究主要得到两个结论:一是经过特征工程对原始数据进行处理后,基于SVM所建立的股票市场择时交易模型对于上涨市、下跌市、震荡市均有较高的预测精度,且在震荡市捕捉到了更多的交易信息,相比买入并持有策略有更高的年化收益率。二是基于文本挖掘所构建的投资者情绪指数能在一定条件下提升模型对股票市场未来趋势的预测性能。
0 2
下载全文(PDF文件/1019k)
2017年(第五届)全国大学生统计建模大赛获奖论文选
2017年
相似文献
更多相似文献