用到的工具是tushare。 这个工具有点麻烦,在安装的时候需要失败后安装它提示的一些package。并不是因为pip的原因。tushare安装过程中会提示你需要安装的包名称,按照它提示的去安装完所有的支持包,就能正常使用。
通过对每只股票基本面数据的规整,得到影响企业股票价格的企业各方面数据,把企业的运营数据和生产数据作为深度学习的特征进行整合和清洗;获得每只股票的股票数据,设定在该年度持有该股票期限为半年,随机抽取100天的半年的收益率并计算总收益率的平均值。将所有股票收益率分类并在基本面数据后进行标注,获得每只股票的基本面数据和收益率分类的总数据。对该数据进行分层抽样分离数据集,对测试集进行深度学习,然后获得的模型用验证集学习。对比验证集学习后的标签和原标签对比,获得正确率,评估模型效果。
add a column named['profit_half_year_ago'] at the end of the dataframe, data comes from the 2015/06/01 of '开盘价'
Code in the fold for review.
通过对季报的数据规整,由前三个季度的季报数据去预测后两个季度的数据。前三个月的季报数据为:净利润,营业收入,毛利率,速动,每股收益增长率,净资产收益率,存货周转率,总资产增长率,利息支付倍数。后两个季度的数据为后两个季度的股票收盘价涨跌取平均,然后分成四类,依次标注。