Bootstrap

Python量化交易实战:获取股票数据并做分析处理

量化交易(也称自动化交易)是一种应用数学模型帮助投资者进行判断,并且根据计算机程序发送的指令进行交易的投资方式,它极大地减少了投资者情绪波动的影响。量化交易的主要优势如下:

  1. 快速检测
  2. 客观、理性
  3. 自动化

量化交易的核心是筛选策略,策略也是依靠数学或物理模型来创造,把数学语言变成计算机语言。量化交易的流程是从数据的获取到数据的分析、处理。

数据获取

数据分析工作的第一步就是获取数据,也就是数据采集。获取数据的方式有很多,一般来讲, 数据来源主要分为两大类:外部来源(外部购买、网络爬取、免费开源数据等)和内部来源 (自己企业销售数据、财务数据等)。

因为我们不生产数据,所以只能从外部获取数据。其获取途径是第三方开源库tushare。

使用 tushare 获取历史股票数据

tushare 是一个免费、开源的Python 财经数据接口包。其主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据,以减轻他们在数据获取方面的工作量。

安装 tushare 库,在 Jupter Notebook 下输入以下命令:

%pip install tushare

重启kernel,然后输入以下命令。

import tushare
print("tushare版本号{}".format(tushare.__version__))
tushare版本号1.2.85

获取个股历史交易数据(包括均线数据),用户可以通过参数设置获取日K线、周K线、月K线,以及5分钟、15 分钟、30 分钟和 60分钟K线数据。本接口只能获取近3年的日线数据,适合搭配均线数据进行选股和分析。Python 代码如下:

import  tushare  as  ts
ts.get_hist_data('000001') #一次性获取全部日k线数据
'''
参数说明:
code:股票代码,即6位数字代码,或者指数代码(sh=上证指数 sz=深圳成指 hs300=沪深300指数 sz50=上证50 zxb=中小板 cyb=创业板)
start:开始日期,格式YYYY-MM-DD
end:结束日期,格式YYYY-MM-DD
ktype:数据类型,D=日k线 W=周 M=月 5=5分钟 15=15分钟 30=30分钟 60=60分钟,默认为D
retry_count:当网络异常后重试次数,默认为3
pause:重试时停顿秒数,默认为0
例如:
ts.get_hist_data('000001', ktype='W') #获取周k线数据
ts.get_hist_
;