Backtrader 文档学习- 架构功能分析理解

1. 概述

backtrader是一个用于开发和执行交易策略的Python框架。它提供了一套完整的工具和功能,使得用户可以方便地进行策略回测、实盘交易以及数据分析。

backtrader的入口为Cerebro类,该类将所有输入(Data Feeds)、策略 (Strategy)、观察者(Observers)、策略评估(Analyzers) 、经纪人(Broker)、订单(Order)、交易(Trade)和日志记录(Writers)整合起来,实现回测以及交易,并返回结果和图表。

backtrader优缺点,先说缺点:

(1)缺点:
  • 在于使用元类编程技术,使用了大量的类,调试的时候会比较难。
  • 对于python的要求高,需要掌握pandas,matplotlib ,有基础上手更容易。
  • 对环境存在兼容性, 使用pandas ,numpy ,matplotlib 的版本不能太高。
  • 对回测结果分析,需定制化做大量工作,比如需要将各类策略的测试结果,除了能打印日志外,需要保存到数据库中,便于后期对比分析,比如周期参数,5天、10天、20天同一个策略不同的周期,执行的绩效记录处理。
(2)优点:
  • 功能非常完善,支持多品种、多策略、多周期的回测和交易,编写策略简单,上手容易。
  • 交易的品种非常丰富(股票、期货、期权、外汇等)。
  • 详细的文档,提供的用例比较多,可以学习和根据需求改进 。
  • 在量化框架上,收费的居多,优矿,米筐,聚宽,不能本地化部署。免费开源的少。
  • 支持内部方法的重写,可以方便定制化策略。
  • 内置多个指标参数,很丰富,包括Talib 。
(3)使用目标:
  • 以研究策略为主,验证策略效果,选择标的股票。
  • 不需要太多的参数因子,基于通用指标,可以灵活组合。
  • 不做实盘高频交易。
  • 适合个人学习使用,探索基本量化方向,避免盲目交易,有数据支撑。

2.架构理解

backtrader的整体架构可以分为以下主要组件:

(1)数据源(Data Feeds):

backtrader支持多种数据源,包括CSV文件、Pandas DataFrame、实时数据源等。用户可以根据自己的需求选择适合的数据源,并通过数据加载器将数据加载到backtrader中进行处理。
backtrader回测的数据类型是由一系列的点组成的Lines,通常包括以下类别的数据:Open(开盘价)、High(最高价)、Low(最低价)、 Close(收盘价)、Volume(成交量)、OpenInterest(未平仓权益)。Data Feeds(数据加载)、Indicators(技术指标)和Strategies(策略)都会生成 Lines。价格数据中的所有的开盘价按时间组成一条 Line,因此一组含有以上6个类别的价格数据,共有6条 Lines。如果算上DateTime(时间,可以看作是一组数据的主键),一共有7条 Lines。Lines根据需要是可以扩展的。

核心概念:
Line的概念和Python中的list索引不同,Python List中索引-1,表示最后一个数据。
一条Line数据的下标为0表示访问当前时刻数据,-1表示访问下一个数据。在回测过程中,无需知道已经处理了多少条/分钟/天/月,”0”一直指向当前值,下标 -1 来访问下一个值,下标 -2 访问下下一个值。
在backtrader中,-1指的是当前处理数据(索引为0)的上一个数据。
Lines是随时变化的,run的时候,next不断改变Lines的长度,在数据载入,策略,指示器应用中,需要测量Lines的长度。
两个长度函数:len和buflen之间的区别:

  • len已处理了Lines
  • buflen为数据加载Lines的总数
(2)策略(Strategies):

backtrader提供了一个基类Strategy,用户可以继承该类并实现自己的交易策略。策略类中定义了一系列的回调函数,用户可以在回测函数中编写具体的交易逻辑。

该模块是回测系统最核心的部分,需要设计交易决策,得出买入/卖出信号。策略类代码包含重要的参数和用于执行策略的功能,要定义的参数或函数名如下:
(1)params:全局参数,可选,用于更改交易策略中变量/参数的值,可用于参数调优。
(2)log:日志,可选,用于记录策略的执行日志,可以打印出该函数提供的日期时间和txt变量。
(3)init:用于初始化交易策略,类中使用的全局变量定义,在其中声明的任何指标都会在next()方法调用之前进行计算。部分python操作符不支持,需要使用bt内置函数来处理,例如bt.And, bt.Or, bt.All, bt.Any等。
(4)notify_order,可选,用于跟踪交易订单(order)的状态。order具有提交,接受,买入/卖出执行和价格,已取消/拒绝等状态。
(5)notify_trade,可选,用于跟踪交易的状态,任何已平仓的交易都将报告毛利和净利润。
(6)next,必选,用于制定交易策略的函数,策略模块最核心的部分。
当满足所有data/indicators的最小周期后,执行将对所有剩余数据点调用。
如period是10 ,最小周期达到后,开始执行next方法。
(7)nextstart(),可选,方法执行一次,在最小周期的data/indicators满足时,默认执行next方法。
如period是10 ,在到达9执行最小周期达到后,执行一次nextstart,之后执行next方法。
(8)prenext(),可选,方法将在所有数据/指标的最小周期满足策略开始执行之前调用执行。
如period是10 ,在1到9执行最小周期之间,执行prenext。
(9)start(),可选,在回测即将开始之前调用,执行一次。
(10)stop(),可选,在回测即将结束之前调用,执行一次。
(11)notify_cashvalue(),可选,接收当前使用的资金余额
(12)notify_fund(),可选,策略的资金和价值发生变化时被调用。用于跟踪和记录策略的现金、价值、基金价值和持仓股票的数量。

(3)指标(Indicators):

backtrader内置了许多常用的技术指标,如移动平均线、MACD、RSI等。用户可以通过指标类来计算这些指标,并在策略中使用。
backtrader在指标中也集成了TA-Lib库

(4)订单(Order):

backtrader提供了一套完善的订单管理系统,用户可以通过创建订单对象来执行买入和卖出操作。订单管理系统还支持订单状态的跟踪和管理。
将策略中逻辑做出的决策转换为适合经纪人执行操作的消息,通常在交易策略中调用。
Order将strategy的逻辑做出的决策转换为适合broker执行操作的消息。通过以下方式完成:
创建 ,通过strategy 的方法:buy sell 和close 都可以返回Order的实例
取消,通过strategy的方法:cancel 也可以产生Order实例
通知,notify_order 的方法,也返回Order 实例
订单还作为反馈给用户的通信方法,通知代理中的运行情况

(5)经纪人(Broker):

通过设置回测的初始自己、佣金费率、税收费率、滑点率等交易条件,模拟不同的订单类型,限价订单,控制订单的有效期,并根据现金检查订单,计算每次交易的现金和权益,保存交易数据。
Trade :backtrader会自动记录每笔交易的详细信息,包括买入价格、卖出价格、手续费等。用户可以通过这些交易记录进行后续的分析和统计。
Position :仓位管理 。

(6)策略评估(Analyzers):

用于分析交易策略的利润和风险,分析交易系统的绩效。
内置各类评价指标,可以加入到评测对象中,对结果进行绩效分析,分析指标:年度回报率,卡尔玛比率,最大回撤,资金杠杆,仓位资金,组合投资值等,是对策略的效果评估参数。

(7)观察者(Observers):

用于记录交易过程,包括现金、权益、费用以及交易动作、买卖订单等数据。

(8)回测引擎(Backtesting Engine):

cerebro.run()
backtrader提供了一个强大的回测引擎,用户可以通过指定回测时间段和初始资金等参数来进行策略回测。回测引擎会模拟真实的交易环境,并根据用户定义的策略进行交易。

(9)绘图(Plot):

分析和可视化(Analysis and Visualization):
backtrader提供了多种分析工具和可视化功能,用户可以对回测结果进行详细的分析和可视化展示,可以增加图示内容,包括收益曲线、风险指标、交易位置等。
通过图形的方式显示交易测量回测的结果,绘图显示的结果包括三部分类型:现金及权益、交易损益、买卖动作。

绘图设置通过plotinfo来设置,其参数主要有:plot(是否绘图,默认为True),subplot(是否单独窗口绘图,默认为True,MA类指标该参数为False),plotname(指标图名,默认为指标类名),plotabove(绘图位置在数据上方,默认为False),plotlinelabels, plotymargin, plotyticks,plothlines, plotyhlines, plotforce。

3.代码示例

做一个最简单的SMA测试示例。
取100个股票,进行测试,测试的时间范围从2016年到2020年,一共5年的数据。
在策略中的init()初始化定义了Indicator ,在next()中买卖操作。
增加了Observer和Analyzer ,把大多数的监控绩效的指标都加入了。

#!/usr/bin/env pythonimport datetimeimport pandas as pdimport numpy as npimport pymysqlimport backtrader as btimport backtrader.feeds as btfeedsimport backtrader.indicators as btindfrom sqlalchemy import create_engineengine_ts = create_engine('mysql+pymysql://user:pwd@ip:3306/dbname" /> '2016-01-01' and t.trade_date  sma = btind.SMA(self.data, period=self.p.smaperiod)sma = btind.SMA(period=self.p.smaperiod)# CrossOver (1: up, -1: down) close / smaself.buysell = btind.CrossOver(self.data.close, sma, plot=True)# Sentinel to None: new ordersa allowedself.order = Nonedef next(self):if self.order:# pending order ... do nothingreturn# Check if we are in the marketif self.position:if self.buysell  0:plimit = self.data.close[0] * (1.0 - self.p.limitperc / 100.0)valid = self.data.datetime.date(0) + \datetime.timedelta(days=self.p.valid)self.log('BUY CREATE, %.2f' % plimit)self.buy(exectype=bt.Order.Limit, price=plimit, valid=valid)def runstrat(stock_code):cerebro = bt.Cerebro()# 初始资金 100,000,000cerebro.broker.setcash(100000.0)# 佣金,双边各 0.0003cerebro.broker.setcommission(commission=0.0003)# 滑点:双边各 0.0001cerebro.broker.set_slippage_perc(perc=0.0001)# 获取数据stock_df = get_code(stock_code)start_date = datetime.datetime(2016, 1, 1)# 回测开始时间end_date = datetime.datetime(2020, 12, 31)# 回测结束时间data = bt.feeds.PandasData(dataname=stock_df, fromdate=start_date, todate=end_date)# 加载数据cerebro.adddata(data)cerebro.addobserver(OrderObserver)cerebro.addstrategy(St_CrossOver)tframes = dict(days=bt.TimeFrame.Days,weeks=bt.TimeFrame.Weeks,months=bt.TimeFrame.Months,years=bt.TimeFrame.Years)cerebro.addanalyzer(bt.analyzers.SharpeRatio, _name='mysharpe')cerebro.addanalyzer(bt.analyzers.DrawDown,_name = 'mydrown')cerebro.addanalyzer(bt.analyzers.AnnualReturn,_name = 'myannualreturn')cerebro.addanalyzer(bt.analyzers.SQN,_name = 'mysqn')cerebro.addanalyzer(bt.analyzers.TradeAnalyzer,_name = 'mytradeanalyzer')cerebro.addanalyzer(bt.analyzers.PositionsValue,_name = 'mypositionvalue')cerebro.addanalyzer(bt.analyzers.Returns,_name = 'myreturns')cerebro.addanalyzer(bt.analyzers.LogReturnsRolling,timeframe=tframes['years'],_name = 'mylogreturnsrolling')cerebro.addanalyzer(bt.analyzers.Transactions, _name='mytransactions')thestrats = cerebro.run()thestrat = thestrats[0]print('Sharpe Ratio:', thestrat.analyzers.mysharpe.get_analysis())print('DrawDown:', thestrat.analyzers.mydrown.get_analysis())print('AnnualReturn:', thestrat.analyzers.myannualreturn.get_analysis())print('SQN:', thestrat.analyzers.mysqn.get_analysis())print('TradeAnalyzer:', thestrat.analyzers.mytradeanalyzer.get_analysis())print('PositionsValue:', thestrat.analyzers.mypositionvalue.get_analysis())print('Returns:', thestrat.analyzers.myreturns.get_analysis())print('LogReturnsRolling:', thestrat.analyzers.mylogreturnsrolling.get_analysis())print('Transactions:', thestrat.analyzers.mytransactions.get_analysis())#cerebro.plot()if __name__ == '__main__':t1 = datetime.datetime.now()stock_data = get_stock_code()for i in range(len(stock_data)):print(stock_data.loc[i, 'ts_code'])runstrat(stock_data.loc[i, 'ts_code'])t2 = datetime.datetime.now()print('Spend time:', t2 - t1)engine_ts.dispose()print('ok!')

详细结果内容多,就不展示了。
结果是用了32.59秒完成计算,100个股票,5年的数据,速度还可以。

Spend time: 0:00:32.591037
ok!

4.小结

backtrader的整体架构是基于事件驱动的,用户通过编写策略类来定义交易逻辑,并通过回测引擎进行策略回测和分析。
通过上面的比较全面的功能测试,基本上覆盖前期学习的backtrader主要功能,完成了一个自定义的策略回测验证。

在不考虑数据采集的情况下,假设数据全部在数据库中,需要后期完成的工作很多:

  • 组合策略的定义,肯定不能是简单的SMA,可以结合MACD /RSI/KDJ/ADX 等等指标。
  • 时间周期的定义,触发不同指标的效果。
  • 策略评估结果保存入库后,进行横向比较。
  • 参数调优,最简单的如前篇文章,测试胜率和盈亏比组合,组合参数的递增或递减,绩效结果对比。
  • 黑天鹅事件,比如千股跌停的情况,异常极端情况的风险控制,2008年6月次贷危机世界经济危机,2015年6月到8月去杠杆,2016年1月熔断机制上线,还有今年2月5日 。
  • 加仓机制实现
  • 止损机制实现
  • 止盈机制实现
  • 仓位管理实现
  • 对于不同走势定义不同的策略,如短期打板策略,需要看成交量、换手率,严格的止盈止损。
  • 策略模块化,可以是内置类
  • 日志,绩效结果模块化,到数据库
  • 绩效参考基准,比如沪深500

对于自定义的回测功能或控制内容,欢迎大家可以留言探讨。