近期,着手对bugly上的anr 处理,记录下优化的方向。
借用网上的一张图:
这里的anr 问题是属于主线程的call 耗时操作。需要使用trace 来获取发生anr前一些列的耗时方法调用时间,再次梳理业务,才可能解决。
问题1
java 调用栈:
从调用栈中发现onActivityResult()执行对游戏侧的初始化会造成anr。
因靠打印是不准确,存在多线程抢占cpu的缘故,因此考虑通过获取trace来记录方法的真正执行时间。
记录oppo渠道包的冷启动到登录页面的sample trace文件,总览trace中存在的耗时点:这里查看主线程中执行方法。
淡绿色是app中的代码,长方形占用面积越大,越耗时。
查看onActvityResult的逻辑执行时间:
发现Show_GLView()执行耗时最多,其中NativeInit()函数中调用若干方法,游戏C++层初始化了一大堆的逻辑。
问题2
anr发生的调用栈
通过调用栈oppo渠道中发现onResume执行对渠道初始化发生anr。
通过trace,来看下onResume中执行时间:
发现,onResume中初始化聚合渠道任务初始化,耗时100多毫秒。该任务可能并不是真正引起anr的真凶,可能是onActivityResult()耗时过多,间接导致onResume()过程中被系统判定anr。
方案优化
耗时任务的解决有三种方式:
- 将耗时任务放到异步线程中执行
- 将耗时任务 lazy延后策略执行或者 提前选择空闲时间执行。
当界面1 跳转其他界面2后,当界面2调用finish()销毁时:
先执行界面2的onStop()–>界面1的onActivityResult()->界面1的onResume()–>界面2的onstop()–>界面2的onDestroy()。
尝试将nativeInit()和Show_GLView_Two() 放到onActvivityResult()和onResume()之后执行。为了不阻塞onResume()执行,利用hanlde的空闲机制:
在onActivityResult之后执行空闲任务:
Onresume 之后添加延迟任务:
按照以上调整逻辑,再次编译渠道包,来看下优化效果
优化效果
查看onActivityResult()中onResume()执行时间:
同时也反馈给游戏侧c++层的同事,初始化根据业务,进行延迟、异步等操作细分调用时间。
资料借鉴:
- https://www.zhihu.com/tardis/bd/art/552305686?source_id=1001