Unity CJ 干货分享:全新的Unity移动游戏优化解决方案
2015-08-20 11:48
267 查看
在今年的CJ CGDC 中国游戏开发者大会上,来自Unity大中华区的技术支持经理张鑫带来了关于《全新的Unity移动游戏优化解决方案》的精彩主题演讲。本次演讲分享的内容,包括从渲染模块、物理模块、动画模块的CPU优化;如何对堆内存的管理以及面对内存泄露和资源冗余的解决方案;以及对代码的优化处理。
CPU优化
首先通过Profiler来找到具体的瓶颈,通过Profiler可以看到每一帧里每个函数的具体开销。
自身逻辑代码效率
如果我们的代码逻辑很复杂,上万行,那么可以借助Begin/EndSample 来拆分,得到真正开销大的代码块。
渲染模块效率
在移动设备上,半透明渲染的开销是需要特别注意的(像花,树,草等),因为在移动设备上会造成更多的overdraw
不同的设备对Drawcall的敏感度不同,因此可以针对设备做一个“LOD”,在高端机上允许更多的drawcall(即可以开启更多的特效等)。
动画模块效率
MeshSkinning.Update 是蒙皮计算的开销,Animator.Update 是骨骼动画的更新开销。OptimizeGameObject的优化选项默认是关闭的。在红米上,一个100人的测试案例中,开启之后,前者可以提高70%的效率,而后者可以提高30%的效率。
另一个测试也是在红米上,200人同屏,单个角色400个顶点,560面左右,动画的总时长为6秒,骨骼数量平均为12个。通过序列帧的形式实现skinnedMeshRenderer到MeshRenderer 的转换。可以跑到25帧。
BakeMesh (SkinnedMeshRenderer.BakeMesh)
200+
~400 顶点
~500+ 60 面
~6 s 动画
~12 骨骼
UI模块效率
上图是一个Ui的例子,由一位工程师在两周左右的时间完成,美术除外(来自scaleform在Assetstore上的资源)。
UI系统的渲染顺序是由UI元素在Hierarchy中的顺序决定的。而Ui系统会通过重排UI元素的渲染顺序来减少drawcall,但前提是不改变渲染结果。因此发生重叠之后,drawcall可能会上升。
内存管理
游戏制作的中后期通常会开始遇到内存上的问题。
总体内存:
•Used Total:当前帧的Unity内存、Mono内存、GfxDriver内存、Profiler内存的总和。
Mono内存:
记录代码堆内存的分配情况,由Mono控制
内存只增不减
建议<40MB
Mono内存有80%的团队都不太关心,但却是很重要,会影响游戏的流畅性。
常见问题:Log输出
StackTraceUtility.PostprocessStacktrace ()
StackTraceUtility.ExtractStackTrace()
Log的输出不仅会消耗CPU,同时也会引起较大的堆内存分配。
内存泄露
资源被强行Hold无法释放
表现症状:Profiler中内存增长趋势明显,且资源无法回收
DetailedMemory Profiler
资源冗余
资源通过AB加载,且资源在AB建立时存在多份
对AB打包机制进行详细排查
依赖关系打包
代码优化
游戏优化深度检测:
通过Profiler逐帧查看和分析CPU占用较高的函数
GC.Alloc
Shader.Parse
Shader加载时的解析耗时
这部分耗时的避免,可以通过将shader打入单独的assetbundle包,并在进入场景时就进行预加载。
同一时间Load过多的非“基础”AB,且不及时Unload,会导致过多的内存消耗,如WebStream
和Serialized File 的内存。
而PersistentManager.Remapper 的意义是:PersistentManager维护资源的持久化存储功能,Remapper保存的是加载到内存的资源heapID与源数据FileID的映射关系,但Remapper是memory pool,只增不减,因此建议不要一次性加载过多的assetbundle,而是以流式的方式来加载,以减小其峰值。
小结:性能优化是没有定式的,它需要“因时因地”制宜。
CPU优化
首先通过Profiler来找到具体的瓶颈,通过Profiler可以看到每一帧里每个函数的具体开销。
自身逻辑代码效率
如果我们的代码逻辑很复杂,上万行,那么可以借助Begin/EndSample 来拆分,得到真正开销大的代码块。
渲染模块效率
在移动设备上,半透明渲染的开销是需要特别注意的(像花,树,草等),因为在移动设备上会造成更多的overdraw
不同的设备对Drawcall的敏感度不同,因此可以针对设备做一个“LOD”,在高端机上允许更多的drawcall(即可以开启更多的特效等)。
动画模块效率
MeshSkinning.Update 是蒙皮计算的开销,Animator.Update 是骨骼动画的更新开销。OptimizeGameObject的优化选项默认是关闭的。在红米上,一个100人的测试案例中,开启之后,前者可以提高70%的效率,而后者可以提高30%的效率。
另一个测试也是在红米上,200人同屏,单个角色400个顶点,560面左右,动画的总时长为6秒,骨骼数量平均为12个。通过序列帧的形式实现skinnedMeshRenderer到MeshRenderer 的转换。可以跑到25帧。
BakeMesh (SkinnedMeshRenderer.BakeMesh)
200+
~400 顶点
~500+ 60 面
~6 s 动画
~12 骨骼
UI模块效率
上图是一个Ui的例子,由一位工程师在两周左右的时间完成,美术除外(来自scaleform在Assetstore上的资源)。
UI系统的渲染顺序是由UI元素在Hierarchy中的顺序决定的。而Ui系统会通过重排UI元素的渲染顺序来减少drawcall,但前提是不改变渲染结果。因此发生重叠之后,drawcall可能会上升。
内存管理
游戏制作的中后期通常会开始遇到内存上的问题。
总体内存:
•Used Total:当前帧的Unity内存、Mono内存、GfxDriver内存、Profiler内存的总和。
Mono内存:
记录代码堆内存的分配情况,由Mono控制
内存只增不减
建议<40MB
Mono内存有80%的团队都不太关心,但却是很重要,会影响游戏的流畅性。
常见问题:Log输出
StackTraceUtility.PostprocessStacktrace ()
StackTraceUtility.ExtractStackTrace()
Log的输出不仅会消耗CPU,同时也会引起较大的堆内存分配。
内存泄露
资源被强行Hold无法释放
表现症状:Profiler中内存增长趋势明显,且资源无法回收
DetailedMemory Profiler
资源冗余
资源通过AB加载,且资源在AB建立时存在多份
对AB打包机制进行详细排查
依赖关系打包
代码优化
游戏优化深度检测:
通过Profiler逐帧查看和分析CPU占用较高的函数
GC.Alloc
Shader.Parse
Shader加载时的解析耗时
这部分耗时的避免,可以通过将shader打入单独的assetbundle包,并在进入场景时就进行预加载。
同一时间Load过多的非“基础”AB,且不及时Unload,会导致过多的内存消耗,如WebStream
和Serialized File 的内存。
而PersistentManager.Remapper 的意义是:PersistentManager维护资源的持久化存储功能,Remapper保存的是加载到内存的资源heapID与源数据FileID的映射关系,但Remapper是memory pool,只增不减,因此建议不要一次性加载过多的assetbundle,而是以流式的方式来加载,以减小其峰值。
小结:性能优化是没有定式的,它需要“因时因地”制宜。
相关文章推荐
- Unity3d中封装单例模式,Singleton
- Unity3d5.0之后关于游戏音乐的管理
- [Unity]Unity开发NGUI代码实现ScrollView(滚动视图)
- 使用.NET Reflector 查看Unity引擎里面的DLL文件
- Unity绘制GUI连连看(尚未完善效果和重置)
- unity第二讲
- Unity3D 中 protobuf-net
- Unity中OnGUI绘制贪吃蛇
- Unity3D shader简介
- unity中的[xxxxxx]特性(Attributes)
- unity中的[xxxxxx]特性(Attributes)
- unity中鼠标拖拽物体移动
- unity3d 学习笔记_____Native2d 刚体、冲击、联合使用
- 全面理解Unity加载和内存管理
- Unity 3D中的内存管理
- Unity3d基础组件 (Component) 和脚本 (Script) 关系
- Unity项目中UI同学需知的程序相关要点
- Unity Shader 学习笔记 (八) 语义词与语义绑定
- 浅尝Unity 3D的Asset Bundle知识(七)-----依赖的利用
- Unity 3D Android对dll加密和重编译mono源码进行解密