- 时间:2022.08.26
- 分享人:周帆
- 关键字:AI4DB,智能调参,OtterTune,CDBTune,Hunter,QTune
- 分享PPT: 2022-08-26-数据库之智能调参
数据库存在上百个参数,不同工作负载对应着不同适配的参数配置,所以调参的目标在于同时优化资源使用率和性能。本次分享对当前主流的智能调参模型做一个详细的分析并总结其优缺点。
-
核心思想:收集历史数据,并使用模型学习以往经验,实现自动化调优
-
主要步骤:
- 去掉冗余工作负载
- 选择最具影响力的旋钮
- 将目标工作负载映射到已有工作负载
- 推荐旋钮设置
-
优点:
- 利用大量历史数据
- 几乎不需要人工参与
- 能够适应不同的数据库管理系统
-
缺点
- 所采用的训练模型都是流水线模型
- 过度依赖大规模高质量训练样本
- 无法在高维连续空间中推荐合理的配置,存在次优情况
参考文献:Automatic database management system tuning through large-scale machine learning
-
核心思想:放弃机器学习,引入深度强化学习,实现端到端自动调优系统
-
优化点
- 采用试错法,以有限的样本数学习最佳旋钮
- 利用深度确定性策略梯度法在高维连续空间中寻找最优配置(DDPG)
- 设计了一个有效的奖励函数,代替传统回归
-
DDPG
-
优点
- 化繁为减,实现的是一个端到端的推荐
- 自我学习,探索各种可能的调参动作
- 减小陷入局部最优的可能性
-
缺点
- 冷启动,需要初始化生成负载进行训练,导致调优时间大大增加
- 只支持粗粒度调优(只读,只写,读写),不支持细粒度的调优(select,update等)
参考文献:An end-to-end automatic cloud database tuning system using deep reinforcement learning
- 待解决问题
- 训练初期,调优效果差,收敛速度慢(冷启动)
- 搜索空间大,网络结构复杂(模型优化)
- 目标
- 在没有任何数据的情况下短时间内推荐最优配置(在线调优系统)
- 优化点
- 克隆CDB实例,以此并行进行压力测试,同时,采用GA算法,以此生成高质量的样本
- 参照OtterTune,采用PCA降维,并利用随机森林给Knob排序
- 优点
- 利用并发压力测试,解决冷启动问题,显著缩短在线调优时间
- GA算法短时间内生成高质量样本,提高DDPG调优效果
- 缺点
- 难以快速判断性能是否达到“最优”,目前需要额外的时间判断
- 待解决问题
- CDBTune只提供粗粒度的调优(读写级别调优),不能提供细粒度调优(OLTP、OLAP级别的调优)
- 目标
- 在没有任何数据的情况下短时间内推荐最优配置(在线调优系统)
- 优化点
- QTune 提供三种数据库调优粒度:查询级、工作负载级和集群级调优
- 加入SQL查询信息,提出一种双状态深度确定性策略梯度 (DS-DDPG) 模型
- 优点
- 提供细粒度调优,提高调优性能
- 缺点
- 训练时间太长,模型复杂
参考文献:Qtune: A query-aware database tuning system with deep reinforcement learning