zabbix 的一次优化尝试

笔者维护的 zabbix 数据库，由于监控几千台机器，几百个监控项，后台数据库压力比较大。zabbix 数据默认存放在 MySQL，基本 SQL 都是自己生成，当监控的机器数多了，监控项也多了之后，很多低效 SQL 的问题就暴露出来了。下面记录下对 zabbix 的运维改造过程。

针对以上这些问题，开始了一步步的改造，只要是能优化、容易优化的方法基本都使了。

读写分离。zabbix 本身不支持读写分离，业务层面使用 oneproxy，而后台则使用主从架构，用 DNS 做的负载均衡，在从库上表现就是轮询多个 ip。这有个问题，虽然主库压力小了，但从库压力相对大了。线上服务器基本是 8 核，32-64 G 内存，sas raid 10 配置，因为机器资源不够，怕影响其它服务也不能混跑，因此只配了一主两从。大部分读都切到从库了，主库上还是有部分读。
部分表用 tokudb 压缩。先清空一遍 history 和 trends 表，再将引擎改为 tokudb ，分 100 个分区。