云告警

有效运维的 on-call 机制

编者按]本文作者为陈伯龙,云告警平台[OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。正文互联网技术的发展,离不开运维支撑工作,没有零bug的程序,没有不出问题的系统,问题故障不可怕,可怕的是没能有序的处理:突发紧急事件太多,疲于应付,团队士气低下,效率不高。重要事情淹没在大量事件中,没有有序跟进处理,会引发严重业务影响。如