本文主要研究如何利用 Linux Shell 脚本和飞信 API 来实现 MySQL 数据库的自动监控和短信报警,使 DBA 从繁重和重复的监控工作中解脱出来,一边享受马尔代夫的阳光、沙滩,一边实时监控北京的 MySQL数据库。
随着互联网及信息化的迅猛发展,企业运营所产生的数据量越来越大,所以大多数公司选择将重要商业数据存储在数据库中。如果数据库系统突然停机或发生其它故障,必然会影响公司的收入,声誉甚至导致用户投诉,如何保证数据库系统的正常运转,一直是公司关心的核心问题。这就要求 DBA 对数据库运行的各种状态进行实时监控,在发生故障之前解决它,将隐患消灭在摇篮中。本文给出使用 “MySQL Monitor” Shell 脚本来实现 MySQL 的实时监控,讨论了如何实现 MySQL的短信报警功能模块,同时结合一个真实应用场景来演示 “MySQL Monitor” 是如何工作的。
背景
南风公司遇到的问题
南风公司是一家互联网公司,该公司在北京网通1区机房有 10 台服务器,2 区机房有 10 台服务器,在上海电信 1 区机房也有 10 台服务器......,鉴于公司数据的重要性,DBA 必须实施一系列的监控措施来保证数据库良性运转,设置了包括操作系统磁盘空间检查、数据库表空间检查、数据库表状态检查、双机互备情况检查等 20 个检查点,DBA 有哪些选择去实施如此宠大的监控方案呢?下面是传统的解决方案:
这是一种低效的串行工作方式,DBA 必须每天从早上 10:00 开始逐台检查数据库服务器的 20个检查点,非常耗时,这种传统的方案会让 DBA 每天重复做机械化的工作,当有几百台被监控服务器时,这个传统的方案对 DBA 的来说就是噩梦,那么如何才能更有效的监控数据库成为 DBA 迫切需要解决的问题?
南风公司的解决方案
智慧的 MySQL,需要用智慧的方式去驾驭。南风公司的 DBA 开发了一套 “MySQL Monitor” 解决方案,这套方案充分利用了 “Shell 脚本” + “Linux Cron定时器服务” + “中国移动飞信免费发短信 API 接口” 的优势,只有在数据库检查点出现问题时才会向 DBA 发送短信进行报警,实现了真正意义上无人值守的大量数据库服务器监控框架,下面是全新的解决方案:
这是一种高效的并行工作方式,为了便于管理,我们先将数据库服务器进行了分组,每组服务器对应一个监控线程,并且这些监控线程部署在“监控工作站”上,大家 一定注意到“时间轴”消失了,这是因为这些监控线程是每 1 分钟运行一次,“时间轴”已经没有什么意义了。如果有一切正常,这些监控线程只会写日志,不会有其它的操作;如果当某台数据库服务器有异常情况发生,那么 “监控工作站”会给 DBA 终端发送短信提醒,这样 DBA 就可以在第一时间发现问题解决问题,即使 DBA 身边没有电脑终端也一样可以及时的了解 MySQL 服务器的运行情况
发表回复