以下为《运行维护5要素》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
系统运维五大要素
如今的互联网是一个巨大的变幻莫测的世界,每个站点、每个应用程序、每项服务都急切要求 增加流量、得到扩展,都需要我们重点关注。这些都是关键任务系统,所以,要想在当今的市场竞 争中获胜,必须保证这些系统能够全天候24小时处于开启状态并且拥有很快的速度。所以,在系统 运维方面有五个非常重要的要素:可靠性、性能、可扩展性、安全性以及成本节约。 ***只关注某一个或者最多两个要素,而未能认识到全部五个要素的重要性。尤其是当 公司一直把成本节约当成最重要的要素的话,这种做法会***的长远发展。要想在21世纪取得 24x7运维和系统成功的话,关键是要能够理解并合理地关注这五大要素。 接下来我们就来介绍这五大要素,此外,您还可获知如何改进每个要素及最佳实践做法
可 靠 性
网站必须一直处于开启状态、拥有良好的访问速度和可靠性。就这么简单。你的客户和用户都 是比较忙的,可能会随时访问你的系统,如果你的用户位于不同的地理区域,更是可能在晚上或深 夜访问你的网站。所以,取得经济效益如销售产品、塑造高品质的品牌和获得客户信任,不惜一切 代价使系统持续处于稳定运行状态是头等大事。
您需要考虑:
完全冗余的硬件和服务器 - 发生故障,硬件故障以及软件故障。真正的高可靠性系统,是一个 全冗余系统,从下面的IDC, 到双重IDC 供给,再到防火墙、交换机、物理服务器、虚拟机、负载均 衡器、网络服务器、数据库、缓存以及其它一切东西。为保证系统处于持续运行状态,您就得采用 双冗余架构。 全天候深度监控 - 即使您已经采用全冗余系统架构,您也得积极地避免某些事件发生,或者 至少您必须能够快速侦测并处理此类事件。在事情未发生之前,就对成百上千个数据点进行深度监 控,能够帮助您及时发现问题并快速报告严重问题,以便问题能够尽快得到解决,从而维护系统的 可靠性。 可靠性设计- 对于现今系统而言,必须在设计阶段就考虑到可靠性,从架构到硬件和配置再到 运维和流程,都必须把系统的正常运行时间设计到最长、可靠性设计到最佳。虽然您可以选择多种 简单的设计解决方案,但是这些方案对于维护系统整体可靠性的帮助非常小,所以,您应当采用复 杂的工具如PHP过载探测器、日志分析器、HA Proxy以及Keepalived。
性 能
现代网站必须能够快速访问,因为即使增加一秒种的下载时间,也会丢失用户。即使网站访问 速度仅有几秒种的差距,也可能成为业务成败的天壤之别。所以,必须精妙地设计系统,以便在各 个层级上取得最佳的性能,从硬件和网络一直到服务、系统、应用程序、页面结构和CDN。
您需要考虑:
精妙的设计 - 系统速度快取决于性能工程,或者采用最佳的设计、工具和流程来构建最佳性能 的系统。良好的代码、代码审查、瓶颈分析、现代化的技术、使用有限的功能特点以及常规应用程 序性能工程等,在构建快速系统方面都发挥着重大作用。 应用设计 - 必须在各方面都取得平衡,尤其是在满足现代特点和平台的灵活性以及系统稳定 运行之间必须取得平衡。如今许多工具和框架都非常灵活,可以灵活地进行更改或再利用,但是当 系统扩展后,性能不会很好。采用更多的硬件可以改善这种状况,但是改善的程度也是有限的,所 以,寻找合适的方法,以便终端用户能够快速地访问系统就变得至关重要。 性能监控 - 性能监控是保持良好系统性能的一项关键措施。不仅要在内部系统的服务器和运 维层级上实施监控,而且也要从网络和用户的角度,对系统外部进行监控。运维监控包括:常规的 CPU、RAM、以及磁盘输入/输出监控,还包括对许多与网络服务器、应用 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 有公共云灵活,但是却比公共云要便宜很多。对于大型应用程序而言,由于大型 RAM和CPU的特点限制,若使用公共云的话,会需要花费极其高的成本,所以,使用私有云就变得 十分重要。私有云有足够的容量大小,可以支持多种架构和解决方案,也包括对使用同种硬件的开 发、测试和生产系统提供支持。 如今,互联网系统庞大复杂、功能强大,正如我们所知道的,已经武装了整个世界。要构建好 并管理好这些系统,就必须采用最佳的组合策略,综合使用各种工程、工具、流程和观点,这样才 能够构建出现代化的系统,并且在上述全部五个要素中取得平衡。要想在21世纪取得运维成功和系 统成功的话,关键是要能够理解并合理地关注这五大要素。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《运行维护5要素》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。