小型机服务器是干什么用的?
为什么选择小型机作为服务器?那你一定知道小型机。
小型机是指一种高性能计算机,其工作原理类似于PC和服务器,但性能和用途与它们完全不同。它是由DEC(数字设备公司)在20世纪70年代首次开发的高性能计算产品。
小型机有着区别PC和其服务器的独特架构,以及各厂商的专有技术,有的还使用小型机专用处理器。例如,美国Sun公司和日本富士通公司的小型机是基于SPARC处理器体系结构的,而美国惠普公司的小型机是基于PA-RISC体系结构的。康柏是一种Alpha架构。此外,I/O总线也不同,富士通是PCI,Sun是等等。这意味着各个公司的小型机上的插卡,如网卡、显卡、SCSI卡也可能是专用的。此外,小型机一般使用基于Unix的操作系统,如Sun和富士通使用Sun Solaris,惠普使用HP-UNIX,IBM使用AIX。因此,小型机是封闭的专用计算机系统。使用小型机的用户普遍看重Unix操作系统的安全性和可靠性,以及专用服务器的高速计算能力。
目前小型机的主要厂商有IBM和惠普,浪潮和曙光。典型的IBM机器有RS/6000、AS/400等。它们的主要特点是每年停机时间只有几个小时,所以统称为Z系列(zero zero)。AS/400主要用于银行和制造业,还有多米诺。主要技术在于TIMI(技术独立的机器接口)和单级存储。借助TIMI技术,硬件和软件可以相互独立。RS/6000比较常见,用于科学计算和事务处理。
小型机只是低成本、小规模的大型计算机。典型的小型机运行UNIX或特殊的操作系统,如MPE和VEM。它们比大型机便宜,但处理能力几乎一样。惠普的9000系列小型机几乎可以和IBM的传统大型计算机竞争。
高端小型机常用的技术包括:基于RISC的多处理器架构、兆字节缓存、千兆字节RAM、使用I/O处理器的专用I/O通道上的数百GB磁盘存储、专用管理处理器。它们很小并且是气冷式的,所以在客户处对冷却管没有特殊要求。现在小型机和中型机和大型机没有绝对明确的界限,因为IBM在小型机上实现了很多原本只在大型机和中型机上使用的技术。
小型机与普通服务器(即PC-SERVER)有很大不同。最重要的一点是小型机的高RAS(可靠性、可用性、可服务性)特性。
RAS是三个英文单词的缩写:可靠性、可用性和服务。它们反映了计算机的三个著名特征:高可靠性、高可用性和高服务。它们的具体含义如下:
高可靠性:电脑可以连续运行,永不停机。
可用性:重要资源有备份;能够发现潜在的问题,并将运行在其上的任务转移到其他资源上,从而减少停机时间,保持生产的连续运行;具有实时在线维护和延时维护功能。
可维护性高:可实时在线诊断,准确定位根源问题,准确快速修复。
关于IBM小型机的RAS特性,不得不提IBM eLiza(蜥蜴)项目。
伊莱扎起源于20世纪60年代中期IBM的一个计划,即利用人工智能技术设计一个程序,实现人与计算机之间的交流。上世纪90年代,IBM设计的深蓝超级计算机打败了国际象棋大师卡斯帕罗夫,其综合处理能力可与蜥蜴相媲美,即具有预测预防、处理判断和自愈能力。
在当今的IT世界,许多企业都在无情地面临着一个巨大的挑战:为了形成一个强大而灵活的电子商务运营环境,需要大量的服务器、网络设备和复杂的应用软件。这些设备所涉及的IT技术日新月异,企业严重缺乏有经验的工程师来维护和管理整个软硬件系统。
IBM整合自身多年的IT经验,提出了伊莱扎计划(eLiza plan),该计划被赋予了前瞻性的重要内容:即现代企业要想在竞争中立于不败之地,其电子商务环境中使用的软硬件系统应具备以下四个原则:
自配置能力:系统可以动态自配置相关资源。
自我保护能力:系统具有保护自身免受非法访问和攻击的能力。
自愈能力:系统能自动预测错误,避免错误,修复错误,更换相关错误元件。
自优化能力:系统能够自动监控和管理相关资源,将系统性能调整到最佳状态。
为了实现上述目标,该系统还需要具备以下七个要素:
负载管理(工作负载管理)
安全机制(安全性)
聚类技术(聚类)
虚拟服务器托管
端到端自动化。
灾难恢复机制(灾难恢复)
端到端系统管理。
下面介绍IBM p690服务器的RAS特性。
自动首次错误数据捕获和诊断错误隔离功能
自我修复的内部POWER4处理器组冗余
业界第一个PCI总线奇偶校验错误恢复
避免检查中止的不可收集的错误处理。
动态错误恢复
主内存、所有1级、2级和3级高速缓存以及内部处理器组上的错误检查和纠正(ECC)或等效保护。
连续冗余的位操作使主存具有自愈功能。
主存储器上的Chipkill校正功能。
N+1冗余电源,双电源线,电源和风扇在线维护。
针对处理器、高速缓存、内存、I/O和DASD的预测性错误分析
基于运行时错误,决定是否分离处理器运行和启动(动态处理器离线和永久处理器离线)。
缓存与主存的离线技术
通过选择高质量的组件来减少故障。
基于电源、风扇和I/O子系统首次故障数据捕获技术的并行和交叉运行检测技术