操作系统的设计和实现过程
本节讨论操作系统设计和实现面临的问题。虽然这些问题没有完整的解决方案,但是有些方法还是行之有效的。
设计目标
系统设计的首要问题是,定义目标和规范。从高层来说,系统设计取决于所选硬件和系统类型:批处理、分时、单用户、多用户、分布式、实时或通用。
除了最高设计层外,需求可能很难说清。不过,需求可分为两个基本大类:用户目标(user goal)和系统目标(system goal)。
用户要求系统具有一定的优良性能:系统该便于使用、易于学习和使用、可靠、安全和快速。当然,这些规范对于系统设计并不特别有用,因为如何实现这些没有定论。
研发人员为设计、创建、维护和运行操作系统,也可定义一组相似要求:操作系统应易于设计、实现和维护,也应灵活、可靠、正确且高效。同样,这些要求在系统设计时并不明确,并可能有不同的理解。
总之,关于定义操作系统的需求,没有唯一的解决方案。现实中,存在许多类型的系统,这也说明了不同需求会产生不同解决方案,以便用于不同环境。例如,VxWorks(一种用于嵌入式系统的实时操作系统)的需求与 MVS(用于 IBM 大型机的多用户、多访问操作系统)的需求相比,有很大不同。
操作系统的分析与设计是个很有创意的工作。虽然没有教科书能够告诉我们如何做,但是软件工程(software engineering)的主要原则还是有用的。现在就来讨论这些。
机制与策略
一个重要原则是策略(policy)与机制(mechanism)的分离。机制决定如何做,而策略决定做什么。例如,定时器是一种保护 CPU 的机制,但是为某个特定用户应将定时器设置成多长时间,就是一个策略问题。
对于灵活性,策略与机制的分离至关重要。策略可随时间或地点而改变。在最坏情况下,每次策略的改变都可能需要改变底层机制。对策略改变不敏感的通用机制将是更可取的。这样策略的改变只需重新定义一些系统参数。
例如,现有一种机制,可赋予某些类型的程序相对更高的优先级。如果这种机制能与策略分离开,那么它可用于支持 I/O 密集型程序应比 CPU 密集型程序具有更高优先级的策略,或者支持相反策略。
微内核操作系统(后续章节会详细介绍)通过实现一组基本且简单的模块,将机制与策略的分离用到了极致。这些模块几乎与策略无关,通过用户创建的内核模块或用户程序本身,可以增加更高级的机制与策略。
例如,看一下 UNIX 的发展。起初,它采用分时调度。而对最新版的 Solaris,调度由可加载表来控制。根据当前的加载表,系统可以是分时的、批处理的、实时的、公平分享的或其他任意组合。通用调度机制可以通过单个 load-new-table 命令对策略进行重大改变。
另一极端系统是 Windows,它的机制与策略都已编码,以确保统一的系统风格。所有应用程序都有类似界面,因为界面本身已在内核和系统库中构造了。Mac OS X 操作系统也有类似功能。
对于所有的资源分配,策略决定非常重要。只要决定是否分配资源,就应做出策略决定。只要问题是“如何做”而不是“做什么”,就要由机制来决定。
实现
在操作系统被设计之后,就应加以实现。操作系统由许多程序组成,且由许多人员在较长时间内共同编写,因此关于实现很难形成通用原则。
早期,操作系统是用汇编语言编写的。现在,虽然有的操作系统仍然用汇编语言编写,但是大多数都是用高级语言(如 C)或更高级的语言(如 C++)来编写的。实际上,操作系统可用多种语言来编写。内核的最低层可以采用汇编语言。高层函数可用 C;系统程序可用 C 或 C++,也可用解释型脚本语言如 PERL 或 Python,还可用外壳脚本。事实上,有的 Linux 发布可能包括所有这些语言编写的程序。
首个不用汇编语言编写的系统可能是用于 Burroughs 计算机的主控程序(Master Control Program,MCP)。MCP 采用 ALGOL 语言的变种来编写。MIT 开发的 MULTICS 主要是采用系统程序语言 PL/1 来编写的。Linux 和 Windows 操作系统内核主要用 C 编写,尽管有小部分是用汇编语言来编写的用于设备驱动程序与保存和恢复寄存器状态的代码。
采用高级语言或至少系统实现语言来实现操作系统的优势与用高级语言来编写应用程序相同:代码编写更快,更为紧凑,更容易理解和调试。另外,编译技术的改进使得只要通过重新编译,就可改善整个操作系统的生成代码。最后,如果用高级语言来编写,操作系统更容易移植(port)到其他硬件。
例如,MS-DOS 是用 Intel 8088 汇编语言编写的。因此,它只能直接用于 Intel X86 类型的 CPU。(注意,虽说 MS-DOS 只能本地运行于 Intel X86 类型的 CPU,但是 X86 指令集模拟器可允许它运行在其他 CPU 上——会更慢,会使用更多资源。正如前面所提到的,模拟器(emulator)程序可以在一个系统上复制另一个系统的功能。)而 Linux 操作系统主要是用 C 来编写的,可用于多种不同 CPU,如 Intel X86、Oracle SPARC 和 IBM PowerPC 等。
采用高级语言实现操作系统的缺点仅仅在于速度的降低和存储的增加。不过,这对当今的系统已不再是主要问题。虽然汇编语言高手能编写更快、更小的子程序,但是现代编译器能对大程序进行复杂分析并采用高级优化技术生成优秀代码。现代处理器都有很深的流水线和很多功能块,它们要比人类更容易处理复杂的依赖关系。
与其他系统一样,操作系统的重大性能改善很可能是来源于更好的数据结构和算法,而不是优秀的汇编语言代码。另外,虽然操作系统很大,但是只有小部分代码对高性能是关键的;中断处理器、I/O管理器、内存管理器及CPU调度器等,可能是关键部分。在系统编写完并能正确工作后,可找出瓶颈程序,并用相应汇编语言程序来替换。