对Linux的商业用户来说,Linux内核的开发可能非常复杂神秘,因为由几十个人维护着不同的部分,有几百名志愿者提交代码,你很难判断新功能的走向。
从本质上来说Linux的开发也没有线路图。要一窥全豹,以下是7个值得关注的开发热点,基于对开发人员和内核维护人员的采访。不是所有的新功能都进展顺利,下文展现了各新功能进入内核的崎岖之道。
1、虚拟化
认识到虚拟化在这十年里日益成为“大趋势”,Linux内核维护者把它作为优先考虑的功能,加快了虚拟化技术添加到内核的进程。由初创公司Qumranet的Avi Kivity提供的KVM虚拟管理程序,就包含在2006年末发布的内核中并在上个月的发布中继续升级。这个例子很好地展现了快速内核发布和缓慢企业版进展之间矛盾。
Novell公司的副总裁霍尔格•杜尔夫(Holger Dryoff)表示“我们认为KVM还不适合企业使用。”他补充说,在KVM能被加到SUSE Linux之前,它需要在内核子系统包括调度器的交互上经过更多的测试。
最近被Citrix Systems耗费5千万美元收购的商业开源虚拟化公司XenSource,一直在游说想把自己架构的Xen虚拟机管理程序(Hypervisor)加入到内核里。内核维护人员认为添加这种虚拟化功能会大大增加维护工作量。最终XenSource的工程师放弃了,但仍继续调整Xen以配合内核的运行。它暂时还进不了内核,只能先增加了一些支持,使Linux在运行虚拟环境时可以识别它。
其他的虚拟化功能发展迅速,包括KVM和Lguest。Lguest是由IBM工程师Rusty Russell开发的一个只有5000行代码的精简hypervisor(虚拟机管理程序),它已经包括在最近版本的内核里了。和KVM相似,它支持Intel和AMD芯片的最新虚拟化技术。但又与VMware公司的ESX Server不同,在Lguest创建的虚拟机里的操作系统知道自己是被虚拟出来的。所以在调用CPU周期时它可以直接向真正的硬件发出请求,而不是作为中间媒介而降低了效率,因此这种架构大大提高了效率。
2、实时操作
Linux在实时操作上获得了长足的提升,因为现在它常常被用作手机和其它设备上的嵌入式系统。但最近发布的2.6.23内核显示它在实时操作上“稍有退步”,商业嵌入式Linux厂商MontaVista 的首席技术长官(CTO)和创始人吉姆•瑞尔迪(Jim Ready)抱怨说。这个新的进程调度器更强调“公平”——这意味着要由最终用户告诉处理器哪些待处理的任务可以获得更高的优先级。
“实时用户不需要公平,”瑞尔迪认为,因为实时要求无论CPU在做什么,都可以插入一个新的优先级以中断操作。一个简单的例子是,在医疗设备里监控病人呼吸的软件在发现病人呼吸停顿时,能发送一个即时警告,软件无论在处理什么任务都要先中断停下来。瑞尔迪表示,除非实时性能有改善,否则MontaVista不会把新的内核整合到自己的产品中来。Gartner分析师乔治•维斯(George Weiss)预测标准版的Linux要到2008年才能成为有竞争力的实时系统。
3、中断处理
维斯那样说其中一个原因是因为内核开发人员正致力于使进程调度器具有实时功能。操作系统的关键环节是中断的管理——它决定了哪些任务能获得CPU的处理权,如何排列不同行为之间的优先级。如果所有的中断处理器都可以被结合到自己的线程中去,那个线程就可以被调度并设置优先级,而不是无法预知地运行和延迟的实时响应。
过去三年来这样的努力一直没有停歇过。MontaVista的斯文•托斯滕•迪特里奇(Sven-Thorsten Dietrich)在2004年就提交了代码,希望防止中断处理程序为了常规任务而中断内核,因为它们干扰了实时响应。但这些代码的破坏性太大,以致无法获得内核调度领域的专家Ingo Molnar的认可。这些代码影响了一个关键内核功能自旋锁(spinlock),当进程在等待需要的数据或事件时,它可以锁定CPU。许多进程依赖于自旋锁。Dietrich的代码把几百个自旋锁减少到30个;Molnar的修订保留了90个自旋锁,比前者破坏性要来得少些。
把中断处理器集合到一个统一的独立线程的想法看来已开始成熟并准备进入内核了。“Ingo替换了我们的做法,但他做得很棒,” 瑞尔迪说道。MontaVista并不在乎自己的努力是否能获得更多的荣誉,瑞尔迪理解这就是开源合作的方式,因此他接受正在进入内核的实时功能的修改。
4、安 全
人人都希望有个更安全的系统。Novell在发布SUSE Linux Enterprise Server 10的同时一起发布了AppArmor,它是一个限定应用程序可以访问操作系统哪些资源的软件,这样可以限制应用因非法授权访问而造成的危害。然而在近期内它还不太可能会被加进内核。
Linux安全的权威专家、另一套安全机制SELinux 的开发人员斯蒂芬•斯玛莱(Stephen Smalley)则认为AppArmor不能被加进内核是因为它的保护机制是基于“路径名称”的方式,它本质上就是一个白名单设置,AppArmor只允许应用程序访问在名单上的文件,所有其他的文件都不能访问了。根据去年乔纳森•科贝特(Jonathan Corbet)的一份报告,斯玛莱认为一个狡猾的入侵者可以利用合法路径名称而猜出其他的名字,制造不必要的暴露。
内核维护人员安德鲁•莫顿同意是因为这种路径名机造成AppArmor不能进入内核的根本原因。“我不是个安全程序员,”他说。“我不知道可以怎样解决这个问题。”
5、系统诊断
Solaris可以使用DTrace工具检测操作系统核心的运行状况,但Linux缺乏用户界面友好的检测工具。目前仅有的几个工具之一是ptrace,该程序可以让一个进程跟踪另一个进程的行为。但ptrace使用起来非常笨拙并容易发生错误,现在有了替代品utrace,它已经进入Morton的内存管理代码树,即将会被提交给李纳斯•托沃兹。当Utrace被一个程序执行时它可以跟踪该进程的行为,却没有ptrace的那些问题,但它仍然会导致内核里的锁问题。科贝特预测在下一版本的内核里仍然不可能包含该工具。
6、文件系统
Reiser4文件系统已被考虑额外增加到内核里去,内核现在已经包含30多种文件系统。Reiser4是一个大型的文件管理系统,根据汉斯•瑞塞尔(Hans Reiser)的文档,它的优势在于只需要最少的磁盘空间,就能处理数量众多的小文件。
该文件系统要求对文件的操作要不就完成,要不就放弃,以避免文件操作完成到一半导致文件被破坏。这对许多Linux应用看起来很完美,但经过多年的争辩,Reiser4还是没能加入内核。它与内核的某些部分配合不好,而且最重要的开发人员瑞塞尔本人已经退出了项目。“要使它成为Linux主流的一部分,它需要一个新的带头人,”科贝特在本月早些时候预测它的前景时说。
ZFS是Sun Microsystems的128位文件系统,它可以乘数方式扩展 Linux的地址空间,远超现在系统的最大使用需求。它的支持者认为它应该被加进内核。但它目前的授权与Linux GPL不兼容。
7、电源管理
Linux 在电源管理上相对落后,而Windows笔记本上的电源管理则令人刮目相看,这刺激了Intel工程师内核开发人员Molnar和托马斯•格雷赛纳尔(Thomas Gleixner)以及其它人推动电源管理的改进。一年前,内核加入“tick-less idle”机制,当没有工作需要完成的时候通知处理器处于空闲状态。如果没有它CPU的时钟就会每秒向内核发出1000次询问,查看是否有工作要完成,白白浪费了电力。
Intel的首席Linux技术员德克•亨德尔预计在电源管理上会有进一步的改进。但内核和系统时钟里的任何改动都会影响许多其他的交互。他认为,“这些事情可能会困难重重,需要花费很长的时间,但是我肯定这个发展方向是正确的。”