曙光一号并行计算机研制过程回顾

 

李国杰、樊建平、陈鸿安

 

2001/8/11

 

   

    曙光一号并行计算机(以下简称曙光一号)是 1993 年我国自行研制的第一台用微处理器芯片(88100 微处理器)构成的全对称紧耦合共享存储多处理机系统(SMP),定点速度每秒 6.4亿,主存容量最大 768 MB。在对称式体系结构、操作系统核心代码并行化和支持细粒度并行的多线程技术等方面实现了一系列的技术突破。同时作为具有市场竞争力的产品,折价 2000 万人民币知识产权,吸引资金成立曙光信息产业有限公司。曙光一号同时还得到不少的荣誉:包括科学院科技进步特等奖、国家科技进步二等奖等。1994 年被认为是国内科学技术的主要成就之一,写入当年全国人大八届二中全会李鹏总理的政府工作报告。

 

     曙光一号的研制过程包括准备(1990.5—1992.2)、攻坚(1992.3—1993.10)及应用(1993.11—1995.6)三个阶段。第一阶段开始于澳门十大赌场网上注册国家智能计算机研究开发中心(以下简称智能中心)软硬件组成立,第二阶段开始于陈鸿安、樊建平、刘金水等人集中于美国硅谷“封闭式”攻关,第三阶段从开发早期的 Internet 服务器、及后来成立曙光公司为标志。曙光一号的研制过程中凝聚了很多人的辛勤劳动,包括早期参加决策的领导、专家,攻关过程中的众多科研人员以及应用过程中的相关人员。以下我们将从曙光一号技术准备与决策、攻坚、应用等几个阶段回顾这段历史,以及涉足各个阶段的相关人员。由于以下描述的过程均发生在 6 年前(有的超过 10年),如有疏漏望谅解。

 

一、   决策与技术准备阶段

 

 

智能中心成立之初,集中两年左右的时间,不断论证技术发展思路,为曙光一号并行计算机的研制任务的决策与任务的下达进行准备,同时进行技术与人才的储备工作。

 

曙光一号采用多处理器共享存储并行体系结构,今天看来是较自然的选择,当时却很困难,主要影响决策的几个因素包括:日本第五代智能计算机计划(Prolog, Lisp 专用机策略);国内外传统大型机发展思路的惯性(采用集成电路设计运算控制器主板而非采用商品化的微处理器);并行计算机初期发展的不确定性等。参与决策者包括当时国家科委高新司冀复生总工、863计划智能计算机专家组汪成为等人。最终选择多处理机服务器方案,以下四点是主要的原因:a. 与传统的小型机(VAX 机)、大型机(IBM mainframe)比较,多处理机服务器在性能价格比方面有明显优势;b. 并行机技术国外也不十分成熟,没有形成一家垄断的局面,我们有可能迎头赶上; c. 多处理机关键技术是软件,技术难点的转移对我们有利;d. 一旦掌握多处理机技术,易形成高性能计算机系列产品。当时美国加洲大学 Belkely 分校的 David patterson 教授和 Princeton 大学的李凯教授也给了很多的建议与帮助。

 

   人才与技术储备方面,智能中心19903月成立,19913月基本形成了以刚毕业的硕博士为主的技术队伍。中心主任李国杰,下设系统软件组、硬件组、应用组、理论组。软件组组长樊建平,组员包括王永杰、刘文卓、刘宏、战超、孙培兴、刘晓华、孙凝晖等。硬件组组长陈鸿安,组员包括李如昆、杜晓黎、曾嵘、董向军、张艳、梁雪、熊劲等。应用组包括韦明、隋雪青、吴建明、封勇、杨坚、赖晓婧等。理论组组长白硕,组员包括曹存根、阎保平、杨莉等。当时计算机研制方面有经验者包括陈鸿安、李如昆及在攻坚阶段加入的刘金水等,其他人是第一次从事计算机研制方面的工作。

 

软件组前两年主要的工作包括对 AT&T UNIX V3V4BSD 3.2CMU MACH1.0 等操作系统核心代码, BIOS 及相关工具(Cross Compiler, sccs 等)分析、掌握。硬件组开展的工作包括各种微处理器芯片及接口芯片的理解、多机系统的构成、硬件设计工具的使用等。研究成果以论文、专著的形式进行发表,为曙光一号及后来的曙光1000 的发展打下坚实的基础。这一期间东南大学的黄大海同志在操作系统的理解方面给了很大的帮助。

 

二、   攻坚阶段

 

199111左右曙光一号采用 Motorola M88100 微处理器,共享存储多机系统(单板共享 4 CPU),通用开放系统结构(UNIX 操作系统)的总体方案确定。88K 处理器的开发机以及 AT&T UNIX 操作系统的源代码均已订购。此时夏培肃院士的硕士学生刘金水作为硬件设计的主要人员从航天工业总公司 706 所全职参加到曙光一号的设计中来。19923月,考虑到国内购买硬件器件速度慢,操作系统、部件与工具厂商技术支持弱,高密度生产技术缺乏等因素,智能中心组织了陈鸿安、樊建平、刘金水、李如昆、王永杰等人到美国硅谷进行曙光一号的封闭式开发。出发前开了誓师大会,提出了“人生能有几回博”激动人心的口号,开始了 11 月左右大家后来戏称为“美国洋插队”的生活。

 

课题组在美国工作与生活的地方已由先期到达美国的澳门十大赌场网上注册研究人员贾沛长负责安排。生活处为一美式独居小院,4个卧室,厨房与客厅很大。办公处距生活处汽车要开 20 分钟左右。为方便加班,大家决定将办公地点设在客厅中。这样除与外界接触(如:部件厂商的技术交流、生产谈判等)仍然安排在原办公处外,其他的生活与工作活动就都在生活处进行了。

 

美国期间的工作分总体方案完善、设计、生产加工及部分调试几个阶段。总体方案的完善持续一个多月,主要是多处理机中断控制器的设计与实现方面。这一期间与国内交流最密切,传真频繁(当时澳门十大赌场网上注册很难接收 email)。国内软件与硬件组的部分人员继续配合曙光一号硬件及并行程序设计环境外,同时抽调部分人员组成曙光1000 组,开始曙光1000 早期预研工作。

 

曙光一号的硬件设计在 19929左右结束,10 月完成主板设计并进入PCB板的设计和生产,11 月左右中断控制器的 FPGA 完成。1992.12-1993.1 进行 BIOS Monitor 的初步调试。软件设计与调试与硬件并行展开,BIOSMonitor 及操作系统的改造与移植在开发机模拟环境下按计划进度进行,没有发生大的失误,基本匹配了硬件的开发速度。生活方面大家分组以一个星期为单位进行轮班做饭。晚饭后的散步或骑自行车(从邻居家中购买)成为早期的主要娱乐与体育锻炼的方法。后来购买了一辆二手汽车,学习开车(为省钱自学为主)及进行驾驶执照的考试成为另一种娱乐活动。

 

 

93年2月,我们带着已进行初步调试的几块曙光一号主板回到国内。与国内的同事开始联调及软件的移植工作。硬件、MonitorBIOS 及操作系统核心的调试工作在回来两个月后基本完成。由张兆庆、乔如良领导的并行编译组、刘晓华进行的Express 编程环境、孙凝晖等进行的计算性能测试与优化、隋雪青等进行的数据库移植与事务处理的测试等工作在后来的2-3个月内逐一完成。同时将863的研究成果在曙光一号上进行集成,包括石油大学开发的“Powel—油气田布井决策系统“,浙江大学开发的智能软件开发环境KMEPS,华中理工大学开发的地图数据库管理系统MDB,西安交大开发的LISP/CLOS 系统,科学院系统所开发的几何定理证明软件系统,以及清华大学移植的Ingres 数据库等。93年10月由科技部组织国内的专家学者进行了成果的技术鉴定工作。成果受到好评,当时的科学院副院长胡启恒称曙光一号咬住国际高性能计算机发展的“尾巴”。

 

 

曙光一号部分研制人员(樊建平、陈鸿安等)在曙光一号鉴定完后转入曙光1000组,与原硬件组、软件组的人员一起从完善曙光1000原型系统的总体实施方案入手,投入到曙光1000的研发过程中;部分人员回到原单位(刘金水),部分人员出国(李如昆、王永杰等)。曙光一号的推广应用工作交由当时智能中心成立的成果推广部实施(组长张玉志,组员包括杨槟等),开始基于曙光一号知识产权成立曙光信息产业有限公司的早期融资活动。94年8月,曙光1000的8节点原型系统已可运行,曙光一号的融资活动已进行高峰期。智能中心的领导决定成立基于原曙光一号组人员的曙光计算机部,樊、陈又从曙光1000组抽回,开始人员的招聘,后续产品的开发(基于PowerPC芯片的曙光天演)以及曙光一号生产与销售的支持工作等。该部门最后成为95 年曙光公司成立时的三个事业部之一:曙光计算机事业部。当时陆续开展的研发工作包括基于曙光一号的Internet 服务器和郑州电子工程学院和邮电大学的协作项目基于曙光机的智能网 SCP 平台,1-2 CPU PowerPC SMP 升级服务器,双机HA高可用系统等。

 

 

三、   应用情况

 

 

曙光一号在设计阶段的一个理想就是能成为产品而非仅仅是科研成果。曙光一号鉴定会已是她的市场推广会。曙光公司成立前,曙光一号已在教育行业(中国科技大学、武汉大学)、信息服务(94年开通国内第一个BBS网站----曙光BBS 站,三期日贷项目北京信息中心)、军队(总后油库管理)、政府(国家科委办公自动化)、援外项目(埃及穆巴拉克科学园)等项目上进行了成功的销售。曙光一号累计生产与销售20多套。曙光公司成立后,基于曙光一号的技术,智能中心与曙光公司逐步发展出两个系列的产品曙光天演UNIX 服务器系列及曙光天阔 PC 服务器系列,97年已达20多个品种。目前曙光服务器的累计销售1万多套以上,曙光已成为中国高性能服务器的著名品牌。

 

 

 

 

 

XML 地图 | Sitemap 地图