追随智慧-第48部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
,他是麻省理工学院博士。
张益肇这个人,有着与李开复大致同样的经历。出生在台湾,自幼赴美读书,又加入了美国籍。从外表看上去,他必定是属于那种无论吃多少东西都不会胖的人,消瘦,但却大脑发达。衣着随便,待人随和,如果不是他在使用中文表达思想时那种吃力的样子,你不会认为他有那么多年的美国经历。
420初到美国,张只是小学毕业。那时候他对照着台湾的中文课本学英文,但等到英文纯熟之后,他却把中文忘了很多。他在麻省理工学院读完硕士课程,到日本东芝研究所工作一年,又回到麻省理工学院读博士。那是1991年,从这时起,他就开始在语音识别领域驰骋。他研究怎样把很多人的声音转换成一个人的声音,也研究怎样把一个人的声音转换成很多人的声音。然后,就像很多美国青年一样,他也投身硅谷一个很小的软件公司。
在一种好奇心的驱使下,他研制出一个听写系统--让机器像一个人一样地和人对话。就是在这期间,他听说了李开复其人其事。
“多元化”是张迄今为止最重要的人生经验。他说:“美国是个多元化的社会,你的兴趣和信仰和大家完全不一致,也没有关系。”但是他在日本工作的时候,却发现日本人对美国的“多元化”持有强烈的批评态度,还将美国经济80年代的低潮,归咎于“这个国家的多元化”。
张那时候有些相信日本人的话,但后来,看到美国经济卷土重来,日本却是每况愈下,就断定:“多元化还是一个好东西。”还把他幼年时在台湾听到的一句话挂在嘴边421上:“一样米养百种人。”现在,他来到中国内地。这是他第一次来内地,看到熙熙攘攘,乱乱哄哄的城市,他觉得“蛮亲切的,和台湾差不多”。他对内地年轻人的“真是会想事情”很惊讶,又发现“中国学生做事情比美国人认真”。不过他也发现,希格玛大厦里,是要“百种人做一样事”的。
现在,李开复的语音小组拥有李明镜和张益肇两位研究员了,还有好几位副研究员。当初抛硬币分开了两个初出茅庐的小伙子,现在可以建立两个小组:“语言模型”和“声学模型”。他让李明镜和张益肇分头领衔,加速前进。
员工们开始贯彻他的一些激进的想法。在7月份的时候,语音识别的模型还只能识别“300个词汇组成的100句话”,比如“北京的天气很好”。超过了这个范围,机器便一筹莫展。但李开复说,要在“3个月内使系统的识别范围扩大到50000个词汇”。英文原型当中是没有“第四声”的,但汉语有。所以他要求“声学模型”小组必须想出办法来,还必须使模型能识别男女老少各种声音以及南腔北调的各种422方言。在设定了研究员的目标之后,他又指示凌小宁手下的那些工程师,在两个月内做出一个可以让比尔.盖茨看得清清楚楚的“演示模型”。
“声学模型”的要点在于识别语音。“语言模型”的要点是识别语意。用李明镜的话来说,“声学模型”是识别“一”,“语言模型”是识别哪一个“一”。
比如说到“中华人民共和国主席江泽民”的时候,人人皆知是这个“江”字,但机器不行。“江”有30个同音字,凭什么让它给你出来个“江”而不是个“姜”
呢,这就要把“江”和“泽民”之间连接的概率定得最高,而“姜”和“泽民”之间连接的概率定得最低。这就是“模型”。人根据“模型”来训练机器,机器根据训练的结果来识别国家主席。这样看来,李开复的这些要求,几乎包括了“声学模型”和“语言模型”两个方面全部最难解的问题。他的雇员们全都知道,在如此短的时间里,只是解决其中一个问题就已经够呛,现在他们却要拿出一大堆好的结果。
但是无论“声学模型”还是“语言模型”,“引擎”
都是其中最基本的部件。它的作用是把声音读出,并且423以文字方式显示出来。你可以把“引擎”想像成汽车的发动机,也可以把它想像成一套推理的逻辑和方法。不同的语言之间存在共同的东西,所以才有可能翻译,语言引擎在本质上并无不同,希格玛大厦才能将黄学东小组现成的英文“引擎”拿过来使用。但要让它识别中文,就必须给它不同的数据模型,这也正是李开复小组、王坚小组和黄昌宁小组要解决的问题。语音识别比之文字识别更加困难的地方,是同样的字在不同人嘴里会发出不同的声音。李开复的目标既然是“不特定语者”,那就要让机器识别所有的声音。其具体的操作程序,既简单又繁杂:在广东、上海和北京3个城市中,选择男女老少各500人。每人均以地方方言和普通话两种方式说话250句,将声音一一录音整理。简单说,就是收买各种各样的中国话,来训练和调试既成的“声学模型”。至于“语言模型”小组的注意力,则全部集中在纠正拼音错误的方面。李明镜又在完成眼前任务的同时,试图解决更加长远的问题。他给自己提出的问题是,“能否让机器在不断使用的过程中适应说话的人。使用得时间越长,也就越好用。”这个概念在以往的拼音输入法当中叫做“自适应”,现在李明镜要将它用在语音识别中。
424到了夏天结束的时候,研究院的“语音识别系统”
居然真的装进了50000个词,就像李开复当初期望的一样。但是,现在还不是得意洋洋地说“那是我‘儿子’”
的时候。他们还必须把研究院的成果变成可以看得见的东西,并且和微软公司那个包括英、日、中文的语音识别大系统连接在一起。这就要依靠软件开发部的智慧和操作来完成。
如果说研究员的作用相当于设计师,那么,技术开发工程师的作用就是提供设计工具以及把设计图纸变成现实。如果一个研究员的“图纸”相当于整部机器上的一个零件,那么开发工程师的作用就是把所有零件衔接在一起。具体到凌小宁领导的软件开发部,主要职责有三:开发研究工具以提高研究员的工作效率;把研究员的新思想变成技术原型;在技术原型的基础上完成技术转移。所以,希格玛大厦里的“开发”,在某种意义上又被叫做“整合”或者“集成”。就这些职责的本身来说,乃是继承了微软公司的既成制度,但凌小宁的软件开发部却在其中创造了一套新的方法:对于技术采取“模块化处理”,最终形成一种井井有条的结构,这同以往技术425开发的混沌一片的结构形态成为对照,所以当比尔.盖茨听说此事之后,不禁大感兴趣。
1999年秋天参与语音识别小组的软件开发工程师名叫孙燕峰,按照他的同学的说法,此人是清华大学有史以来最好的硕士,也是最有钱的学生。这话听来有些夸张,但研究院开发小组的工程师们都说,孙是具有最优秀的整合思想和整合能力的人。所以,凌小宁在这个关键时刻,让他来负责整合语音识别系统。
无论从哪方面看,孙燕峰都是一个天生的工程师。
他11岁开始学电脑的时候,就完全不像别的孩子那样只知道玩游戏。他对编程的耐心超过了成人,白天写的程序没有完成,晚上躺在床上就会睡不着觉。父亲不懂计算机,但却鼓励儿子的兴趣。那时候父母每月的工资加在一起才100多元,可是买一张软盘就要十几元。燕峰不敢买一盒(10张盘),那样父母一个月的工资就没有了,只敢买一张。父亲也不知道这么贵的东西有何用处,却毫不含糊地把钱给他。孙从小到大,父母为他操心无数,但他独对这些情节念念不忘。他说:“有些父母要求自己的孩子做这个做那个,不许做这个不许做那个。他们从426来没有这样对我。”父亲从小喜欢画画,但自从当兵之后,就没干什么正经事情。“支左”啊,“游行”啊,就算有了画画的机会,也是画标语,画毛主席像。父亲也许是因为一辈子都没能痛快地干自己喜欢的事,所以对儿子格外宽容。计算机这东西他虽然不懂,但孩子喜欢得睡不着觉,就该满足儿子。他过去也曾睡不着觉,不也是因为不能做自己想做的事情吗?燕峰从12岁开始获得北京计算机编程比赛的奖项,从此,获奖就成了这个孩子每年必有的科目。凭着一大堆奖状,他免试进了清华大学,又免试读了硕士。人说,中国的孩子必经三大关:高考,考博士,考“托福”。他说他一关都没过,“也混到了今天”。说是“混”,其实一点也不轻松,他在1999年7月来到研究院之后,连续几个星期都在苦思冥想,童年时代那种睡不着觉的感觉,重新出现。
秋天开始的时候,语音识别系统的演示模型进入最后的整合阶段。孙燕峰和邸硕来到雷德蒙微软总部。邸硕负责解决“模型”本身的问题,孙燕峰的责任是把“模型”融入到一个更大的系统里面去。他一边在心里计算,至少有3个星期的时间来解决问题,一边从容地写下他427的第一组代码。
但就在这时候,他接到凌小宁的电子邮件。凌告诉他,国内的国庆节假期比往年延长了好几天,研究院的工作日也相应减少,所以他必须在两周之内完成全部工作回到北京。因为向比尔.盖茨报告的时间已经更加急迫。
9月14日,孙燕峰带着他的已经调式好的1000多行程序源码,回到北京。这时候距离他离开的日子刚好两周。他马不停蹄地来到办公室,用了半天时间就把汉语语音识别的演示模型和雷德蒙的大系统连接起来。他松了一口气,凌小宁也说:“你可以到张宏江小组去支持他们的‘搜索引擎’了。”可是两天之后,凌又来找他,说,“停下你的‘搜索引擎’,从明天开始,全力支持语音组。”
李开复小组和王坚小组已经开始最后冲刺。研究员们每个小时都在改进自己的系统,也要求工程师同步改进相互衔接的环节。这时候,“背水一战”的念头已经不仅是李开复一个人的,所有的人都在说着同一句话:“只有成功,才能争取比尔的信心。”那些初来的学生,现在回想起几个月前的闲散,方知什么叫做“全力以赴”。
4289月的最后两周,希格玛大厦第五层发生的事情似乎证明:如果没有限制,人的智慧和激情是无止境的。研究工作已经不分昼夜。大家原来都说,国庆将要放长假,所以要抢回一些时间。可是到了国庆的“假日”,所有的人还是没有时间放假。比尔.盖茨在太平洋那一边赞扬微软中国研究院的消息,不断传过来,让这一边的中国年轻人更加斗志昂扬。紧张气氛一直持续到赴美飞机起程前的最后一刻。那一天是10月13日,张益肇直到凌晨还呆在电脑前工作,王坚则始终在修改他的“界面”,语音小组的人都在这里:研究员和副研究员、总工程师和工程师。李开复已经在美国,和这边的凌小宁保持着频繁联系。直到天将破晓,终于大功告成。众人离开希格玛大厦,走进永和豆浆店,一边大口嚼着油条喝着豆浆,一边庆祝研究院的第一个技术成果,欢声笑语淹没了所有的疲惫。一个小时之后,王坚和张益肇携带着众人的智慧和心血,直奔机场。一个在嘴上念叨着:“3个月以前一行东西都没有,现在居然做成了。这种事情在中国不可想像。”另一个说:“在美国也不可想像。”希格玛大厦这一边,曙光初照,所有的