在讀博士階段,李開復(fù)從事語音識(shí)別方面的研究,中途與導(dǎo)師在方法上產(chǎn)生了分歧,他更傾向于用統(tǒng)計(jì)學(xué)的方法進(jìn)行軸向柱塞泵研究。在得到導(dǎo)師的許可之后,他″開始了瘋狂的科研工作″(李開復(fù)語)。從1984年底到1 987年初,他帶著一位學(xué)生一起用統(tǒng)計(jì)學(xué)的方法做語音識(shí)別。同時(shí),他的導(dǎo)師帶領(lǐng)另外的30多人用專家系統(tǒng)做同樣的問題。從方法上來說,他們?cè)诟偁帲窃谌鸬辖淌诘念I(lǐng)導(dǎo)下,他們分享一切,他們用同樣的樣本訓(xùn)練和測(cè)試。
在瑞迪教授的支持下,李開復(fù)慢慢得到了其他教授的認(rèn)可。在1986年底,李開復(fù)的統(tǒng)計(jì)系統(tǒng)和瑞迪教授帶領(lǐng)的專家系統(tǒng)在研究成果上達(dá)到了大約一樣的水平,40%的辨認(rèn)率。這還是個(gè)完全不能實(shí)際應(yīng)用的系統(tǒng),但是是學(xué)術(shù)界第一次嘗試這么難的問題,大家都比較樂觀和欣喜。
到了1987年5月,李開復(fù)和助手大幅度地提升了馬達(dá)軸向柱塞泵廠家訓(xùn)練的數(shù)據(jù)庫,并且想出了一種新的方法來建模,不但能夠用統(tǒng)計(jì)學(xué)的方法學(xué)習(xí)每一個(gè)音,而且可以用統(tǒng)計(jì)學(xué)的方法學(xué)習(xí)每兩個(gè)音之間的轉(zhuǎn)折。針對(duì)有些音的樣本不夠,李開復(fù)又想出了一種方法來合并其他的音。這三項(xiàng)工作居然把機(jī)器的語音識(shí)別率從原來的40%提高到了80%! |