裏優化優化,雖然呆在公司也能做這件事,但是杜克覺得還是回家更舒服更安全一些。像克裏這個大殺器,在這裏做事人多眼雜,萬一不小心就難免露出一些馬腳。
現在杜克是眾人關注的焦點,有些東西就更加不能不小心了。
自然語言處理技術是一門集語言學、數學、計算機科學和認知科學等於一體的綜合性的交叉學科。在研究語音識別的過程中,杜克其實已經解決了語言處理中一些疑難問題:比如生詞識別問題、歧義消解問題、自動分詞問題、詞性定義規範問題等。
可以說現在已經有了非常雄厚的基礎來更進一步,回到家中,杜克找到了機器翻譯的一些相關關鍵技術資料,包括對目前國際上機器翻譯研究進展,漢語詞法分析技術、漢語句法分析技術、漢語詞匯語義相似度計算、漢英雙語語料庫的詞語對齊、語料庫的結構對齊、基於結構對齊語料庫的翻譯模板抽取、多引擎機器翻譯方法等多方麵的研究成果。
很快,這些研究成果就轉換為克裏開發新翻譯算法的基礎知識,然後轉換為新的代碼,很快,一個新的翻譯引擎誕生了。
杜克再度試著輸入“白日依山盡”,程序翻譯結果“Thesunfallintothemountains”,雖然意境上差了十萬八千裏,但是比原來的翻譯結果來說已經強了一百倍都不止。至少勉強有了那麽一點意思上的相近了。
對於這個結果,杜克也無可奈何,錯非精通中英文化的資深專家,才可能將雙方的古詩詞進行比較流暢翻譯,但是對於日常口語來說,這些未免要求太高。杜克接著試驗了一下日常所用的句子,找了幾篇中英文報紙新聞翻譯了一下,基本上都能夠將文章中的大概意思表達清楚。
這就夠了。做到這個程度,杜克停下了,準備過幾天將成果交給趙建武,了解這樁事情,不過既然度假計劃泡湯,杜克也就認命,準備開始了下一階段的工作。
PS1:第三更!提前一點更了。這是今天為書友“美人玉”捧場打賞的第一個加更。昨天累計11個加更,現在幹掉了一個,但是書友“梁柱是好人”再次捧場《外星代理人》666縱橫幣,所以,所以……還是有11個加更在身!小飛還得痛並快樂著去碼字,你們絕壁是故意的啊
PS2:這章百度了一點資料過渡,可是這章足足2500多,即便去掉這些字數也是足足的,不是灌水啊
PS3:收藏?!收藏也要火起來啊,看完後在右邊藍色“加入書簽”上麵點一下,這個世界就完美了,你好,我好,大家都好……藍屏的,效果你懂的
本章已閱讀完畢(請點擊下一章繼續閱讀!)