新聞中心

EEPW首頁 > 手機與無線通信 > 業(yè)界動態(tài) > 商刊:IBM擬將語音識別技術從戰(zhàn)場推向市場

商刊:IBM擬將語音識別技術從戰(zhàn)場推向市場

作者:子聰 時間:2008-08-20 來源:賽迪網 收藏

  《商業(yè)周刊》文章指出,預計技術的市場需求將在未來幾年顯著增長,的語音研究組正在積極尋求合作,將這項技術推出市場。

本文引用地址:http://m.butianyuan.cn/article/87153.htm

  據悉,美國軍方利用研究公司的創(chuàng)新技術解決了駐伊士兵和伊拉克民眾之間的通信問題。 駐伊士兵可以利用電腦或PDA的麥克風講話,電腦中安裝的軟件就可以將他們的話翻譯成阿拉伯語。伊拉克軍隊士兵和民眾聽到的是阿拉伯語,他們的回答會馬上被翻譯成英語。 目前大約有1萬套這種系統(tǒng)正在交戰(zhàn)地區(qū)使用。

  但是這也凸顯出研究公司面臨的一個巨大難題:當軍隊在選擇新醫(yī)療記錄網絡的技術時,他們選擇了市場領袖Nuance Communications的產品。 因為IBM的全部專業(yè)知識和資源及其全球基礎研究部門的3000多名科學家面臨著一個重要的挑戰(zhàn),即必須將他們的創(chuàng)新成果從試驗室推到市場上。

  IBM研究公司語音與翻譯分公司的首席技術官David Nahamoo希望改變這種情況。 他在8月18日在紐約SpeechTEK 2008大會上宣布了一項新戰(zhàn)略。 語言研究組并不打算通過IBM來推廣其技術,而是打算與其他廠商合作將這項技術帶到市場上。它的合作伙伴包括Vlingo、PhoneTag和Jajah等。 Nahamoo說:“我們可以尋找合作伙伴,分散風險,改善我們開拓市場的能力。”

  IBM研究語音識別技術已經有四十個年頭了。其中有些技術已經被應用到IBM的軟件和服務之中。 但是這項技術的影響力還沒有達到Nahamoo和公司其他高管預期的水平。他們認為這項技術可以應用于汽車、、呼叫中心、醫(yī)療系統(tǒng)和翻譯服務等領域。 這些應用領域都代表著一個相對較小的細分市場。因此IBM需要在各個領域都找一個合適的合作伙伴。 技術咨詢公司TMA Associates的總裁William Meisel說:“這項新戰(zhàn)略讓IBM的人才有了用武之地。”

  從整體上說,隨著日漸成為人們生活中不可或缺的必備品,語音識別技術的市場需求將在未來幾年顯著增長。 語音指令在車載娛樂和導航系統(tǒng)中應用得越來越多。語音識別技術精確度的穩(wěn)定提升也推動了這項技術采用率的提高。

  語音識別技術并非一種技術,而是多種技術結合而成。通過將字、短語和句子記錄下來并建立數據庫,可以建立一個語音識別引擎。 然后就可以建立不同字的具體讀音庫。然后再將記錄的文字與讀音一一對應起來。 最后,就可以建立一個巨大的常用字語音庫。

  IBM和其他研究組織的科學家在過去幾年里掌握了如何將他們的語音識別引擎更快地應用到具體人或環(huán)境的方法。 Nuance最新發(fā)布的Dragon Naturally Speaking 10 PC語音識別軟件的翻譯準確率可以達到99%。

  Nuance是語音識別業(yè)界的領先者。預計它今年的全年銷售額將達到9億美元。 公司移動語音與消費者服務分公司總裁Steve Chambers表示,借助于這些豐富的經驗,公司可以從使用不同的語言和口音的人那里收集大量語音樣品,這有助于公司快速完善其技術。

  除了Nuance之外,IBM研究公司也一直在努力開發(fā)高效的語音識別軟件。Vlingo將IBM的技術與Nuance和其他廠商的技術進行了對比。 Vlingo首席執(zhí)行官Dave Grannan稱,IBM在測試中將語音處理與準確度很好地結合在一起。他并不擔心IBM有一天會進入他的公司所在的市場。 另一方面,Nuance也與Vlingo是競爭對手的關系。他說:“由于IBM研究公司并不是IBM旗下直接與市場相關的公司,他們不用考慮市場競爭的問題。”

  Nahamoo的團隊正在集中精力尋找商業(yè)機會。但是IBM的研究人員也在探索社會影響巨大的市場領域。以印度的科學家為首的許多科學家正在進行一項名為“說話的網絡”的計劃,如果成功的話,語音識別技術將有助于向全球數億文盲開放互聯(lián)網。IBM研究公司的通信業(yè)務高管Paul Bloom說:“語音識別技術有可能會改變那些未開化地區(qū)的面貌。”



評論


相關推薦

技術專區(qū)

關閉