語音技術新突破,車載應用無極限
新一代語音合成引擎語音合成板卡訊飛XF-S4240隆重上市
目前,汽車工業正在逐步發展成為我國的支柱產業。
汽車的電子化、智能化和網絡化趨勢,不僅是這個時代汽車行業的流行主題,更是我國汽車電子產業搶占汽車計算平臺制高點,解決產業“空心化”問題的重要機遇。智能語音技術在這一革命性進程中有著重要的應用價值。
以語音合成、語音識別、語音編解碼為代表的智能語音技術應用在車載領域,通過“變看為聽”的車內語音信息服務,“君子動口不動手”的車內語音聲控操作,將改變汽車現有的人機信息交流方式,解放出駕駛者的雙手和雙眼,使汽車更具備人性化魅力和個性化特色,提高駕車更安全性。該技術已引起國內外汽車業界的廣泛關注,尤其在美國、歐洲、日本等汽車工業發達國家,都在不斷加大研究和產業化的力度。特別是在車載導航領域。
“在可預見的將來,中國將成為全球衛星導航市場的‘龍頭老大’,其次是印度,然后才是美國和歐洲。”2005年12月初,在上海“國際導航產業化與科技發展論壇”中,德國慕尼黑聯邦國防大學測地導航研究所所長、美國導航學會歐洲會員岡特·沃爾夫岡·海因說。他補充,這并不僅僅是他一個人的看法,而是全球導航領域的專家、市場分析人士和公司所達成的共識。
就車載導航而言,截止到2005年底,中國擁有車載導航設備的車輛不足10萬輛,車載導航安裝率不到2%。而日本的汽車車載導航安裝率高達59%,歐美約占25%。到2007年,中國至少將有60萬輛汽車裝備導航設備,產值至少超過200億元人民幣。在國外能夠得到極大的普及,與其嵌入式語音技術等基礎技術的成熟,為導航設備帶來了豐富的應用服務是分不開的,比如:實時交通信息播報、當前位置的加油站、酒店、商場信息的播報。所以中國車載導航事業真正要實現跨越式發展,嵌入式語音技術的突破是必備的基礎。
據了解,中科大訊飛公司通過多年的積累,在2005年初推出了新一代語音合成引擎(InterSound KT),其語音效果基本可以達到錄音的效果,并在國內外多個廠商的GPS導航系統中得到成功的應用,為滿足不同的市場需要,該公司在2006年2月正式推出基于該引擎的XF-S4240語音合成模塊。為整個車載語音的應用打下了基礎。正是在這一基礎上,科大訊飛在車載導航領域提出了一系列代表國際先進水平的應用方案。
在車載導航領域,傳統的錄音語音導航只能做到簡單的語音內容提示,如:“前方100米請往左拐”,若要提示“前方100米請往左拐,進入長安街”,則無能為力,這是因為千變萬化的類似路名信息,采用錄音技術是不現實的。但是在2006年之前,因為語音合成技術的效果與錄音的差距較大,所以錄音導航設備仍然占有一定的市場份額。
隨著科大訊飛一代語音合成引擎的推出,傳統的錄音方式的語音導航預計將很快退出市場。因為其語音合成的效果與錄音的效果已經基本沒有區別,并且合成方式的語音導航在代表車載導航設備發展方向的信息播報應用方面將彰顯更大的優勢。
信息播報典型應用包括:
區域信息播報——包括播報當前所在位置的各種實用信息(加油站、酒店、
商場等)給駕車出行帶來極大的方便。
與無線通訊相結合可以實現:
1)實時交通狀況播報——隨時了解當前交通狀況,彌補導航無法發現的隨時隨地可能發生的交通擁堵問題;
2)實時新聞播報——及時了解所在位置的新聞;
3)天氣預報播報——了解當地天氣情況,安排出行;
4)其它如停車/電召信息、110信息等內容的播報。
當前無線寬帶技術已經成熟,市場也逐漸普及,3G網絡也預計將在06年開始進行全國范圍的推廣,這些基本要素的實現,加上語音技術突破,可以預見內容更加豐富的GPS導航服務將很快到來,為用戶帶來方便,更為中國導航產業帶來商機。
但是InterSound KT引擎是否能夠適合在當前主流的GPS導航設備中應用呢?
據訊飛公司介紹,其InterSound KT引擎適用性極強,其需要的運算能力與存儲空間,在當前主流的GPS導航平臺上都可以提供,產品還具備了:支持男、女雙角色中英文切換,支持拼音輸入、流式文本輸入,支持控制標識、合成狀態輸出等產品特性。
在車載調度的應用中,因為同樣存在錄音方式無法滿足大量變化的信息播報的需要的問題,在語音合成效果與錄音差距較大的時候,使得相當一部分車載調度系統仍然使用錄音方式,從而限制了其服務內容的豐富。在有了訊飛公司推出的XF-S4240語音合成板卡后,不僅宣布錄音方式的車載調度系統即將退出舞臺,同時為部分當前已經采用合成板卡的車載調度系統帶來福音。因為該產品兼容原已經大量使用的XF-S3231語音合成板卡模塊的軟硬件接口,可實現產品的軟升級(無需開發),而產品的成本將有較大的降低。(這里不能不說XF-S4240語音合成板卡是一款效果更好、成本更低,考慮周全的好產品,其實際使用效果我們將進一步進行跟蹤報道。)
在合成語音效果得到極大的提高后,XF-S4240語音合成板卡在公交車的報站服務中也將得到廣泛的應用。
當我們在上海坐地鐵的時候可能會聽到這樣的報站聲音“徐家匯站到了,前往中國惠普公司、…的乘客請下車”,而在下次坐到該站點的時候,他又可能把“惠普公司”改為其它公司的名字,這就是典型的公交報站服務。這種方式不僅給顧客帶來了方便,同時對需要提高知名度的公司提供了有效的途徑,自然也就成為公交公司有效的增值服務之一。
在傳統的公交報站中,內容是靠錄音的,使得內容的變更變得相當困難,這也是在幾乎所有的公交車中,公交報站的內容幾乎都是不變的原因,在這種情況下,即使經常需要的公交車線路的調整、新增需要的內容變更,都是極為不便的。但是在語音合成效果沒有突破之前,硬件的合成產品的效果可能無法滿足公交報站行業的要求,所以在兩年之前利用語音合成技術提供公交報站服務系統基本沒有。
但是在語音合成的效果得到極大的提高后,不僅可以清晰的進行報站服務,還可以極大提高在公交車線路調整、新增需要的內容更新的工作效率,同時也給公交公司的有效增值服務提供了便利的工具。