如果沒有鼠標和鍵盤,如何從成百上千首MP3歌曲中找到只想聽的那一首?如何從網絡的海量信息中準確搜索到相關內容?答案很簡單,只要“張張嘴”,對著麥克風說出歌名、歌詞或者哼唱一段旋律,短短幾秒鐘,就可以搜索到想要的歌曲;講一個關鍵詞或句子,電腦就會從特定網站檢索出相關網頁,并具有較高的容錯功能。
這是昨天下午,記者從“通信聲學技術發展暨戰略結盟新聞發布會”上體驗到的語音技術。據了解,中科院聲學所在音頻信號處理及人機互動界面語音處理領域取得一系列重要技術成果,并已成功商用。同時,該所與其旗下的中科信利分別與富迪科技形成聯盟,結合雙方資源開拓應用市場。
“音頻信息處理作為IT技術的基礎,已經在通信與電子產業帶動諸多消費熱點。”中科院聲學所所長田靜說。
在這次發布會上展示的技術,在音頻及語音信號處理領域,包括語音信號的監測、增強,智能聲場控制和音頻回放技術;在人機互動技術領域,包括語音輸入處理任務和音頻內容檢索等。例如在汽車內等嘈雜場所,有效抑制噪聲、消除回聲,實現清晰通話;通過語音識別技術真正實現“聞其聲如見其人”等。
“看文字,人們可以‘一目十行’,根據自己的喜好挑選內容。可是隨著計算機技術的發展,當多媒體文檔取代普通文字時,如何在長達幾小時的語音資料中迅速有效地進行搜索?”中科院聲學所研究員、中科信利董事長顏永紅透露,他們下一步將著力發展下一代搜索引擎的核心技術。
據悉,此次在音頻應用領域建立的策略聯盟,將以適應真實語言環境和個性化的信息家電應用為未來發展的突破口,力圖在交互語音應用市場中得到更廣泛的普及與應用。
中科院語音識別技術讓你“動口不動手”
更新時間: 2006-04-24 16:17:22來源: 粵嵌教育瀏覽量:996