隨著信息社會的到來,以手機為代表的移動信息終端在人們生活中的普及率越來越高,同時體積和屏幕也越來越小。人們經常在走動或駕車等移動狀態下使用,傳統的圖文顯示和按鍵操作在便捷性、人性化等方面的不足越來越成為人們關注的焦點。
針對目前我國手機市場迫切需求,科大訊飛通過具有自主知識產權的智能語音技術讓手機變得能聽會說,為其操作界面帶來革命性提升。這里我們將在現有的手機功能以及成熟的語音合成技術的基礎上,介紹一些手機平臺上的語音應用方案,為希望在手機上增加語音應用的手機設計商和手機制造商提供方案參考,同時也為手機方案設計及技術開發人員進行手機功能定義和設計時提供基本的流程設計參考。
一、功能介紹
1、來電播報
功能描述:當有新來電到達的時候,用語音播報來電號碼或者來電人姓名,提示用戶接聽來電。
適用人群:業務繁忙的商務人士、駕駛員、家庭主婦、視力不濟的老年人。
典型使用場合:
1、駕車途中:在駕駛車輛的時候,操作手機不便,同時也有危險性。語音來電提醒功能可以避免操作和瀏覽手機就可獲知來電號碼,增強行車的安全性。
2、在家中做家務時,雙手一般都是忙碌的,接聽電話不方便。語音來電播報可以讓用戶判斷是否是重要來電要接聽,不需要為無關緊要的電話而打擾手頭工作。
3、辦公室中:根據調查,大多數人在工作的時候,喜歡把手機放置在桌子上,而不是隨身攜帶。來電播報可以提高對電話處理和接聽效率。
2、消息到達提醒
功能描述:當有新的消息到達時(如短信、彩信、郵件等消息),可以將該消息的發送人或發送號碼播報出來,提醒用戶查看新到消息,同時也可以通過設置使其將短信內容播報出來。
適用人群:業務繁忙的商務人士、駕駛員、家庭主婦、學生、老年人等。
典型使用場合:駕車途中、辦公室工作和做家務等場合。
3、日程安排提醒
功能描述:當日程表中有事件發生需提醒用戶處理時,通過語音把日程安排的內容播報給用戶。
適用人群:業務繁忙的商務人士、學生、文秘人員、企業的高層管理人員和政府公務員等經常需要安排行程計劃的人員。
4、號碼輸入提示
功能描述:用戶輸入電話號碼的時候,每次點擊輸入一個號碼的同時,手機通過語音將該號碼讀出來。
典型使用場合:燈光昏暗的街道、晚上的郊外、交通工具上或者存在強光干擾視線的環境。
5、通話記錄播報
功能描述:播報當前未接來電和已接電話等信息。
適用人群:視力不濟的老年人,眼睛容易疲勞的人士和記憶力不佳的人士。
6、短消息播報
功能描述:可以將收件箱中短信的發送人(或號碼)、發送時間和短信內容等信息朗讀出來。
適用人群:視力不濟的老年人,眼睛容易疲勞的人士和記憶力不佳的人士。
典型場景:
1、在旅途中,人們為了打發長途旅行的時光,經常會選擇給朋友發送短信聊天,但在行車過程中,在顛簸的狀態下閱讀手機屏幕會讓眼睛容易疲倦,使用語音播報就不會有問題了。
2、在節假日中把親人發來的短消息播放給一家人聽,可讓全家人都感受到濃濃的親情。
7、電子書內容播放
功能描述:用戶在瀏覽電子書內容的時候,把電子書的內容通過語音朗讀出來。同時,從用戶應用性角度出發,設計播放、暫停、中止朗讀、選定內容朗讀、選頁朗讀等功能,使用戶使用起語音功能來更加得心應手。
適用人群:年輕白領、經常出差的人士。
典型應用:
1、在閑暇時刻閉上眼睛悠然的收聽喜愛的文章,給自己一個放松的機會;
2、通過“聽書”輕松地度過那漫長的旅途或者上下班時間。
目前,手機移動終端上的應用將日益豐富,移動運營商經營的業務也日益增多,終端應用逐步從單一的傳統手機應用延伸至類似傳統PDA、甚至筆記本電腦等高端移動設備的應用功能,隨著運算能力和智能化程度的提高,手機上需要處理的業務和數據也日益增多,如何讓用戶能在手機操作過程中簡便、快捷和靈活地使用各種數據業務,成為難點之一。而通過使用嵌入式語音合成技術,可以讓用戶更方便更直觀的處理各種信息和數據,比如,使用GPRS功能瀏覽網頁的時候,可以用語音來聽取各種新聞;下載各種數據表格之后,手機可以馬上將表格數據用語音方式播報出來。
據專家預測,“時尚、情感、娛樂”也將是未來手機的發展趨勢。先進的語音合成技術的使用,打造全新的會說話的語音手機概念,無疑會增強手機的時尚感。在娛樂方面,如果能在游戲中加入語音技術,可以大大增強游戲的互動性和可玩性。再次,隨著語音合成技術的進一步提升,將來可帶有感情色彩、甚至可具備手機用戶聲音特征的語音合成系統將逐漸推向市場,手機進行語音播報的時候,可以帶上不同的語氣和感情色彩,甚至可以用親人或自己的語音風格來播報信息,使得手機的語音功能更加的人性化和個性化。
語音合成功能只是語音技術的一部分,它主要解決了“說”的問題。但是要做到真正意義上的人機交互功能,還需要結合語音識別等其他語音技術。與語音識別技術相結合之后,手機將具備真正的“能聽會說”的能力,這樣,可以極大的克服傳統手機輸入、輸出設備受限的瓶頸問題,使手機具備更強的易用性。科大訊飛公司憑借著在語音技術上的深厚積累和長期市場經驗,在嵌入式語音技術方面投入了極大的研發和設計力量,將持續不斷的推出語音合成、語音識別、語音編解碼等成熟的技術產品和應用方案。