摘要:本文闡述了語音(yīn)導航技術在(zài)歐視邁(OZEAM)全數字可視對講(jiǎng)係統中的(de)應用(yòng)和實現途徑
關鍵詞:語音導(dǎo)航 全數(shù)字可視對講係(xì)統(tǒng) 歐視邁(mài) OZEAM TTS
一般(bān)的全數字可視對講(jiǎng)設備,如門口機、室內機,都會有液晶顯示屏,分辨率達800x480像素,有的甚至更高,達到1024x600。彩色液晶顯示屏顯示操作信息非常方便,
但是也有某些設備(bèi),如門(mén)口機(jī)為了適(shì)應北方寒冷的天氣,不用TFT液(yè)晶顯(xiǎn)示屏,改用LED數(shù)碼管顯示。數碼管隻能顯示數字和少部分字母,不能顯示漢字(zì);甚至象別墅門(mén)口機沒有(yǒu)任何顯示,連數字都(dōu)不能(néng)顯示(shì),而全數字係統的設置比較複雜,需要給用戶良好的操(cāo)作體驗,怎麽(me)辦?我們想到了語音,用語音(yīn)來導航用戶操作。下麵舉例說明:
例一(yī):如OS-880D03款門口機(jī),當在待機狀態下,按“*”鍵,則語(yǔ)音提示:“一.請輸入(rù)3位(wèi)或(huò)者4位房(fáng)號呼叫(jiào)住戶。二(èr).呼叫管理中心請輸入(rù)3個0,三.呼叫警衛員機,請(qǐng)輸入3個9,四.音量調節:通話中按"4"鍵減小;"6"鍵增大;"*"鍵保存。五.通話中按"0"延長通話時間(jiān)。六. 公(gōng)共密碼開鎖(suǒ)按9*,住戶密碼開鎖按(àn)8*”。
例二:在係統設置狀態下,輸入“01”,屏幕顯(xiǎn)示如下:
然後按*,則語音提示:“查看係統信(xìn)息,按(àn)*鍵循環翻(fān)頁(yè),按#鍵退出”;如果門口機的地(dì)址編碼是2010301000001,IP地址是:192.168.1.6,則查看過程如下:
按#鍵退回到(dào)係統設置狀態。
以上兩個例子說明,語音導(dǎo)航非(fēi)常有用,可以幫助用戶正確使用,查詢、設置相關(guān)信息。那邊如何實現語音導航呢?
首先是語音文件的製作。語音文件的(de)製作方法有兩種,一是真人錄音,一是用TTS(Text To Speech)技術,將文本轉為語音。真人(rén)錄音的語感比較自然,但(dàn)如果錄音設備不好,背景雜(zá)音比較(jiào)大,而且對播(bō)音員的素質要求比較高,普通話要字正腔圓。相比起來,用TTS技術則簡單很多,隻需輸入文本(běn),即可得到想要的語音文件。可以設定朗讀者是男音還是(shì)女音,是青年人還是兒童,還可以選擇(zé)粵語、四川話等地(dì)方方言。目前國內最好的TTS引擎是安(ān)徽科大訊飛的。
語音文件(jiàn)的格式采用wav格式。WAV為微軟公司(Microsoft)開發的一種聲音文件格式,它(tā)符合RIFF(Resource Interchange File Format)文(wén)件規範,用於保存Windows平台的音頻信息資源,被(bèi)Windows平台及其應用程序所廣泛(fàn)支持,該格式也支持(chí)MSADPCM,CCITT A LAW等多種壓縮運算(suàn)法,支持多種音頻數字,取樣頻率和聲道(dào),標準格式化的(de)WAV文件和CD格式一樣,也是44.1K的取樣頻率,16位量化數字,因此在聲音文件質(zhì)量和CD相差無幾!
如何播放語音文件?利用函數PlaySound即可(kě)播放。例程如下:
頭文件:#include "mmsystem.h"
庫(kù)文件 : #pragma comment(lib, "coredll.lib") ///這個地方注意,不是windows上麵的winmm.lib
PlaySound (TEXT("\\SOUNDS\\BELLS.WAV"), NULL, SND_SYNC);//注意標誌位這個地方比較重(chóng)要(yào)
結束語:通過語音導航技術,解決了(le)歐視邁全數字可視對講係統中(zhōng)部分無液晶顯示屏設備的操作和設(shè)置指引(yǐn)問題,給用戶帶來了方便。
4000-020-230