WT2605-24SS音頻解碼語(yǔ)音芯片,實(shí)現(xiàn)寵物(玩具)喂食器遠(yuǎn)程更新語(yǔ)音技術(shù)方案解析
本文主要介紹一種遠(yuǎn)程更新語(yǔ)音技術(shù)的實(shí)現(xiàn)方式,在一些產(chǎn)品應(yīng)用上,常常會(huì)遇到一些需要不停更換語(yǔ)音的場(chǎng)景(如寵物喂食器、寵物玩具需要經(jīng)常更換聲音,充電樁設(shè)備需要更換提示語(yǔ)等等),市面上常用的一些語(yǔ)音芯片大多都無(wú)法直接更換語(yǔ)音內(nèi)容,因此會(huì)存在一些無(wú)法避免的痛點(diǎn),有些產(chǎn)品會(huì)使用流媒體功能的芯片去播放,但是往往也伴隨著巨大的流量消耗以及網(wǎng)絡(luò)傳輸延遲,播放卡頓等現(xiàn)象,本文介紹的這一技術(shù)可降低對(duì)流量的消耗,下面著重介紹如何實(shí)現(xiàn)遠(yuǎn)程更新語(yǔ)音這一技術(shù)。
一、系統(tǒng)組成
1、音頻語(yǔ)音芯片參數(shù)介紹
該技術(shù)主要通過(guò)WiFi/4G模塊與一款音頻解碼芯片(WT2605-24SS)實(shí)現(xiàn),音頻解碼芯片能夠?qū)崿F(xiàn)語(yǔ)音的更新以及存儲(chǔ),WT2605-24SS這款音頻解碼芯片的參數(shù)如下:
1)帶有DSP指令的32-bit高性能CPU。
2)16 bit DAC音頻解碼器,高達(dá)96dB的SNR。
3)支持音頻均衡器調(diào)整。
4)1個(gè)SPI。
5)1個(gè)IR控制器。
6)1個(gè)SD卡主機(jī)控制器。
7)1個(gè)全速USB2.0 HOST/DEVICE 控制器。
8)一個(gè)全雙工UART,通訊速率高達(dá)1Mbps,主要通過(guò)該接口與外部器件進(jìn)行交互。
1.1、DAC參數(shù)介紹:
DAC對(duì)音頻芯片來(lái)說(shuō)是一個(gè)很重要的參數(shù),此款語(yǔ)音芯片具有16bit 的DAC,也就是DAC的轉(zhuǎn)換精度能夠達(dá)到2的16次方,精度越高,音頻播放的還原度也就越高,當(dāng)然也有24bit DAC的音頻芯片,這類(lèi)芯片的價(jià)格比較高,一般用于高端的消費(fèi)類(lèi)電子產(chǎn)品,如HIFI音響等。大部分產(chǎn)品使用16bit的DAC已經(jīng)足夠,性?xún)r(jià)比較高,當(dāng)然市面上的音頻芯片DAC特性參差不齊,有9bit,11bit,13bit的DAC,這類(lèi)芯片的解碼通常都依靠軟件解碼的方式去處理,一般音頻文件大部分都是16bit,將16bit的音頻文件通過(guò)軟解碼的方式轉(zhuǎn)為9bit,11bit或13bit的音頻播放,效果可想而知。16bit的DAC直接通過(guò)硬件解碼16bit的音頻才能夠達(dá)到最好的效果。
對(duì)于SNR,一般能夠達(dá)到90db的信噪比已經(jīng)有不俗的音質(zhì)表現(xiàn),此款I(lǐng)C高達(dá)96db的SNR,音質(zhì)將會(huì)表現(xiàn)更加出色。
1.2、音頻格式介紹:
此款芯片主要支持mp3格式,當(dāng)然也支持WAV,flac,ape等音頻格式播放,一般主要推薦使用mp3格式音頻,這類(lèi)音頻資源較多,文件容量較小,大部分場(chǎng)景都能夠滿(mǎn)足,比較通用,WAV,flac,ape等都是無(wú)損音頻格式,文件容量都比較大,不太適用于語(yǔ)音更新的場(chǎng)景。
1.3、語(yǔ)音合成介紹:
對(duì)于提示語(yǔ)音,一般可以通過(guò)文字合成語(yǔ)音的方式處理,如下:
?
我們將語(yǔ)音下載下來(lái),用Adobe audition軟件打開(kāi)音頻看下音頻文件信息:
?
可以看到合成出來(lái)的是16k,16bit的mp3音頻文件,對(duì)于一些應(yīng)用場(chǎng)景,語(yǔ)音合成直接在服務(wù)器端處理即可,這里不做過(guò)多介紹。
?2、系統(tǒng)框圖介紹:
?
上圖介紹了遠(yuǎn)程語(yǔ)音更新的具體實(shí)現(xiàn)方式,主要由4G/WiFi設(shè)備連接到服務(wù)器,通過(guò)服務(wù)器把音頻數(shù)據(jù)下發(fā),經(jīng)過(guò)4G/WiFi設(shè)備中轉(zhuǎn)傳輸?shù)絎T2605組件進(jìn)行保存,文件由WT2605語(yǔ)音芯片組件進(jìn)行統(tǒng)一管理,更新完成后可直接控制設(shè)備下發(fā)指令進(jìn)行播放。這樣實(shí)現(xiàn)了語(yǔ)音的更新操作,流量也只消耗在音頻數(shù)據(jù)的傳輸上,相比流媒體播放的方式減少了流量消耗,播放卡頓等現(xiàn)象。
?
二、電路設(shè)計(jì)
1、WT2605與WiFi模塊電路
2、上述電路以WiFi模塊作為主控,WiFi模塊獲取服務(wù)器端下發(fā)的音頻數(shù)據(jù),再通過(guò)UART串口傳輸?shù)絎T2605芯片進(jìn)行保存,傳輸完成后直接發(fā)送相關(guān)指令即可控制播放。電路設(shè)計(jì)非常簡(jiǎn)單。
?
WiFi模塊通過(guò)指令,控制WT2605解碼存儲(chǔ)在SPI FLash的音頻數(shù)據(jù),經(jīng)過(guò)LM4890功放后播放。這里以1W的功放作為演示,調(diào)節(jié)R6,R7,R8可調(diào)整功放的增益,其他功放根據(jù)具體的芯片手冊(cè)進(jìn)行設(shè)計(jì)。
三、通訊命令格式介紹
通信協(xié)議主要定義主控和?WT2605之間的交互規(guī)則,處理器如何將數(shù)據(jù)推送給WT2605進(jìn)行相應(yīng)的處理,WT2605反饋相應(yīng)的處理結(jié)果。通信數(shù)據(jù)主要以命令幀的方式進(jìn)行,一個(gè)有效的命令幀必須包含:幀頭,命令包長(zhǎng),命令包,校驗(yàn)碼,幀尾等五部分。
幀頭由1個(gè)固定的十六進(jìn)制數(shù)據(jù)表示,幀類(lèi)型包含下傳命令幀(模組接收的命令幀)以及上傳命令幀(模組接收數(shù)據(jù)后反饋的命令幀,即ACK或NAK)。
命令包長(zhǎng)表示命令幀除幀頭和幀尾外的字節(jié)數(shù),即命令包長(zhǎng)(1字節(jié))+命令包(N字節(jié))+校驗(yàn)碼(1字節(jié))= N+2?字節(jié)。
命令包是具體的命令,主要包含:命令+參數(shù)。
校驗(yàn)碼,為命令包長(zhǎng)+命令包的和。
WT2605-24SS語(yǔ)音芯片典型應(yīng)用場(chǎng)景:
1)寵物喂食器、寵物玩具;
2)掃地機(jī);
3)充電樁;
4)語(yǔ)音廣告機(jī);
5)共享自行車(chē)、充電寶等。
?唯創(chuàng)知音作為一家專(zhuān)注于語(yǔ)音技術(shù)研究的高新技術(shù)企業(yè),始終堅(jiān)持以“服務(wù)好工程師”
為目標(biāo),以行業(yè)語(yǔ)音交互器件標(biāo)準(zhǔn)化為方向,致力于讓復(fù)雜變簡(jiǎn)單,提供快捷的語(yǔ)音、智能
物聯(lián)網(wǎng)應(yīng)用解決方案。
?