新聞資訊 News

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        日期: 2021-12-16
        瀏覽次數: 2368

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        概述:本文主要介紹一種遠程更新語音技術的實現方式,在一些產品應用上,常常會遇到一些需要不停更換語音的場景(如寵物喂食器、寵物玩具需要經常更換聲音,充電樁設備需要更換提示語等等),市面上常用的一些語音芯片大多都無法直接更換語音內容,因此會存在一些無法避免的痛點,有些產品會使用流媒體功能的芯片去播放,但是往往也伴隨著巨大的流量消耗以及網絡傳輸延遲,播放卡頓等現象,本文介紹的這一技術可降低對流量的消耗,下面著重介紹如何實現遠程更新語音這一技術。

        一、系統組成

        1、音頻芯片參數介紹

        該技術主要通過WiFi/4G模塊與一款音頻解碼芯片(WT2605-24SS)實現,音頻解碼芯片能夠實現語音的更新以及存儲,WT2605-24SS這款音頻解碼芯片的參數如下:

        1)帶有DSP指令的32-bit高性能CPU。

        2)16 bit DAC音頻解碼器,高達96dB的SNR。

        3)支持音頻均衡器調整。

        4)1個SPI。

        5)1個IR控制器。

        6)1個SD卡主機控制器。

        7)1個全速USB2.0 HOST/DEVICE 控制器。

        8)一個全雙工UART,通訊速率高達1Mbps,主要通過該接口與外部器件進行交互。

        ?1.1、DAC參數介紹:

        DAC對音頻芯片來說是一個很重要的參數,此款芯片具有16bit 的DAC,也就是DAC的轉換精度能夠達到2的16次方,精度越高,音頻播放的還原度也就越高,當然也有24bit DAC的音頻芯片,這類芯片的價格比較高,一般用于高端的消費類電子產品,如HIFI音響等。大部分產品使用16bit的DAC已經足夠,性價比高,當然市面上的音頻芯片DAC特性參差不齊,有9bit,11bit,13bit的DAC,這類語音芯片的解碼通常都依靠軟件解碼的方式去處理,一般音頻文件大部分都是16bit,將16bit的音頻文件通過軟解碼的方式轉為9bit,11bit或13bit的音頻播放,效果可想而知。16bit的DAC直接通過硬件解碼16bit的音頻才能夠達到好的效果。

        對于SNR,一般能夠達到90db的信噪比已經有不俗的音質表現,WT2605音頻芯片高達96db的SNR,音質將會表現更加出色。

        1.2、音頻格式介紹:

        此款芯片主要支持mp3格式,當然也支持WAV,flac,ape等音頻格式播放,一般主要推薦使用mp3格式音頻,這類音頻資源較多,文件容量較小,大部分場景都能夠滿足,比較通用,WAV,flac,ape等都是無損音頻格式,文件容量都比較大,不太適用于語音更新的場景。

        1.3、語音合成介紹:

        對于提示語音,一般可以通過文字合成語音的方式處理,如下:

        ?WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        我們將語音下載下來,用Adobe audition軟件打開音頻看下音頻文件信息:

        ?可以看到合成出來的是16k,16bit的mp3音頻文件,對于一些應用場景,語音合成直接在服務器端處理即可,這里不做過多介紹。

        2、系統框圖介紹:

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析?

        上圖介紹了遠程語音更新的具體實現方式,主要由4G/WiFi設備連接到服務器,通過服務器把音頻數據下發,經過4G/WiFi設備中轉傳輸到WT2605語音芯片組件進行保存,文件由WT2605組件進行統一管理,更新完成后可直接控制設備下發指令進行播放。這樣實現了語音的更新操作,流量也只消耗在音頻數據的傳輸上,相比流媒體播放的方式減少了流量消耗,播放卡頓等現象。

        二、電路設計

        1WT2605WiFi模塊電路

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        2、上述電路以WiFi模塊作為主控,WiFi模塊獲取服務器端下發的音頻數據,再通過UART串口傳輸到WT2605芯片進行保存,傳輸完成后直接發送相關指令即可控制播放。電路設計非常簡單。

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        WiFi模塊通過指令,控制WT2605解碼存儲在SPI FLash的音頻數據,經過LM4890功放后播放。這里以1W的功放作為演示,調節R6R7R8可調整功放的增益,其他功放根據具體的芯片手冊進行設計。

        三、通訊命令格式介紹

        通信協議主要定義主控和WT2605之間的交互規則,處理器如何將數據推送給WT2605進行相應的處理,WT2605反饋相應的處理結果。通信數據主要以命令幀的方式進行,一個有效的命令幀必須包含:幀頭,命令包長,命令包,校驗碼,幀尾等五部分。

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        命令包長表示命令幀除幀頭和幀尾外的字節數,即命令包長(1字節)+命令包(N字節)+校驗碼(1字節)= N+2 字節。幀頭由1個固定的十六進制數據表示,幀類型包含下傳命令幀(模組接收的命令幀)以及上傳命令幀(模組接收數據后反饋的命令幀,即ACK或NAK)。

        命令包是具體的命令,主要包含:命令+參數。

        校驗碼,為命令包長+命令包的和。

        WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析

        WT2605-24SS語音芯片典型應用場景:

        1)寵物喂食器、寵物玩具;

        2)掃地機;

        3)充電樁;

        4)語音廣告機;

        5)共享自行車、充電寶等。

        唯創知音作為一家專注于語音技術研究的高新技術企業,始終堅持以“服務好工程師”為目標,以行業語音交互器件標準化為方向,致力于讓復雜變簡單,提供快捷的語音、智能物聯網應用解決方案。

        回到頂部
        • 您的姓名:
        • *
        • 公司名稱:
        • *
        • 地址:
        • *
        • 電話:
        • *
        • 傳真:
        • *
        • E-mail:
        • *
        • 郵政編碼:
        • *
        • 留言主題:
        • *
        • 詳細說明:
        • *
             
        深圳市寶安區福永街道大洋路90號中糧福
        安機器人智造產業園6棟2/3層 
        WT1999@waytronic.com
        4008-122-919
      1. 手機云網站
      2. 微信公眾號
      3. ?

        Copyright ?2005 - 2016 深圳唯創知音電子有限公司

        粵公網安備 44030602001141號