? ? ? 離在線TTS(Text-To-Speech,文本轉語音)語音芯片是兩種不同類型的語音處理芯片,它們在功能、應用場景和技術實現上有所不同。為滿足更多客戶對這方面的功能需求,唯創知音分別推出離線TTS語音芯片WT3000T和在線TTS語音芯片WT2605CX兩個系列。
? ? ??WT3000T離線TTS語音芯片是一種集成了語音合成技術的智能芯片,它能夠在沒有網絡連接的情況下,將輸入的文本實時轉換為流暢的語音輸出。這種芯片內置了嵌入式TTS軟件核心,支持文本智能分析處理,支持任意中文文本、英文文本的合成,并且支持中英文混讀,包括數值、電話號碼、時間日期等格式的識別和處理。帶有地址播放、插播、單曲循環、所有曲目循環、隨機播放等功能
? ? ??與離線TTS語音芯片不同,WT2605CX在線TTS語音芯片可通過網絡連接來實現文本到語音的轉換。它通常將文本數據發送到云端服務器,由服務器上的語音合成引擎進行處理,并將生成的語音數據返回給設備。支持wifi、BLE、4G、UART串口通信傳輸。可實現在線TTS音頻播放下載、手機錄音播放下載、手本地音頻播放下載,支持16國語種7種國內方言切換、超擬人音色。
1. 控制方式:UART,默認波特率9600;
2. 上電默認不播放;具備BUSY狀態指示、BUSY播放時為高電平(可配置);
3. 音頻輸出方式,樣品默認DAC輸出;
4. 支持語音高品質音頻格式,(8kbps~320kbps)聲音優美,.MP3、.WAV格式;
5. 支持指令隨機播放,無縫循環播放功能等;
6. 最大可以支持128Mbit的Flash;
7. 音量可調,音量等級32級;
8. 大功率IO驅動能力,最高可直接驅動32mA;
9. 支持任意中文文本、英文文本的合成,并且支持中英文混讀;
10. 芯片支持任意中文、英文文本的合成,可以采用UNICODE編碼方式。每次合成的文本量最多可達4K字節。
11. 芯片對文本進行分析,對常見的數字、號碼、時間、日期、度量衡符號等格式的文本,芯片能夠根據內置的文本匹配規則進行正確的識別和處理;對一般多音字也可以依據其語境正確判斷讀法;另外針對同時有中文和英文的文本,可實現中英文混讀。
12. 支持語音解碼功能,用戶可以使用芯片直接播放音頻文件
13. 支持多種控制命令
14. 如合成文本、停止合成、暫停合成、恢復合成、狀態查詢、進入省電模式、喚醒等。? ? 控制器通過通訊接口發送控制命令可以對芯片進行相應的控制。芯片的控制命令非常簡單易用,例如:芯片可通過統一的“合成命令”接口播放提示音和中文文本,還可以通過標記文本實現對合成的參數設置。
15. 支持多種方式查詢芯片的工作狀態
16. 包括:查詢狀態管腳電平、通過讀芯片自動返回的工作狀態字、發送查詢命令獲得芯片工作狀態的回傳數據。
17. 單芯片使用(使用內置容量)時內置語音需出廠前寫入。
?? 支持16國語種7種國內方言切換、超擬人音色、支持本地音頻及錄音播放下載、支持打斷、切換、暫停、音量大小調節;
?? WT2605CX芯片為雙模藍牙,即音頻藍牙和數傳藍牙,雙模藍牙功能符合藍牙5.0和BLE規范;
?? 藍牙上電后,音頻藍牙默認不開啟,僅開啟BLE藍牙,BLE藍牙名稱為:BLE_WT2605C;
?? 藍牙晶振參數:24MHZ _9PF,±10PPM,具體型號參考可與本司業務溝通;
?? 支持wifi、BLE、4G、UART串口通信傳輸,提供模塊/套片產品服務;
?? 采用WT2605CX芯片芯片為核心,最大可支持外掛128Mbit SPI-Flash;SPI-Flash存放為固定音源區(可更新);
?? 該芯片及模組支持UART通訊,配套PC串口工具、APP協助調試;
?? 標準UART通信接口,可以靈活實現指定地址播放、指定文件名播放、音量級數、播放停止;
?? 支持FAT、FAT32文件系統,支持MP3格式;
?? 典型TX輸出功率+2db;
?? 音頻編解碼器支持16位立體聲DAC和兩個通道16位ADC;
?? 高性能立體聲,ADC具有90dB的信噪比;
???重點注意:語音芯片如果需要掛flash。建議使用“唯創”出的flash,其他廠商的flash,不能保證可以正常工作。(建議將150mil和208mil尺寸兼容擴展畫上,更方便備貨);
???支持U盤升級模塊固件程序,建議畫板時預留出USB接口;
相關產品推薦 | |
?