數(shù)碼錄音筆工作原理
數(shù)碼錄音筆通過對聲音的模擬信號的采樣、編碼,將模擬信號通過數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號,并進(jìn)行壓縮后進(jìn)行存儲。
智能錄音筆工作原理
語音交互,只需要短短幾秒鐘便可翻譯出文字。所謂語音轉(zhuǎn)換成文字用到了語音交互中一項(xiàng)ASR技術(shù)。
建立聲學(xué)模型:由于每個(gè)人發(fā)音、語調(diào)、語速等各不相同,需要將同一個(gè)單詞或漢字讓不同用戶錄取,以便機(jī)器識別更多的人。聲學(xué)模型建立過程需要錄入大量的原始用戶聲音,以從中提取特征建立聲學(xué)模型數(shù)據(jù)庫。
建立語言模型:同聲學(xué)模型,也需要大量文字信息的儲存。語言模型可以對聲學(xué)模型進(jìn)行匹配與調(diào)整,讓正確率盡可能提高,語句更加通順。
語音識別:有前兩步作為基礎(chǔ)的情況下,最終形成的數(shù)據(jù)庫存儲在設(shè)備本地或云端,再進(jìn)行實(shí)時(shí)語音識別。將用戶的語音輸入進(jìn)行編碼和特征提取,將提取到的特征拿到聲學(xué)模型庫中去查詢,得到單個(gè)的單詞或漢字;然后再拿到語言模型庫中去查詢,得到最匹配的單詞或漢字。