自動語音辨識 (ASR) 完整指南

自動語音辨識(通常稱為 ASR)將口語轉換為文字。它是語音轉文字軟體,可自動將您的語音轉換為書面語言。 

這項技術有許多應用,包括聽寫和視覺語音郵件軟體。 

在本文中,我們將討論自動語音辨識技術的工作原理。我們還將討論它是如何演變的以及您今天可以用它做什麼。

什麼是自動語音辨識 (ASR)?

ASR 可以識別、理解口語並將其翻譯為文字。 

這是技術中使用最廣泛的功能之一。想想您有多少次說“Ok Google”、“Hey Siri”,或僅用聲音打開手機上的應用程式。 

這個功能已經變得如此普遍,以至於消費者 阿聯酋電話號碼 甚至不再注意到它。這並不意味著他們不受其用處的影響。 ASR 擅長幫助人們透過設備說話,將他們的話翻譯成文字。 

ASR 簡史

自動語音辨識長期以來一直是科幻小說的領域。即使在今天 Siri 和 Alexa 的世界裡,許多人仍然不知道它是如何運作的,也不知道為什麼需要這麼長時間來開發。

ASR(自動語音辨識)貝爾實驗室創建了一個名為奧黛麗的程式。他們設計了這個程式來轉錄口頭數字,但它只能識別十個短語。 

ASR 研究人員專注於開發能夠轉 台灣電話號碼 錄對話的系統。這些新方法包括直接轉錄。研究人員手動將單字分配給詞性。他們還使用了廣泛覆蓋策略,讓電腦聽取廣泛的發言者的聲音。 

儘管兩人都成功地識別了孤立的單詞,但兩人都無法可靠地理解整個句子。研究人員在不同的環境中調整了他們的技術,包括遠端監聽站。 

Leave a comment

Your email address will not be published. Required fields are marked *