即時錄音轉文字、音檔轉文字、YouTube 影片轉文字,可以多快速?今天要跟大家分享 Whisper JAX 這個線上網站,它利用 AI 辨識功能來將音訊轉成文字,1 個小時多的中文錄音檔,竟然 3 分鐘就轉成文字檔了!而且還是繁體中文,非常精確。絕對是文字工作者的福音,像是採訪文稿、會議記錄、逐字稿,都可以透過這個網站將音訊轉成文字檔,一鍵就能複製出去,根本是黑科技!
Whisper JAX 這個網站是由 OpenAI 所開發的,提供免費 AI 人工智慧功能,將語音檔案變成文字檔。沒錯,Whisper JAX 這個可以幫我們將即時錄音、上傳的音檔、Youtube 影片逐字稿,我們可以在網站裡的頁籤切換這 3 種轉換功能,總之全部都能變成逐字稿文字檔!俞果將帶你玩玩看這三個功能。
補充一下,網站上的說明文字翻譯成中文大致為:Whisper JAX 是 OpenAI 所開發的 Whisper 模型的最佳化實現版本。它在後端運行於 JAX,並使用 TPU v4-8。相較於在 A100 GPU 上運行的 PyTorch,速度提升了超過 70 倍,使它成為最快的 Whisper API。請注意,在高峰時段,您可能會在此示範中遇到排隊等候的情況。當您提交請求時,您的排隊位置將顯示於示範窗格的右上方。一旦輪到您排隊前方,將會對您的音訊檔進行轉錄,進度將透過進度條顯示。
文章目錄
麥克風即時錄音轉文字檔
首先來玩 Whisper JAX 第一個頁籤功能:Microphone 麥克風,點擊同意這個網站使用電腦麥克風後就可以啟用,之後在紅框裡點擊 Recored from microphone 就開始錄音了。第三個箭頭 Task 部分則是可以點選我們要 transcribe 逐字稿,或是 translate 逐字稿翻譯成英文。選好後按下橘色鍵 Submit送出吧!
俞果對著電腦說話,簡單說一句「我現在要寫一篇文章懶得打字,來測試看看 AI 辨識的精準度如何」,按下暫停錄音,左邊就跑出來剛剛的輸入的給 AI 的即時錄音音檔了,好方便。然後按下 Submit,右邊真的跑出來了!!
跟手機上的語音輸入法一樣,即時將聽到的話語轉文字檔。同段錄音我們在 Task 功能選擇 translate 逐字稿翻譯成英文,也真的馬上變成英文了!雖然說翻譯不到位,但是重點都有翻出來,非常不錯。
俞果認為這個功能非常適合開會要做會議紀錄的時候使用,拿筆電開啟 Whisper JAX,讓 AI 直接參與會議 XD 最後再把文字檔丟到 chatGPT 命令它整理成會議紀錄,實在是太太太方便啦!
音檔轉文字
接著俞果上傳一段錄音檔給 Whisper JAX,讓 AI 辨識看看。直接將資料夾中的錄音檔拖移進網頁,或是點擊網頁畫面上傳錄音檔都可以。
一樣在 Task 任務的地方點選要 AI 辨識輸出成什麼,這次我上傳一個小時長的訪談錄音檔,馬上就上傳上去了,完全不用等!按下 Submit 之後,大概跑了約 3 分鐘,逐字稿文字檔就在右邊畫面顯示出來了。中文沒有標點符號,是以空格來區分句子,閱讀得很痛苦。(如上半部)這時候可以點選 Return timestamps 顯示時間標記,每句話在幾分幾秒都會逐條列出來,根本是神!(如下半部)。我們在文字稿的右上角按下複製符號的圖示,即可複製。
輕輕鬆鬆將一小時的錄音檔轉成文字啦!連時間標記都有,整理起來超順。
Whisper JAX :Youtube 線上影音轉文字檔
Whisper JAX 第三個頁籤可以讓我們直接把 Youtube 影片內的聲音轉成文字檔。在 Youtube URL 欄位貼上 Youtube 影片的網址,一樣點選 transcribe 轉換成文字檔,submit 提交就可以啦。
上方會預覽出 Youtube 影片,但不知怎麼俞果這天試了幾支影片都沒有成功預覽。不過重點不是那個,而是影片內容的逐字稿呀!!俞果實測了老高最新講奧本海默電影的影片來測試,勾選時間標記讓每句話都逐一斷開,內容非常正確,這支影片 26分 鐘長, Whisper JAX AI 辨識花了大概也是 3 分鐘的時間,真的超級快!
以上就是 Whisper JAX 提供的免費 AI 辨識音檔轉文字的功能啦!現在 AI 工具超多,真的大大提升工作效率,而且免費的就這麼好用,一定要跟大家分享!大家快去玩玩看吧!
傳送門: