MozillaOcho團隊的Whisperfile提供本地且簡單的ASR
Mozilla以創新和實驗而聞名的團隊已將OpenAI的Whisper自動語音識別系統集成到他們的llamafile項目中。該項目旨在以單文件可執行文件的形式提供本地硬件友好的大型語言模型。本地運行轉錄軟件的能力可以讓注重隱私、希望轉錄敏感音頻的用戶受益。
對于那些不熟悉llamafile項目的人來說,MozillaOcho團隊正在努力通過結合llama.cpp和CosmopolitanLibc(兩者都使用C/C++編程語言)來消除LLM安裝的復雜性。Llamafile使用llama.cpp提供的Meta的LLaMA模型的推理,并將其與CosmopolitanLibc的一次構建隨處運行的C轉換相結合。CosmopolitanLibc還消除了在Linux、Mac和Windows機器上運行C時對解釋器或虛擬機的需求。
Mozilla的HuggingFace簡介中詳細介紹了llamafile項目的最新成員Whisperfile。根據他們的頁面,“Whisperfile是OpenAIWhisper的高性能實現,由MozillaOcho作為llamafile項目的一部分創建,基于GeorgiGerganov等人編寫的whisper.cpp軟件。”對于該項目,團隊將模型所需的所有權重打包到“whisperfiles”中,這些文件保留了CosmopolitanLibc中的功能,使模型可以在大多數系統上運行。
團隊GitHub個人資料上的“Whisperfile入門”文檔詳細介紹了一個簡單的安裝過程,僅包含三個步驟。用戶下載模型、構建軟件并運行程序后,可以從三種不同的模型中進行選擇,開始轉錄音頻。這些模型大小不一,轉錄過程中的速度與準確性成正比。此外,Whisperfile可以使用多語言模型和“--translate”標志將不同的語言翻譯成英語。
免責聲明:本答案或內容為用戶上傳,不代表本網觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。 如遇侵權請及時聯系本站刪除。