whisperDesktop官方下載打不開怎么辦? WhisperDesktop下載安裝圖文教程

導(dǎo)言:當(dāng)遇到無字幕、難理解的音頻或視頻,想要獲取字幕文本怎么辦?想要解放雙手,在電腦端直接錄音轉(zhuǎn)文字怎么辦?今天小編來為大家介紹一款全程免費、支持多語種、準(zhǔn)確率高,且可以直接生成多種格式文字稿的ASR工具WhisperDesktop。
Whisper簡介 Whisper Description
Whisper是由OpenAI開發(fā)的一個自動語音識別(ASR)開源系統(tǒng)。經(jīng)過訓(xùn)練,它能夠支持多種語言的語音轉(zhuǎn)錄,并且可以將這些語言翻譯成英文,同時還能夠有效地過濾掉背景音和雜音。
Whisper官方介紹:https://openai.com/research/whisper
Whisper支持的語言種類豐富
OpenAI的技術(shù)文檔介紹了如何基于Whisper模型調(diào)用語言轉(zhuǎn)文本API來實現(xiàn)語言轉(zhuǎn)寫或?qū)⒄Z言翻譯成英文的功能。
Speech-to-text API 介紹文檔
可實現(xiàn)本地電腦的音頻轉(zhuǎn)文字軟件!完全免費開源!支持 Windows、macOS、Linux(目前界面只有英文的,但支持中文的轉(zhuǎn)換)
特征
- 基于 DirectCompute 的供應(yīng)商不可知的 GPGPU;該技術(shù)的另一個名稱是“Direct3D 11 中的計算著色器”
- 純 C++ 實現(xiàn),除了基本的 OS 組件外沒有運行時依賴性
- 比 OpenAI 的實現(xiàn)快得多。
- 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(--color-accent-fg)]需要緩沖區(qū) 的支持R16_FLOAT
- 內(nèi)置性能分析器,可測量單個計算著色器的執(zhí)行時間
- 內(nèi)存使用率低
- 用于音頻處理的媒體基礎(chǔ),支持大多數(shù)音頻和視頻格式(Ogg Vorbis 除外),以及大多數(shù)在 Windows 上運行的音頻捕獲設(shè)備(除了一些專業(yè)的,它們只實現(xiàn) ASIO API [color=var(--color-accent-fg)]。
- 用于音頻捕獲的語音活動檢測。
WhisperDesktop工具下載 WhisperDesktop
基于Whisper模型,Konstanti設(shè)計了一款工具WhisperDesktop,能夠在Windows系統(tǒng)中直接使用,無需api key,且安裝步驟及操作都十分便捷。下面就來跟隨小編一起下載體驗吧~
WHISPERDESKTOP 下載操作
首先,打開https://github.com/Const-me/Whisper,找到頁面右下方releases中的最新版本,點擊進(jìn)行下載。為了方便下載,我們提供了百度網(wǎng)盤的下載地址,詳細(xì)如下。
完成下載后,將壓縮包進(jìn)行解壓縮,找到WhisperDestop.exe,即為工具程序,點擊運行。運行成功后進(jìn)入主頁面,開始配置。
在使用前,需要下載一個二進(jìn)制文件,請點擊頁面中的Hugging Face。
https://huggingface.co/ggerganov/whisper.cpp/tree/main
打開這個網(wǎng)頁之后,我們會看到很多文件,根據(jù)Whisper模型的不同型號(tiny, base, small, medium, large-v1, large-v2),網(wǎng)頁上提供了多種二進(jìn)制文件(.bin文件)。模型越大,轉(zhuǎn)寫及翻譯的準(zhǔn)確度就越高,但同時運行的速度也會相對變慢。大家可以根據(jù)電腦配置及使用需求來選擇。
HOW TO USE 使用操作--文件轉(zhuǎn)寫
將文件下載成功后,將文件所在的本地路徑復(fù)制到Model Path后,配置完畢,點擊OK,進(jìn)入使用界面。
1.在language中選擇音頻或者視頻中的語種。如果希望將其他語言翻譯成英文,請勾選Translate。
2.點擊Transcribe File欄中右側(cè)的小方框,選擇轉(zhuǎn)寫文件。
3.在Output Format的下拉菜單中,你可以選擇輸出的格式:純文本Text、帶時間軸的文本Text with timestamps、SRT格式的字幕文件 SubRip subtitles以及WebVTT格式的字幕文件 WebVTT subtitles。
4.如果希望將轉(zhuǎn)寫文件與原文件放在同一目錄下,請勾選 “Place that file to the input folder”,或者你可以選擇新建一個文件,將文件的路徑復(fù)制到下方。
均設(shè)置好后,點擊Transcribe進(jìn)行轉(zhuǎn)寫。
HOW TO USE 使用操作--語音轉(zhuǎn)寫
WhisperDesktop還支持Audio Capture的功能,即將錄音結(jié)果進(jìn)行轉(zhuǎn)寫或翻譯。點擊下方Audio Capture按鈕,進(jìn)入音頻轉(zhuǎn)寫頁面。
將轉(zhuǎn)寫文件、語言、輸出文件等設(shè)置選定后,點擊Capture,開始錄音并轉(zhuǎn)寫。
如果想返回文件轉(zhuǎn)寫頁面,點擊下方Transcribe File即可。
以上就是WhisperDesktop本地音頻轉(zhuǎn)文字軟件的使用方法,希望大家喜歡,請繼續(xù)關(guān)注腳本之家。
相關(guān)文章
職場人慌了! DeepSeek配合Mermaid自動繪圖的技巧
DeepSeek這玩意兒,配合Mermaid,自動生成甘特圖,這速度,這效率,簡直了神奇了,下面我們就來看看用法2025-03-05- 今天匯總15個很值得收藏的DeepSeek 提示詞,包含職場打工人必備,自媒體爆款創(chuàng)作,學(xué)生黨逆襲,個人成長開掛等等全方面2025-03-04
如何在iPhone上部署DeepSeek-R1? DeepSeek-R1在手機(jī)上部署全攻略
你以為只在大機(jī)器上跑的模型,其實在手機(jī)上也能玩得轉(zhuǎn)!為了體驗一下國產(chǎn)模型的魅力,我在蘋果手機(jī)上部署了DeepSeek-R1 1.5B版,詳細(xì)步驟如下2025-03-01- 我們之前分享了很多DeepSeek安裝及本地部署教程,今天我們來看看怎么馴化DeepSeek為自己服務(wù),下面我們就來看看DeepSeek 7天指導(dǎo)手冊2025-02-21
手機(jī)端本地部署 Deepseek +桌面端 Deepseek 搭建知識庫指南
關(guān)于 Deepseek,這段時間也傳來不少新聞,本文將介紹如何在安卓手機(jī)和桌面設(shè)備上分別部署本地運行的 Deepseek R1 模型,并搭建知識庫,詳細(xì)如下文2025-02-21DeepSeek-R1 與 AnythingLLM 安裝部署本地知識庫詳細(xì)教程
DeepSeek R1是目前最火的大模型,近來有很多朋友問怎么搭建DeepSeek 本地知識庫,在這里分享一種使用DeepSeek + AnythingLLM快速搭建本地知識庫的方法,完全本地化,懶人必2025-02-20DeepSeek怎么獲取官方API? 一文教會你獲取DeepSeek官方API技巧
想要體驗DeepSeek,該怎么貨期官方API呢?下面我們就來看看獲取DeepSeek官方API的詳細(xì)圖文教程2025-02-12DeepSeek怎么一秒生成工作表目錄? DeepSeek辦公自動化的技巧
面對日益增長的數(shù)據(jù)量和復(fù)雜多變的業(yè)務(wù)需求,傳統(tǒng)的Excel操作方式在效率和靈活性上逐漸顯露出不足,如果接入DeepSeek就可以補足缺陷,詳細(xì)請看下文介紹2025-02-12DeepSeek入門必備技巧與隱藏功能! DeepSeek新手使用指南
幾乎一夜之間,所有人都在關(guān)注DeepSeek,今天就來聊一聊DeepSeek,從什么是DeepSeek開始,到火爆原因,怎么下載使用,以及使用場合和隱藏功能分享,詳細(xì)如下2025-02-12DeepSeek卡頓延遲問題怎么解決? 流暢使用DeepSeek的方法大全
由于deepseek人氣越來越高,讓越來越多人開始使用deepseek,另一方面由于前陣子登錄熱搜的外網(wǎng)網(wǎng)絡(luò)攻擊,導(dǎo)致用戶在使用時常常還沒說幾句話,就出現(xiàn)服務(wù)器繁忙字樣,或使用2025-02-12