IT之家 6 月 18 日消息,科技媒體 macstories 昨日(6 月 17 日)發(fā)布博文,通過一段長達(dá) 34 分鐘,7GB 的視頻文件實(shí)測,發(fā)現(xiàn)蘋果全新的 Speech API 僅用 45 秒完成,比 OpenAI Whisper(101 秒)快 55%。

IT之家注:蘋果公司在 WWDC 2025 全球開發(fā)者大會上,宣布推出全新的 Speech 框架,其中包含 SpeechAnalyzer 和 SpeechTranscriber 兩款模組。

該媒體實(shí)測了基于上述模組開發(fā)的 Yap 應(yīng)用工具,發(fā)現(xiàn)轉(zhuǎn)錄處理一段 34 分鐘、7GB 的 4K 視頻,只需要 45 秒,遠(yuǎn)超競品 MacWhisper(基于 OpenAI 的 Whisper 開源語音轉(zhuǎn)錄模型)的 1 分 41 秒。

該媒體進(jìn)一步對比 Yap 與 MacWhisper、VidCap 等主流工具的表現(xiàn):

Yap:45 秒完成轉(zhuǎn)錄,輸出 SRT 及 TXT 格式文件;

MacWhisper(V3 Turbo):1 分 41 秒;

VidCap:1 分 55 秒;

MacWhisper(V2):3 分 55 秒。

該媒體指出盡管所有工具在專有名詞識別(如“AppStories”)存在誤差,但 Yap 的本地化運(yùn)算,讓其速度優(yōu)勢顯著,以每周處理多段視頻計(jì)算,累計(jì)節(jié)省時(shí)間效益可觀。

標(biāo)題:45秒AI轉(zhuǎn)錄34分鐘4K視頻:蘋果Speech技術(shù)力壓群雄

地址:http://liuxuerexian.com/zixun/268193.html