45 秒AI 转录 34 分钟 4K 视频: 苹果 Speech 技术力压群雄

  • 2025-06-21 07:10:31
  • 109

IT之家6月18日消息,科技媒体macstories昨日(6月17日)发布博文,通过一段长达34分钟,7GB的视频文件实测,发现苹果全新的SpeechAPI仅用45秒完成,比OpenAIWhisper(101秒)快55%。

IT之家注:苹果公司在WWDC2025全球开发者大会上,宣布推出全新的Speech框架,其中包含SpeechAnalyzer和SpeechTranscriber两款模组。

该媒体实测了基于上述模组开发的Yap应用工具,发现转录处理一段34分钟、7GB的4K视频,只需要45秒,远超竞品MacWhisper(基于OpenAI的Whisper开源语音转录模型)的1分41秒。

该媒体进一步对比Yap与MacWhisper、VidCap等主流工具的表现:

Yap:45秒完成转录,输出SRT及TXT格式文件;

MacWhisper(V3Turbo):1分41秒;

VidCap:1分55秒;

MacWhisper(V2):3分55秒。

该媒体指出尽管所有工具在专有名词识别(如“AppStories”)存在误差,但Yap的本地化运算,让其速度优势显著,以每周处理多段视频计算,累计节省时间效益可观。