Categories Troubleshooting

Apple Intelligenceのデバイス内文字起こしはOpenAIのWhisperの2倍以上の速さ

Apple Intelligenceのデバイス内文字起こしはOpenAIのWhisperの2倍以上の速さ

アップルインテリジェンス

Apple Intelligenceのデバイス内文字起こし機能は、音声テキスト変換のパフォーマンスに革命をもたらし、OpenAIのWhisperモデルの2倍以上の速度を実現しています。MacStoriesが詳細に報じたハンズオンテストによると Appleの新しい音声APIは、最適化されたデバイス内処理を活用して超高速の文字起こしを実現し、音声駆動型アプリケーションの効率性と応答性の新たなベンチマークを確立しました。

MacStoriesのジョン・ボーヒーズ

これらのテクノロジーはまだ初期段階ですが、講義、ポッドキャスト、YouTube 動画などから音声文字変換を使用してテキストを作成する人にとって、そのスピードだけでも画期的なものであると私は言えます。

他のツールでイライラするのは、その遅さです。ほとんどのツールは、2022年にリリースされたOpenAIのオープンソース音声テキスト変換モデル「Whisper」をベースに構築されています…

息子のフィンに、SpeechAnalyzerとSpeechTranscriberを使って動画や音声ファイルを文字起こしするコマンドラインツールを作るにはどうすればいいか尋ねました。彼は10分くらいでできるだろうと計算し、その通りでした。結局、WWDC後にmacOS Tahoeをインストールするのにかかった時間は、フィンがYap(音声ファイルと動画ファイルを入力としてSRT形式とTXT形式の文字起こしを出力するシンプルなコマンドラインユーティリティ)を作るのにかかった時間よりも長かったです。

昨日、ついにTahoeに飛びつき、Yapをすぐにインストールしました。AppStoriesのエピソード441(約34分)の7GB 4Kビデオバージョンをダウンロードし、Yapで再生してみました。SRTファイルの生成にはわずか45秒しかかかりませんでした。

次に、同じファイルをVidCapとMacWhisperのV2 LargeとV3 Turboモデルで実行しました。各アプリとモデルの結果は次のとおりです。

Yap転写時間

この組み合わせにより、Apple プラットフォーム上の文字起こしアプリのデフォルトの文字起こしモデルとして Whisper が置き換えられると私は確信しています。

MacDailyNews の見解:同じ精度を維持しながら 2 倍以上の速度は素晴らしいです!


MacDailyNewsを応援していただき、購読者限定の記事、コメント、チャットなどをお楽しみください(macdailynews.substack.com)にご登録ください。ありがとうございます!

このリンクを使用して Amazon で買い物をすると、追加費用なしで MacDailyNews をサポートできます

[情報を教えてくれたMacDailyNews読者の「Fred Mertz」氏に感謝します。]

ロンドン警察は、盗難iPhone4万台を中国に密輸した疑いのある犯罪組織を壊滅させた。これは同組織による過去最大のiPhone窃盗事件となった。

Appleは本日、iOS 26.1、iPadOS 26.1、macOS Tahoe 26.1、tvOS 26.1、watchOS 26.1、visionOS 26.1の2番目のベータ版を開発者向けにリリースしました…

テイラー・スウィフトは最新アルバム「ザ・ライフ・オブ・ア・ショーガール」でApple Music、Spotify、Amazonのストリーミング記録を破り、歴史を築いた。

新しい Apple Watch Series 11 は、これまでで最も包括的な健康機能、より長いバッテリー寿命、さらに耐久性の高いカバーガラスなどを提供します…

SpaceX が EchoStar から 170 億ドルで取得した周波数ライセンスは、Starlink の衛星からスマートフォンへのサービスを強化することになり、…

You May Also Like

ジーン・マンスター:アップルは見た目以上に好調、中国への懸念は誇張されていた

ジーン・マンスター:アップルは見た目以上に好調、中国への懸念は誇張されていた ディープウォーターのジーン・マンスター氏が金曜日に書いた記事によると、コンセンサスを脇に置いて事業に焦点を絞ると、Appleの12月業績見通しは見た目以上に良好だ。事業は9月の1%増に対し、12月は約7%増と好調に推移している。製品の好調は健在で、アクティブデバイスのインストールベースは過去最高を記録し、「順調に」成長を

COVID-19による閉鎖で米国経済が歴史的な縮小に見舞われ、株価先物は下落

COVID-19による閉鎖で米国経済が歴史的な縮小に見舞われ、株価先物は下落 木曜日のウォール街の主要株価指数は、新型コロナウイルス感染拡大による経済活動の停止により、第2四半期の米国経済が大恐慌以来最大の縮小を記録したことをデータで確認したことを受け、下落して取引を開始する見込みとなった。第2四半期の米国GDPは、過去最大の33%の縮小となった。 労働省は、先週の新規失業保険申請件数が143万4

ガーディアン:Apple TV 4K 2022は無敵。シンプルで信頼性が高く、高品質のストリーマー

ガーディアン:Apple TV 4K 2022は無敵。シンプルで信頼性が高く、高品質のストリーマー Appleは10月、これまで以上にパワフルで、エンターテイメント性も高く、お求めやすい価格でありながら、映画のような感動的なクオリティを提供する次世代のApple TV 4Kを発表しました。より高速なパフォーマンスとよりスムーズなゲームプレイを実現するA15 Bionicチップを搭載した新しいApp

情報筋によると、プロトタイプのiPhoneのデザインはほぼ最終段階だったようだ

情報筋によると、プロトタイプのiPhoneのデザインはほぼ最終段階だったようだ 「最近発見され分解されたiPhoneのプロトタイプの全体的な外観と感触は、Appleがこの夏にリリースする次世代端末の最終出荷製品と非常によく似ているだろう」とニール・ヒューズ氏はAppleInsiderに報告している。 「Daring Fireballのジョン・グルーバー氏は、Appleの第4世代iPhoneに詳しい

廃棄されたApple Lisaがいかにして強力なコンピュータに改造されたか

廃棄されたApple Lisaがいかにして強力なコンピュータに改造されたか ジョン・マクリアランがこのApple Lisa 2/10を修復したと言っても過言ではありません。(写真:ジョン・マクリアラン) カルト・オブ・マックのデヴィッド・ピエリーニ氏: Apple Lisaコンピュータは大失敗に終わった。しかし、パーソナルコンピュータの歴史において最も重要なマシンでもあった。 ジョン・マクリアラン

アップルのiPhone 4Sは初週末に400万台を販売し、販売記録を破る見込み

アップルのiPhone 4Sは初週末に400万台を販売し、販売記録を破る見込み 「世界中の顧客がスティーブ・ジョブズ氏の下で開発された最後の製品の一つを買うために列を作った後、アップル社は今週末、新型iPhone 4Sを400万台も販売する見込みだ」とアダム・サタリアノ氏とサラ・ギル氏はブルームバーグに伝えている。 「米国、オーストラリア、カナダ、フランス、ドイツ、日本、英国で本日発売されるこのデ