基本的な使い方
OS の任意のテキスト入力欄にカーソルを置き、録音ホットキー(既定 Ctrl+Shift+R)を押して話します。録音を停止すると音声が文字起こしされ、自動ペーストが有効ならそのまま入力欄に貼り付けられます。
よく誤変換される語句は「設定 → 辞書」で登録しておくと置換できます。
ローカル処理(クラウド不要)
HootVoice の音声認識は、端末上(ローカル)で完結します。音声データを外部サーバに送信しません。
- プライバシー: 会議内容や機密情報がクラウドに送られません。
- 速度安定: ネットワーク待ち時間の影響を受けず、CPU/GPU の性能に依存して高速に動作します。
- コスト: API 利用料は不要です(無料で利用可能)。
- ネットワーク使用について: 初回に Whisper モデルをダウンロードする場合のみ通信します。オフライン環境でも、あらかじめ
models/にモデルを配置しておけば利用できます。
クイックスタート
- Windows:
hootvoice.exeを実行 - macOS/Linux:
./hootvoiceを実行(配布物のdist/からでも可)
初回起動時、選択中の Whisper モデルがユーザー設定ディレクトリに自動ダウンロードされます(既定 Large‑v3 約 3.1GB)。モデルは「設定 → 音声モデル」で変更できます。
Whisper モデルおよび ggml 変換版は OpenAI によって MIT License で提供されています。ダウンロードしたモデルを再配布する場合は、Whisper リポジトリのライセンス表記 を必ず確認してください。
既定操作:
- 録音トグル: Ctrl+Shift+R(設定 → 一般 で変更可)
- Linux/macOS:
SIGUSR1で録音トグル、SIGUSR2で設定表示
フローティングツールバー
常時前面に小さなウィンドウが表示され、状態表示と録音/停止ボタン、設定ボタン、ドラッグ用グリップを備えます。
- 状態: 待機(○)/ 録音(● 赤)/ 処理中(● 黄)
- Wayland:
wayland_layer機能でサイドカー(hootvoice-float)が layer‑shell で動作します(パネルのような振る舞い)。
ヒント: 設定画面から「フローティング表示」に切り替えられます。
設定
ツールバーの「設定」または起動直後に開くウィンドウから操作します。主なタブ:
- 一般
- 録音ホットキー、UI 言語、自動ペーストの ON/OFF
- フローティング表示に切替 / モデル/辞書フォルダを開く
- デバイス
- 入力デバイス/ホスト、出力デバイスの選択
- 入力レベルメーター、感度(ゲイン)
- テスト録音でマイク動作を確認
- 音声モデル
- プリセット(Tiny/Base/Small/Medium/Large‑v3)と品質/速度の目安
- 選択モデルのダウンロード/適用、モデルフォルダの確認
- 辞書
- 標準形、別名、適用条件(Include)で語句置換を定義
- 検索、追加/編集/削除、適用ボタンで反映
- ログ
- 録音/処理/コピー/ペーストなどのログを時刻付きで表示
変更は自動保存されます。モデル/辞書は「適用」ボタンでコアに反映します。
LLM 後処理
設定ウィンドウの「LLM」タブで「LLM による後処理を有効化」をオンにすると、Whisper の文字起こし結果をローカルの LLM に送り、整形・敬体化・要約などを自動で適用できます。
- API ベース URL とモデル名は利用するサーバー(Ollama / LM Studio など)に合わせて指定します。
- プリセットプロンプト(整形/要約)やカスタムプロンプトを選択して、用途に合わせた変換を実行できます。
- エラー時は Whisper の原文にフォールバックし、ログに詳細が残ります。
詳しいセットアップ手順や推奨モデルは LLM 後処理セットアップガイド を確認してください。
録音の流れ
- ホットキーまたはツールバーで録音開始
- 話す(経過時間とレベルが表示)
- 停止で音声認識を実行
- 結果をクリップボードにコピーし、(有効なら)前面アプリへ自動ペースト
注意:
- macOS の自動ペーストにはアクセシビリティ+オートメーション権限が必要
- Linux の自動ペーストには Wayland:
wtype/X11:xdotoolが必要(無い場合はコピーのみ)
ヒント
- 低スペック環境では Tiny〜Small など軽量モデルを選ぶと高速
- Linux/Windows は Vulkan による GPU アクセラレーションで大幅に高速化(ランタイム/ドライバと
glslcを導入) - macOS は Metal/Core ML が自動で使用されます
トラブルシューティング
- macOS の自動ペーストが効かない
- システム設定 → プライバシーとセキュリティ
- アクセビリティ: “HootVoice” を許可
- オートメーション: “HootVoice” → “System Events” を許可
- Linux で自動ペーストが無反応
- Wayland は
wtype、X11 はxdotoolを導入。未導入時はコピーのみ。
- Wayland は
- Linux の Vulkan ビルド/実行で問題
glslc libvulkan-dev vulkan-tools mesa-vulkan-driversを導入(Ubuntu 24.04 例)し、vulkaninfoで確認
- マイクが表示されない
aplay -l/arecord -lとオーディオサーバの設定を確認
アップデート
最新リリースを公式サイトや配布ページからダウンロードし、既存のアプリケーションに上書きしてください。設定やモデルはユーザーデータディレクトリに残るため再設定は不要です。現在自動アップデート機能はありません。
アンインストール
アプリ本体を削除し、必要ならユーザーデータも削除してモデル容量を解放:
- Linux:
~/.config/HootVoice - macOS:
~/Library/Application Support/HootVoice - Windows:
%APPDATA%\HootVoice
上級者向け
- Waybar 連携
- ステータスを OS 標準の設定ディレクトリ(例:
~/.config/HootVoice/status.json)に出力 - Waybar のカスタムモジュールで定期的に読み込む構成が可能
- ステータスを OS 標準の設定ディレクトリ(例:
HootVoice で、より快適な音声入力を!