コンテンツにスキップ

Gemini API 連携

Ayumi は Google Gemini API を使って音声からテキストへの文字起こしを行います。自分の API キーを使う BYOK(Bring Your Own Key)方式なので、コストと使用量を完全にコントロールできます。

  1. Google AI Studio にアクセス
  2. Google アカウントでサインイン
  3. API キーのセクションに移動
  4. 新しい API キーを作成
  5. キーをコピー
  1. Ayumi > 設定(または Cmd+,)を開く
  2. 文字起こし タブに移動
  3. Gemini API キーを貼り付け
  4. お好みのモデルを選択
  1. 文字起こし設定を開く
  2. Gemini API キーを入力
  3. モデルを選択

API キーはデバイスの Keychain に安全に保存されます。

モデル説明
gemini-2.5-flash高速で高性能、速度と品質のバランスが良い
gemini-2.5-flash-lite軽量モデル、より高速な処理
gemini-3-flash-preview最新のプレビューモデル
カスタム任意の Gemini モデル ID を入力可能

カスタムプロンプトプリセット

Section titled “カスタムプロンプトプリセット”

音声の文字起こしと分析方法をカスタマイズするプロンプトを作成できます:

  1. 文字起こし設定に移動
  2. プリセット追加 をタップ
  3. 名前を付けてプロンプトの指示を記述
  4. 必要に応じて特定のモデルを選択
  5. 保存

カスタムプリセットは録音ビューで組み込みオプションと一緒に表示されます。

Gemini API 使用時:

  • 音声データは処理のために Google のサーバーに送信されます
  • Ayumi は最初の API 呼び出し前に同意ダイアログを表示します
  • Ayumi のサーバーにはデータは保存されません — API 呼び出しはデバイスから Google に直接行われます
  • Google の API データ取り扱いについては Google AI の利用規約 をご確認ください