Skip to content

Latest commit

 

History

History
86 lines (56 loc) · 4.26 KB

README.md

File metadata and controls

86 lines (56 loc) · 4.26 KB

M5Unified_StackChan_ChatGPT

「ChatGPT API搭載AIスタックチャン」です。

画像1

これは @mongonta555 さんのスタックチャン M5GoBottom版組み立てキットに対応したスタックチャンファームです。

HOYA社が提供するVoiceText Web APIサービスを使った音声合成(TTS)を使用しています。
VoiceText TTSは、kghrlaboさんのesp32_text_to_speechを参考にさせていただきました。
オリジナルはこちら。
esp32_text_to_speech https://github.com/kghrlabo/esp32_text_to_speech


M5GoBottom版スタックチャン本体を作るのに必要な物、及び作り方

こちらを参照してください。

プログラムをビルドするのに必要な物

使用しているライブラリ等は"platformio.ini"を参照してください。


WiFiの設定

  • M5Unified_StackChan_ChatGPT.inoの18行目付近、SSIDとPASSWORDを設定してください。

サーボモーターを使用するGPIO番号の設定

  • M5Unified_StackChan_ChatGPT.inoの26行目付近、サーボモーターを使用するGPIO番号を設定してください。

ChatGPTのAPIキーの設定

ChatGPTのAPIキー取得方法は以下の通りです。(詳細はこのページ一番下のリンクを参照してください。)

  • OpenAIのウェブサイトにアクセスして、アカウントを作成します。メールアドレスと携帯電話番号が必要です。
  • アカウント作成後、APIキーを発行します。APIキーは有料ですが、無料期間やクレジットがあります。
  • APIキーを取得したら、M5Unified_StackChan_ChatGPT.inoの107行目付近、YOUR_API_KEYを設定してください。
    画像4

VoiceText Wev API api キーの設定

  • AudioFileSourceVoiceTextStream.cppの30行目付近、YOUR_TSS_API_KEYを設定してください。
    APIキーは、ここの「無料利用登録」から申請すれば、メールで送られて来ます。
  • TTSのパラメータの詳細はこちらを参照してください。
    [VoiceText Web API API マニュアル]


使い方

  • 音声認識プログラムは別途ユーザーが用意する必要があります。
    音声認識プログラムからこのようにhttpコマンドでテキスト(UTF-8)を渡します。
    (テキストはURLエンコードして渡してください。)

    http://XXX.XXX.XXX.XXX/chat?text=こんにちは

    XXX.XXX.XXX.XXXの部分は起動時に表示されるM5StackのIPアドレスに置き換えてください。

  • 上記と同様にしてブラウザを使ってアクセスすることも出来ます。

    画像2

  • 私は音声認識にiPhoneのショートカット機能を使っています。
    このように簡単に音声認識が使えます。

    画像3

  • M5Unified_StackChan_ChatGPT.inoの181行目付近、を修正するとAIのキャラクターを設定出来ます。

  • M5Stack Core2の画面中央付近にタッチするとスタックチャンの首振りを止められます。

  • M5Stack Core2のボタンCを押すと、音声合成のテストが出来ます。

  • 【注意】会話の履歴を保存する機能はありません。


ChatGPTのAPIキー取得の参考リンク

ChatGPTのキャラクター設定の参考リンク