toriR blog
【AI勉強会】ChatGPTの新機能とビジネス活用/2024年への展望 に参加してきました
昨日、chatGPTの勉強会に参加しました。学んだなのは、chatGPTのカスタム化が思いの外簡単だったこと。my GPTでカスタム化できるので設定してみたい。マルチモーダルAIの触れ込みですが、まだ、音声・画像・触覚・テキストなど入出力なるようですが、現在のchatGPTはまだエンジンが別なので、統合までには時間がかかるとのこと(といっても来年には実現?)。また、YOLOの画像認識もかなり使えるようで、野鳥のスペクトログラムの音素抽出できるか試してみたい。開催概要
- 開催時間:2023-12-19(火)18:00 - 20:00 JST
- 定員:(会場参加のみ) 15名
- 会場: 福井県産業情報センター 1階 ふくいDXオープンラボ
- 主催: (公財)ふくい産業支援センター ふくいDXオープンラボ
- ハッシュタグ:#fukuidxlab
登壇者紹介
伊本 貴士 氏 Takashi Imoto
メディアスケッチ株式会社 代表取締役、サイバー大学 准教授
内容(案内より)
- ふくい産業支援センター/ふくいDXオープンラボでは、定期的にChatGPTをはじめとしたAI技術についてのビジネス活用を支援するためのAI勉強会を開催しています。今回は、最近バージョンアップしたChatGPTの新機能についてご紹介するとともに、今後の展望についてもお話しします。 少数の勉強会ですので、和気あいあいな雰囲気で進めていければと思っています。
<主なコンテンツ>
画像認識および音声認識の活用
プログラム連携と業務のスマート化
ChatGPTカスタマイズ機能の利用
詳細
- chatGPTがマルチモーダルになった(テキスト、音声、画像)
東尋坊の写真を4K高画質、高精細でプロが撮影したような綺麗な写真で夕日の画像を生成してください。→図1
- 動画生成がだいぶできるようになってきたが、商用利用は画質がまだまだ。伊藤園のコマーシャルは人でで補正が多く入っているのではないかとのこと。
- マルチモーダルAI(音声・画像・触覚)は2025年の予想が今年出てきた。
- マルチモーダルといってもモーダル毎にエンジンが異なるので、真に統合しているわけではない。
- chatGPTの画像認識はモノはかなりわかっている。APIで呼び出すと人間の補助にはなる。
- 画像認識の精度改善YOLO(V7)が30枚で高精度に認識する。
- OPENPOSEは姿勢をうまく検知してくれる。
音声認識
- 音声からテキストもテキストから音声もAPIを通じて行える。その方法もchatGPTに聞けばいい。
カスタムGPT
- New GPTでカスタマイズできる。いろいろ属性を付加すると、カスタマイズしてくれる。
- 厚労省とかにサイトを限定して、引用も必ず出せるようにできる。
データ分析
- データをexcelで入力させて、テキスト指示でデータ解析してくれる。その解析はpythonコードを内部に持っていて、それを見ることもできる。データ分析にコードを書く必要が少なくなる。
得意な分野
- FIREWALLのチェックや設定を作るのが得意。
- logの監視させて攻撃の傾向を得るとか。
以上