2023年11月6日にOpenAIが開発者向けのイベントであるOpenAI DevDayを開催しました。当イベントでは、ChatGPTに関する新たな機能やサービスが多く発表されました。今回はその発表内容について解説していきます。
OpenAI最新言語モデル GPT-4 Turboをリリース
3月にGPT-4の最初のバージョンがリリースされ、7月にはすべての開発者が GPT-4 を一般利用できるようになりました。このモデルの次世代モデルであるGPT-4 Turboのリリースが発表されました。
現在は、gpt-4-1106-preview
というモデル名でプレビューモデルが利用可能となっています。安定した実稼働対応モデルも今後数週間以内にリリースする予定です。
なお、プレビューモデルは、RPMやRPDに制限があるためご注意ください。
従来のGPT-4モデルとの大きな違いは以下になります。
2023年4月までの情報に対応
GPT-4 Turboは、2023年4月までのデータへアクセスが可能となり、より高性能になりました。従来の2021年9月までのトレーニングデータに比べると、生成内容にも大きな影響がありそうですね。
128kのコンテキスト ウィンドウに拡大
GPT-4 Turboは、コンテキスト ウィンドウが長くなり128,000トークンまでサポートされるようになりました。1つのプロンプトに300ページ以上のテキストを収めることができます。
Function callingの精度向上
複数関数処理も可能となり、聖徳太子のように並列で関数を処理しレスポンスを返してくれます。
また、適切な機能パラメータを返す可能性が高くなり、フォーマットの指示に忠実なタスク(特定のフォーマット生成など)をおこなってくれるように改善されました。それとは別に、JSON形式での出力にも対応しました。
価格の引き下げとレート制限の引き上げ
ユーザーから要望に応え、有料GPT-4顧客のトークン利用可能数を従来のGPT-4に比べると、入力トークンで3倍、出力トークンで2倍に増加しました。合計で2~3倍安く利用ができるようになりました。
また、1分間あたりに処理できるトークン数(TPM)が倍になりました。
APIの新モダリティが発表|画像入力・画像生成・音声合成
今回のイベントで、以下の3つのモデルのAPIが発表されました。
個人的に、今回のイベントで一番嬉しい発表でした。
視覚能力が追加!GPT-4 Turbo with vision
GPT-4 Turbo with vision では、入力された画像の詳細な分析、図のある文書の読み取りなどのさまざまなケースに対応します。BeMyEyes はこの技術を利用して、店内ナビゲートや商品識別のサポートで視覚障害者の日常業務を支援します。
このあと紹介する、音声生成機能と組み合わせたスポーツ中継のAI実況など、今後の活用が楽しみの機能です。
画像生成 DALL·E 3
画像生成AIの最新モデル DALL·E 3 の提供が発表されました。開発者は、dall-e-3
のモデルを指定することで、最近ChatGPT PlusとEnterpriseユーザーに提供を開始したDALL-E 3を、APIを通じてアプリや製品に直接統合することができます。Snap、Coca-Cola、Shutterstockなどの企業が、DALL-E 3を使用して、顧客やキャンペーン用の画像やデザインを生成しています。
音声合成 Text-to-speech (TTS)
音声合成APIを介してテキストから人間品質の音声を生成できるText-to-speech (TTS)が発表されました。6つのプリセット音声と2つのモデルバリアント(tts-1とtts-1-hd)から選択でき、テキストをリアルタイムで自然な音声に変換します。
詳しくは、TTSガイドをご覧ください。
GPT-4ファインチューニング開始
GPT-3.5に続き、GPT-4でもファインチューニングが可能になります。
カスタムモデルプログラム
ファインチューニング以上のカスタマイズを必要とする組織に向けてカスタムモデルプログラムを開始します。
選ばれた組織は、OpenAIの研究者チームと協力して特定分野に特化したカスタムGPT-4をトレーニングする機会を得ることができ、組織はカスタムモデルへの独占的アクセス権を持つことになります。カスタムモデルは他の顧客と共有されたり、他のモデルのトレーニングに使用されたりしないため、セキュリティ面にも配慮されています。
GPTsのリリース
自分自身でオリジナルなGPTを作成することができるGPTsがリリースされました。ユーザーは、一般的なチャットに加えて、追加知識の提供、ウェブ検索、画像作成、データ分析などのスキルを選ぶことができます。
ChatGPTのカスタムバージョンを手軽に作成することができ、それを共有することができるようになります。そのためコーディングの知識などは一切不要です。
企業内でのGPTsの導入
ChatGPT Enterpriseユーザーの企業では、社内のユーザーがコードなしで社内専用のGPTを設計し、ワークスペースに安全に公開できるようになりました。また、管理コンソールを通じて、GPTsの共有方法を選択し、ビジネス内での外部GPTsの使用を管理することも可能です。
GPTsとリアルワールドの接続
GPTsは、組み込み機能を使用することに加えて、APIを利用することでカスタムアクションを定義することも可能です。GPTsを通じて、データベースやEメール、Eコマース注文などに接続し、リアルタスクに取り組むこともできるようになります。
GPT Storeが月末オープン
AI版App storeのような存在になりそうなGPT storeが今月末にリリースされるようです。
開発者は自身で構築したGPTをリリースすることができるようになります。
公開されたGPTsは検索可能で、高い評価を受ければ検索ボードの上位に表示される可能性もあります。また、ここから収益を得ることができます。今後、多くのユーザーがGPTsでオリジナルGPTを作成し、公開することでしょう。
Assistants APIのリリース
こちらは開発者向けになりますが、自身のアプリケーション内でAIアシスタントを追加できる、Assistants API もリリースされました。
自然言語ベースのデータ分析アプリやコーディングアシスタントなど多岐の用途での活躍が期待できます。また、コンテキストウィンドウの制約を回避できるようになり、制限なく力を発揮してくれることでしょう。
まとめ
Zapierを用いてカレンダーツールやコミュニケーションツールと連携したデモも発表されていたりと、今後、様々なサービスがchatGPTと連動して、より一層AIの発展が期待できそうです。また、著作権問題についてOpenAIが企業を保護することについても言及があり、企業への導入も検討されるかと思います。
衝撃的な発表でしたが、まだまだAIやchatGPTでは補えない部分もあります。今後、増えるであろうGPTsによって作成されたオリジナルGPTでは、手の届かないところにアプローチしていきたいですね。