>_tech-draft
Mastra AIのアイコン
Mastra AI
動画公開日
タイトル

Harness Engineering: How OpenAI Builds Apps Without Writing a Line of Code — Neel Rao, OpenAI

再生時間

13分 44秒

OpenAI Codexで進化するAI開発最前線:ハーネスエンジニアリングと最新機能

ポイント

  • OpenAI CodexはAIコーディングを「エージェントによる全自動委任」へと進化させ、開発者がコードを一切書かずに開発するハーネスエンジニアリングを可能にします。
  • Codexの最新モデルとネイティブアプリは、コード生成だけでなくChrome DevToolsとの連携によるデバッグ自動化を実現し、開発プロセスを革新します。
  • プラグインによる機能統合や、バグチェック・マージコンフリクト解決のオートメーションにより、開発者の生産性とワークフローが大幅に向上します。

はじめに: AIコーディングの急速な進化

皆さん、こんにちは。OpenAIのエンジニアであるニールです。本日は、OpenAI Codexを活用した開発についてお話しいたします。AIコーディングはここ数ヶ月で目覚ましい進化を遂げており、その最前線で何が起こっているのか、そして新しい機能についてご紹介します。

近年、AIによるコード生成は単なる補完ツールから、開発ワークフロー全体を変革するエージェントへと進化しています。この記事では、Codexの最新アップデート、ハーネスエンジニアリングという新たな開発パラダイム、そしてプラグインやオートメーションといった新機能について詳しく解説していきます。

AIコーディングの急速な進化とOpenAI Codexの最新動向

この数ヶ月間で、AIコーディングの世界はまさに目まぐるしく変化しています。私たちが直面しているのは、単なる補助ツールとしてのAIではなく、開発プロセス全体を再定義する強力なパートナーとしてのAIです。

Codexモデルの進化とネイティブアプリの登場

OpenAIでは、この急速な変化に対応するため、Codexモデルを継続的に進化させてきました。

  • Codex 5.3モデル: 今年の2月にリリースされたこのモデルは、コーディング能力が大幅に向上し、より高速な処理が可能になりました。
  • Codexネイティブアプリ: 同時期にリリースされ、開発ワークフローを格段にスムーズにするこのアプリは、意外にも最も利用されているCodexのインターフェースとなっています。私自身は当初CLI(コマンドラインインターフェース)派でしたが、チームメンバーがアプリを使い始めるのを見て、その利便性に驚き、今では広く使われています。ぜひお試しいただくことをお勧めします。
  • GPT 5.4モデル: 先月リリースされたGPT 5.4は、私個人の「デイリードライバー」とも呼べるお気に入りのモデルです。特に「ファストモード」は、トークンを可能な限り迅速に出力したい場合に非常に役立ちます。

AIコーディングパラダイムの変化:エージェントによる自動化

AIコーディングのあり方も大きく変化しています。初期の「タブ補完」から始まり、その後はコードを記述しながらAIと対話する「ペアプログラミング」の段階へと移行しました。

そして現在、私たちは**エージェントによる全自動委任(Agentic Delegation)**のフェーズに突入しています。これは、AIエージェントに機能全体を構築するよう指示し、開発者はその間に別の作業を行う、といったことが可能になることを意味します。作業に戻ると、期待通りに機能が完成している、という状況が現実のものとなりつつあります。

このような変化に対応するため、開発者は既存のコードベースをどのように適応させるべきかを考える必要があります。さらに、これらのAIモデルはコード生成だけでなく、Open Clawのような非コーディング環境のエージェントにも利用されており、さまざまなシステムにプラグインしてコンテキストから学習する「ウィジェット」のような存在へと進化しています。

ハーネスエンジニアリングとは?AIエージェントを最大限に活用する戦略

昨年は「コンテキストエンジニアリング」について多くの議論がありましたが、現在はハーネスエンジニアリングという概念が注目されています。これは、エージェントのインフラ全体に着目し、その生産性を最大化するための戦略です。

ハーネスエンジニアリングの定義と目的

ハーネスエンジニアリングとは、AIエージェントが持つツール、接続可能なアプリケーション、メモリ管理の方法、そしてこれらをどのように組み合わせてエージェントの能力と生産性を向上させるか、というインフラ全体を設計する考え方を指します。

OpenAIチームの実践事例:コードを一切書かない開発

OpenAIの社内には、「手書きで一行のコードも書かない」という制約を自らに課したチームがあります。彼らはCodexのみを使い、その制約の中で何が可能かを探求しました。これにより、アプリケーションのアーキテクチャやセットアップについて根本から考える必要が生じました。

CodexとChrome DevToolsの連携によるデバッグ自動化

このチームは、社内Webアプリケーションを開発する際に、CodexをChrome DevToolsに接続するワークフローを構築しました。これにより、Codexは次のようなエンジニアの通常のデバッグ作業を自動的に実行できます。

  1. Chrome上で機能を起動する。
  2. Chromeのコンソールログを確認する。
  3. スナップショットを取得し、モデルにフィードバックする。
  4. 問題が解決するまでこのプロセスをループする。

これは、通常エンジニアが手動で行うデバッグ作業を、Codexに完全に委ねることを可能にする画期的なアプローチです。

サンドボックス環境での複数エージェント並行開発

デバッグの自動化にとどまらず、理想的にはアプリケーションのインフラ全体を分離されたサンドボックス環境(例えば、ワークツリーやローカルブランチ)で実行できるようになります。これにより、複数のエージェントが同時に複数の機能を開発し、並行してデバッグできるようになります。

例えば、Codexに監視スタック(すべてのログやメトリクス)へのアクセス権を与えれば、エージェントは新しい機能を実装し、そのためのインフラをセットアップし、ログを参照しながらデバッグすることができます。このような分離された環境では、各機能のログが他の機能に干渉することなく、複数の開発を同時に進行させることが可能です。問題が解決し、機能が構築されるまで、このプロセスをループ実行できます。

エージェントに「すべて」を見せる重要性

この開発アプローチで最も重要なのは、「エージェントにすべてを見せる」ことです。もしチームメイトとのSlackでの会話やホワイトボードでの議論がエージェントにアクセスできない場合、エージェントの視点からはそれらは存在しないことになります。エージェントが機能を構築するために必要な、会話や技術的な議論を含むあらゆる情報へのアクセスを提供する必要があります。

ご自身のコードベースでハーネスエンジニアリングをどのように適用すれば良いか分からない場合でも、Codexに助けを求めることができます。例えば、「Codex、ハーネスエンジニアリングに関するこのブログ記事を読み、私のコードベースを分析して、開発を容易にするためにどのような変更を加えるべきか教えてください」と指示することが可能です。最終的には、インフラ全体が稼働し、複数のエージェントに委任してアプリケーション内で構築を開始できる状態を目指します。

OpenAI Codexの新機能:プラグインとオートメーション

Codexは、開発者の生産性をさらに向上させるための新たな機能として、プラグインとオートメーションを導入しました。

プラグインの登場:スキルとアプリの統合

プラグインは、従来の「スキル」と「アプリ」の進化版であり、これらを一つの使いやすいプラットフォームに統合したものです。例えば、Google Driveプラグインは、Google Driveへのコネクタと、Google Driveを使用するために必要なすべてのスキル(ドキュメント、実行スクリプト、MCPサーバーなど)を組み合わせて提供します。これにより、複数のシステムを設定することなく、すぐに機能を使い始めることができます。

また、独自のプラグインを構築することも可能です。便利な「プラグインクリエータープラグイン」が用意されており、プラグインの骨組みを作成したり、チーム内で共有するためのマーケットプレイスを構築したりするのに役立ちます。

オートメーション機能:定期的なタスクの自動実行

オートメーション機能は、Codexプロンプトをcronジョブとして実行できるようにするものです。これにより、特定のタスクを定期的に自動実行することが可能になります。

現時点では、この機能をどのように活用すれば最も効果的かについて、まだ探求が進められている段階ですが、いくつかの魅力的な活用例が考えられます。

  • バグの自動チェックと修正: 「1時間ごとに最近のコミットをチェックし、バグがないか確認して、もしあればSlackで通知するか、修正してください」といった指示が可能です。
  • マージコンフリクトの自動解決: 私個人が非常に煩わしいと感じるマージコンフリクトについても、「定期的に開いているPRをチェックし、マージコンフリクトがあればリベースして修正してください」とCodexに指示できます。これにより、PRをマージしようとした時には既にコンフリクトが解決されており、スムーズな開発が可能になります。

まとめ

本日は、OpenAI Codexの最新動向、特にAIコーディングの急速な進化と、ハーネスエンジニアリングという新たな開発パラダイムについてご紹介しました。AIエージェントにインフラ全体を委ね、コードを一切書かずに開発を進める事例、そしてプラグインやオートメーションといった新機能が、開発者の働き方を大きく変えようとしています。

ハーネスエンジニアリングの考え方を取り入れ、エージェントに適切な情報と環境を提供することで、私たちはより効率的で革新的なソフトウェア開発を実現できるでしょう。AIと共に進化する開発の未来に、ぜひご期待ください。


参考動画

Building with Codex - Neil (OpenAI)