2026-2-20
ということを最近よく考える。
実際そんな日が実際に来るのかは分からないが、AI の進化の速度が凄まじく、特に Opus4.6, GPT-5.3-Codex あたりで完全に潮目が変わったと感じる。
自分は近い将来、確実にプログラミング、という世界から足を洗うんだろうなという感覚が結構現実のものになってきた。
もちろん、コードを書くのは好きだし、プログラミングも好きだし、AI の生成するコードに対して100%納得のいくことは上記のフロンティアモデルをもってしてもあったりなかったりまちまちではあるが、結局それは個人の好みの話に収斂していって、ソースコードなんてのは AI が読めればいい、という世界になっていくんじゃないだろうか。
事実、最新のモデルを使った Coding Agent の自走力は凄まじく、まだ扱えるコンテキストも大きくなったのもあって1発で少なくとも製品版として7割程度(場合によっては8割超える)の満足度のある成果物が仕上がってくることは増えたし、それに伴い、そこそこのサイズの Pull Request を出す頻度が増えた。自分は昔から手が早い方なので1日で4,5 個の PR を作れる日もある。今までだったら考えられないなと思う。これにより、人間によるレビューが今完全にボトルネックになってる状態に来ている。少なくとも自分の周りではそうだし、自分もそうだと感じている。
「人間はコードを書かなくなるが、まだ読むことがある。成果物のレビューも必要なのでプログラミング、コンピューターサイエンスの基礎体力は大事」と1年前くらいには言われてたし、自分もそこには同意だった。ただ、今年の年明けに出たモデルがその景色を完全に変えたと思う。まず絶対的なレビューの物量というものが段違いになったので、通常業務をしながらレビューに対応するのはかなり難しくなってきた。人間が可能なレビューの範囲をそもそもの物量が超えている。無理は持続しないので、この「見る」というフェーズについても何かしらの自動化ないし、AIの目を入れないと成立しなくなっている。サボるわけではなく、品質を落とすわけでもなく、負荷を下げる仕組みというのが必要になってきている。
ここに対して自分が最近考えているのは、AI の出力は非決定的で確率的な挙動をする、という前提に立って「いかに AI に考えさせないで出力を得るか?」という点である。ここに対して人間が用意できるものとして 「静的解析(Linter)」「自動生成」「テスト」といった確率的挙動を許さないガードレールなんだと思う。
どういうことかというと、Linter も自動生成もルールベースで出力を得るので、AI は考えることがない。ただスクリプトを実行すれば終わりで、出力は常に一定になる。Linter も引っかかったところは AI に修正させる。直し方がルールベースなので、これも出力にブレはなくなる。次にテストも仕様書なり、ユースケースを渡すことで、実装とは独立してテストケースを用意してそのテストケースをパスするように実装させる。人間が守るのはコードの品質ではなくテストの品質になる。だからこそコードレビューじゃなくてテストレビューや開発ワークフローのレビューが必要になる、という類のことである。
正しいかはわからないが、自分が考えていたこのへんの考え方は直近だと「ハーネスエンジニアリング」というらしい。もともとは馬をコントロールするための道具としてのハーネスから来ていて、電子回路などの分野で使われていた「ハーネスエンジニアリング」という単語だが、AI 分野でも用いられるようになってきていたらしい。
人間がやることはこのハーネスを作り続け、「どう走るか」をコントロールする、また「どこに向かって走るか」を考える、そういうところに進化していくんじゃないかと思う。
もちろん僕の今の予想が全く外れるかもしれないし、AI の世界は日々そういうことが起こっている。しかしあと数年はコードを読むことが必要だなとふわっと考えていたのは完全に正常性バイアスで、現実的には来年にもコードを読まなくなる日が来てもおかしくはない、というところまで進歩していると思う。
せち辛い話だなと思う。
この記事をシェアする