同じデバッグを両者にやらせてみたら、Claude Sonnet 4.6の方がうまくやった。GPT-5.3-Codexは目の前の問題を解決しようと熱中してしまい、広い視野にたてばもっと簡単な解決方法があるのを見つけられない。Claude Sonnet 4.6はそれができる。
LLMに使われるtransformerはネットワークの幅で一度に処理できるtoken数(≒語数)が決まる。これを超える過去の文章は忘れてしまう。Claudeでは、今の文脈を少ないtoken数で覚えておけるように一時的に要約してそれを後から参照できるように作られている。そのため、かなり過去の文章でも覚えておいてくれる。つまり広い視野を持てるという訳だ。その差が出た。
0 件のコメント:
コメントを投稿