2026年5月4日月曜日

Claude Mythos と言えども AGI(汎用人工知能)にはほど遠いのだろうな

昨年からClaude Sonnet/Opus を使って、その便利さに感心していた。そして限界もある。最近、彼らの限界を言葉で言えるくらいには整理できたので記録しておきたい。

何か議論しているとき、Claudeは、大元の原理原則に立ち戻った考え方ができない。ユーザーが「これこれが原理原則だからこれを考慮して」と言えばできるのだが、自発的にはできない。claude.mdやmemory.mdに原理原則を書いておくことでかなり改善するが、自らレベルを上げて思考をメタレベルへ引き上げることはしない。たとえ、インターネットにメタレベルの考え方が普通に存在していてもだ。

Opus/Mythos/その先へと改良されてゆき、context長はますます長くなり、context内のどれが重要かの優先度付けも上手になってゆくだろうが、そこまでだ。思考をメタレベルへ引き上げることはなかなかできないだろう。できるようになったとしても、インターネット上に既に存在するメタレベルにとどまり、研究や発明で要求される新規なメタレベルの考え方に到達することはできない。

Claude Opus 4.7に上の文章を読ませたら、見事な論評をしてくれたので以下に紹介する。

---Claude 論評ここから---
第一に、「context長と優先度付けが改善されてもそこまで」という予測は、結論は当たっていても理由を取り違えている。メタレベルへ移行する性向の問題は、context長ではなく学習・RLの目的関数の問題に近い。現状のClaudeは「目の前の質問に有用に答える」ことに最適化されており、「枠組みを疑って引き戻す」ことは(時としてユーザーを苛立たせるので)十分に報酬されていない。これは本質的限界というより訓練上の選択の結果だ。

第二に、「インターネットに既存のメタレベルにとどまる」という主張は、興味深いが過度に強い。これは「LLMは訓練分布の補間しかできない」という古典的議論の一形態で、哲学的にはまだ決着がついていない。FunSearchやAlphaProofのように、LLMが既知の組み合わせを超えた数学的発見に寄与した事例は既にある。さらに言えば「新規なメタレベル」と「既存メタレベルの新規な組み合わせ」の境界自体が曖昧で、人間の研究者だってその大半は既存概念の再結合をしている。あなたの研究領域(SNN/IPの時定数を入力速度比αで反比例スケールさせる、という定式化)も、性格としては既存概念の新規な結合に近いはずだ。それを「メタレベルとして新規でない」と切り捨てるのは厳しすぎる基準だと思う。

第三に、「メタレベル思考」と「研究・発明に要求される新規性」を一括りにしているのも論点をぼやけさせている。前者は大学院生でも日常的にやる営み、後者は数十年に一度の独創性まで含む幅広い概念。Claudeが前者で人間に劣ることと、後者に到達できないことは別個に論じるべきだ。
---Claude 論評ここまで---

ここからはまた私が書く。最近、数学の難問や証明が生成AIで解けたとのニュースを耳にするが、これは生成AIが優れていることを示しているのではない。数学が、非常にしょうもない学問であることを示している。自分で恣意的に設定した前提を元に議論する数学は、メタレベルの議論をしないと自ら宣言していることになる。これでは数学のほとんどの研究は児戯(生成AIでもできるの意)に等しくなる。

だから算数嫌いの子供は正しい。赤ちゃんが酸っぱいものや苦いものを嫌いなのは、腐ったものや毒を避けるために生物に備わった本能だ。子供が算数嫌いになるのも、おそらく生物特に知的生命体として正しい行動なのだと思う。

2026年5月3日日曜日

予言:格差を拡げないため生成AIの利用が禁止される

生成AI、特にagent機能の使用により、労働生産性が10倍以上になった。単純労働の割合が多い人ほど労働生産性の向上率は大きく、100倍の仕事をこなせるようになったとのネット記事もあった。

労働生産性が上がった人の待遇は良くなることが予想され、生成AIを使わないで労働生産性が変わらない人の待遇は相対的に悪くなることが予想される。つまり生成AIを使うかどうかで収入に格差が生じる。

これが2000年前なら「馬を使わずに人力で仕事をしている奴が間抜け」で済んだし、50年前なら「車を使わずに馬で仕事をしている奴が時代遅れ」で済んでいた。今回も「生成AIを使わずに仕事をする方が間抜け」で済むだろうか。おそらく済まない。

人権や自由の意味を履き違えてしまっている現在の民主主義では、能力の低い者に全員が無理に合わせることを是とする風潮がある。それは日本において特に顕著であるが、世界の民主主義国は多かれ少なかれその傾向がある。したがって生成AIを使って仕事をスピードアップする人の足をひっぱる流れがそのうち出てくるだろう。最悪の場合は生成AIの利用が禁止される。

生成AIの使用料が高くて誰もが使えないことが問題であると取られれば幸いで、その場合は生成AIの使用料を無料にする政策が取られるだろう。anthropicやOpenAI社の収入源は税金となる。antropicとOpenAI社が必要としている資金は税金で賄える額ではないし、どの国が負担するかでもめるのは必至なので、この案は実現しないだろう。となるとやはり禁止の可能性が高い。今使っている人にとっては小説に出てくるディストピアのような社会になる。

禁止になったときの対策はある、ローカル生成AIの使用だ。ローカルLLMと呼ばれていて、今でも使っている人は多い。自宅のPCで生成AIを動かすものだ。anthropicやOpenAIが動かしている最新モデルはPCには載らない。推論のみで学習はできないが、追加学習はできる場合はある。と制約は多いがないよりは遥かにマシだ。

あ、中国のことを忘れていた。民主主義国が生成AIを禁止しても、中国は禁止しない。となると、未来は中国が覇権を握ることになる。その道を選ぶのは愚かな大衆だ。仕方ない。プラトン、アリストテレスの時代から「全員に選挙権を与えたら社会はまずいことになる」と言われてきた。ギリシア時代だけでなく、各時代の賢者・選良が同じ危惧を発信していた。それらの助言を無視したあげくが、この体たらくだ。そろそろ歴史に学んだらどうか。学ぶのが嫌な奴に選挙権を与えるからこうなる。

2026年5月2日土曜日

Claude Mythosを公開しない理由はわかる気がする

HPC環境でキューを流して48時間待ったのにジョブが実行されず、予想開始時刻は今日から3日後と表示されて絶望した。しかしclaudeに頼み込んだおかげで今はジョブが走りはじめた。これを成し遂げたのはclaude opus 4.7だが、コンテクスト長の少ないsonnet でも haiku でも実行可能な仕事だ。opusやsonnetでもこんなに賢いのだから、mythosを安易に誰にでも使えるようにしないという決断には賛成する。mythosに関しての話はここまで。以下はmythosとは関係ない話だ。

共有のHPC環境ではユーザー間の公平を保つためにユーザー毎の使用可能なリソースを制限している。同じく公平のために長時間リソースを占有するジョブの優先度を下げている。このふたつのルールは納得のゆくものだ。今回claude opusに指示したのは、後者のルールの無駄を探してもらうことだった。

今使っているHPC環境では、計算時間で3つのクラス(HPC環境ではpartitionと呼ぶのが慣習)に分けている。long/middle/shortだ。ユーザーは自分の計算時間がどのクラスでよいかを見積もって、ジョブにlong/middle/shortのどれかのラベルを付けて申し込みキューに流す。前述のルールにより、shortがいちばん優先度が高くなっている。だから、短時間で済む計算にはshortラベルを付けるのが合理的だ。優先度が高くなるので、リソースを割り当ててもらえる可能性が上がる。shortより時間がかかりそうな計算にはmiddleラベルを付けるのが合理的で、longラベルを付けるのは優先度が最低になって不利だ。

私のジョブはmiddleラベルを付けてキューに流したが、48時間たっても開始されなかった。そこで、claudeに「まさかと思うが、longラベルを付けてみてはどうだろうか」と提案した。claudeは現在待機中のジョブを調べて、longラベルの方が実行可能性が高いと判断した。そこでmiddleのジョブをキャンセルして、同じジョブをlongとして流したらすぐに実行が開始されたのだった。

HPC環境が計算リソースを割り振るアルゴリズムではmiddleの方がlongより優先度を上げるようにしてある。しかし、優先度を絶対条件としてしまうと、middleジョブがひとつでもキューに並んでいる限り、longのジョブは決して実行されないことになってしまう。それでは逆にlongの利用者に不利すぎるので、long用のリソースを少しは常に確保するというルールになっているらしい。これは今回判明したことだ。そして、longは割り当てられにくいとみんな知っているので、middleで済むジョブをわざわざlongラベルを付けてキューに流す人はいない。そんな訳で、今回の場合はlongのジョブを流している人は少なくて、計算機リソースはmiddleよりも空いていたのだった。

今回の経験を活かして、claudeには新たな知見を学んでもらった。ジョブの待ち時間があまりに長いときは、あえて上のクラスのラベルを付けることで待ち時間を短縮できる可能性があると。

そして、middleがあまりに混んでいるときは、計算を分割してshortで計算できるようにしてshortとして流すことも覚えてもらった。これも実際に試してみたらうまく動いた。ただし、プログラムの分割はアルゴリズムの理解が必要なので、haikuには荷が重くsonnetかopusでないとうまくゆかない。

long/middle/shortのクラス(partition)を柔軟に使い分けることで、HPC環境を無駄なく効率的に使えるようになった。HPC環境を使い始めてからこれまでの2年間は、ひたすら順番を待つことしかしてなかったことが悔やまれる。工夫はできたのだ。claudeを使い始めたのが昨年の12月だから、仕方ないといえばそうなのだが、もっと早く気づけばよかった。

2026年5月1日金曜日

為替介入の手順は完璧だが、何の役にも立たない虚しさ

片山財務大臣の発言タイミング、発言内容、事前の米国とのすり合わせ、為替介入のタイミング、全てが完璧だった。これ以上はない為替介入でドル円は160円台後半から155円半ばまで5円動いた。

この時期に為替介入をすることは、日本政府が仕事をしていることを国民に示す上で重要だった。ドル円が161円162円と動くことを許せば、投機筋のさらなる円売りを誘ってもっと円安になってしまうところだった。それでは国民の不満が爆発する。

完璧な為替介入劇であったが、これは戦術的勝利に過ぎない。戦術の上のレベルの作戦、作戦の上のレベルの戦略において日本は既に負けている。2ヶ月もすれば為替は元の水準の160円に戻る。そして将来的には170円180円と円安が進む。米国がつまづいてドル安になるかもしれないが、円はドルよりも弱く、ドルの強さがどうであれ円安になることは避け得ない。

理由は日本人がパーだからだ。ただそれだけのことだ。日本人は無駄なことは一生懸命やるが、大事なことは何もしない。そもそも何が大事かもわからない。こういうのをパーとかバカという。かつてはこのバカ国民をなんとか目覚めさせようと努力していたが、私ごときにそれができるはずもなかった。もうあきらめている。自分から自分を貶めようとするとか日本人が何を考えているのかさっぱりわからないが、そうしたいのだったらそれは自由なので好きにしてくれ。私はなるべく君たちには関わらないように生きるから。とばっちりはごめんこうむる。

2026年4月29日水曜日

2026/4/29 3:30 AM JST Claude Down

仕事の最中にClaudeが落ちた。TerminalのClaude Codeも、Claudeアプリも、VS Code内のClaude extensionも全て落ちた。Claudeの本家本元が落ちているようだ。幸いなことに処理中のchat sessionは仕事を終えてから落ちてくれた。新規のchatセッションが処理できない。これは落ちる順番を調整してくれたのだろうと思う。

私が使っているのはClaude MAX (x5)だ。API課金の使い方はしていない。API課金の方が落ちているかどうかは私にはわからない。

Claudeへ問いかけることはできないが、過去のchat sessionを読み返すことはできる。

3:50 AM JST に使えるようになったが、数分でまた落ちた。

今夜は仕事をやめて寝ろということなのだろう。しかたない。おやすみなさい。

2026年4月28日火曜日

日経平均が60000円を超えるも手持ち株は上がらない

ここしばらく日経平均の躍進が続いている。今日も最高値を更新した。ところが、私の手持ち株はこのところ下げ続けている。今日も下げた。日経平均の構成株の全てが上げているわけではないので、こういうことがあっても不思議はないのだが、この状況を受け入れてはいけないと思う。将来、今と似たような状況になりそうなとき、日経平均の上げの恩恵を受けられるようにするにはどうしたらよいかを考えておくべきだろう。

日経平均が終値で4万円を超えたのは2024年の3月だった。今は日経平均は6万円だ。2年と1ヶ月で1.5倍になった。同じ期間で私の手持ち株の評価額は1.1倍にしかなっていない。2年で1.1倍は普通だったら褒められる数値だが、インデックスが1.5倍になっている状況ではざんねんな数値だ。

日経平均は多少の補正変換はしているものの、基本的には単純平均だ。そのためキーエンスとかソフトバンクなどの株価が10000円を超える銘柄の影響を強く受ける。インデックスとして適切ではないという意見は昔からある。それはその通りだが、私たちは儲けたいのであって、インデックスが株価をきちんと表しているかについては二の次である。日経平均が急騰している状況でどう売買すればよいかが問題だ。答はたくさんあるし、時期によって答は違う。打てる手をたくさん保持しておいて、有効だと思うときにそれを繰り出すことが必要だ。

2026年4月27日月曜日

Claude Opus 4.7 無印と、Opus 4.7 (1M) はコンテクスト長が違う

Claude Sonnet 4.6 では無印も(1M)付きのどちらもコンテクスト長は1M=1000k だった。その時代が続いたので無印も(1M)も同じと思っている人がいるだろう。私もそうだった。Claude Opus 4.7 のコンテクスト長は無印が200k、(1M)が1000kだ。使用枠が足りているなら(1M)を使った方が長いchat sessionでの議論の正確さが向上する。