2025年9月2日火曜日
Google WorkspaceのBusiness Starterエディションだと入力したプロンプトが学習に用いられない
2025年9月1日月曜日
ローカルLLMでDeep Researchを行うのが難しい理由
オープンモデルのLLMエンジンをローカルPCで動かすと、自分が入力したプロンプトやデータを外部に知られることがない。この性質は研究や仕事には都合がよい。ローカルPCで動かしているLLMエンジンは過去に学習したもののため、学習時以降に発生したデータを扱うのは苦手だ。そこで、入力データとして新しい文書や画像を与えてこの苦手な部分を補完する。
googleのGeminiではDeep Research機能が実装されていて、リアルタイムに外部のwebサイトにアクセスして、上記の苦手な部分を補完できる。Deep Researchが秀逸な点は、どのwebサイトをアクセスするかを自ら考えてくれることだ。ユーザーがどこどこのサイトをアクセスしろと指定する必要がない。もちろんサイトを陽に指定することもできる。
ローカルPCで動かしているLLMエンジンが外部のwebサイトをアクセスするようにすることは一応できる。pythonなりでプログラムを書いて、ユーザーが与えたプロンプトから文字列を切り出し、その文字列を使って検索エンジンでweb検索を行い、ヒットしたwebサイトをプロンプトとして入力することはできる。しかし、これだけではGeminiのDeep Researchより劣化した結果しか得ることはできない。どこがGeminiに劣るかと言うと、web検索のSEOの部分だ。GeminiではLLM SEOと呼んでいる。web検索をしてヒットしたwebサイト群のどれが入力として採用する価値があるかの判断がGeminiのDeep Researchでは優れているのだ。個人のブログよりネットで公開されている論文誌の方が情報の信頼性が高いので、論文誌の方を採用するというような判断がSEOであり、LLM SEOだ。この分野はgoogleの本業であり、googleが最も得意とするところだ。個人がちょちょいと書いたpythonプログラムで真似できるものではない。そのためにローカルPCで動かすLLMエンジンでのDeep Reseachでは、なかなか満足のゆく結果が得られない。
2025年8月21日木曜日
LLMは古いデータと英語圏以外のデータが苦手
2025年8月17日日曜日
機械の仕組みがわかってないのに使うのが上手な人は本当に存在するか
2025年8月16日土曜日
LLMが鉄道網を理解できないのはなぜか
2025年7月14日月曜日
日本経済研究センタの2075年経済予測
2025年6月2日月曜日
google/gemma-3-12Bに見事な嘘をつかれた
google/gemma-3-12Bに「SONYのPC用スピーカーにはどのようなものがあるか」とプロンプトを与えたら、最下段の出力を得た。この出力は全て嘘・妄想だった。あまりに整然と書かれているので、信じそうになった。こんなことが起こる理由を述べよう。
大規模言語モデルは学習時に文章の次の単語を学習する。googleのgemma-3は、アテンションを利用してトランスフォーマーを構築するという大規模言語モデルとしては王道なネットワーク構造なので、動作が直感的に分かる(分からない人が多いらしいが、トランスフォーマーを設計する人には分かる)。大規模言語モデルがこのような嘘を出力するのは予想外の動作ではない。これはこれで学習したデータに基づいて正しく動作している。嘘のデータを学習させたからではない。真正な事実のみを学習させてもこういう妄想を出力する。汎化性能がそうさせている。
以下の出力に提示された各機種をSONYのサイトで確認したら、それらの機種は影も形もなく、すべて妄想だとわかった。Gaudioというのはゲーム関連で出てくる単語でSONYとは無関係だ。HS4とかHS5はヤマハのスピーカーの型番だった。PS3とかPS5というのはプレイステーションからの捏造だろう。AS-W500はB&W社のASW500のことだろう。INZONEはSONYのヘッドフォンだが、スピーカーとして利用可能というのは間違いだ。
---google/gemma-3-12Bの回答---
ソニー(Sony)から発売されているPC用スピーカーは、様々なニーズに対応できるよう幅広いラインナップがあります。主な製品カテゴリと代表的なモデルを以下にまとめます。
**1. 高音質コンパクトスピーカー (エントリー~ミドルレンジ)**
* **Gaudio GOシリーズ:**
* **Gaudio GO:** 持ち運び可能なコンパクトスピーカー。Bluetooth接続にも対応しており、PCだけでなくスマートフォンやタブレットとも連携できます。
* **Gaudio GO Mini:** さらに小型で、デスク周りの省スペースに最適です。
* **Gaudio HSシリーズ:**
* **Gaudio HS4:** 高音質で、コンパクトながらもパワフルなサウンドが楽しめます。
* **Gaudio HS5:** より高音質を求める方向けのモデル。
**2. デスクスピーカー (ミドルレンジ~ハイエンド)**
* **Gaudio PSシリーズ:**
* **Gaudio PS3:** デザイン性と高音質を両立したモデル。
* **Gaudio PS5:** よりクリアで広がりのあるサウンドが特徴です。
* **Gaudio PS7:** 高音質を追求したハイエンドモデル。
**3. サウンドバー (リビング・PC環境兼用)**
* **AS-W500:** コンパクトながら高音質で、PCのサウンドを向上させます。
* **AS-B800:** 高性能サブウーファー内蔵で、迫力のあるサウンドを楽しめます。
**4. ゲーミング向けスピーカー**
* **INZONE シリーズ:**
* **INZONE H9 / H7:** ワイヤレスゲーミングヘッドセットですが、PCスピーカーとしても利用可能です。
* **INZONE M9 / M7:** ゲーミングPC向けに開発された高音質スピーカー。
**製品を選ぶ際のポイント:**
* **予算:** エントリーモデルからハイエンドモデルまで、価格帯は幅広いです。
* **設置場所:** デスクの広さや、スピーカーを置くスペースに合わせてサイズを選びましょう。
* **音質:** 音楽鑑賞、映画鑑賞、ゲームなど、用途に合わせて最適な音質を選びましょう。
* **接続方法:** PCとの接続方法(USB、Bluetooth、有線など)を確認しましょう。
* **機能:** サブウーファー内蔵、ワイヤレス接続、ノイズキャンセリングなどの機能が必要かどうか検討しましょう。
**詳細情報:**
* **ソニー公式サイト - PCオーディオ:** [https://www.sony.jp/products/pc-audio/](https://www.sony.jp/products/pc-audio/)
上記以外にも、様々なモデルが発売されています。ソニー公式サイトや家電量販店などで、実際に音を聴いて比較検討することをおすすめします。
2025年5月30日金曜日
lama-3.3-Tess-3-70B-TA_v0.60-iMat-CQ-GGUF(必要GPUメモリ49GB)をM4pro mac miniで動かす
macにLM studioを入れるとローカルで大規模言語モデルを動かせるようになる。生成AIのモデルはダウンロードすることで複数選べる。モデルには必要GPUメモリが記載されていて、自マシンの搭載GPUメモリより大きなサイズのメモリが必要なモデルを走らせようとすると警告されるが、警告を無視してロードするとどうなるか試してみた。
64GBのメインメモリを搭載しているM4pro mac miniに、必要GPUメモリが49GBのlama-3.3-Tess-3-70B-TA_v0.60-iMat-CQ-GGUFをロードした。エラーなしに動くのだが動作がひどく遅くなる。必要GPUメモリが17GBのgoogle/gemma-3-27Bであれば、動作速度は普通だ(速いというほどではない)。
Apple SiliconのCPUはメインメモリとGPUメモリを共用するが、メインメモリの多く(今回の場合49GB)をGPUメモリに割り振ると以下の説明のように遅くなるようだ。システムモニタで見ると空きメモリは6GBあってスワップファイルは使用されていないのだが、それでも遅くなる。
64GBメモリを搭載しているM4pro mac miniの場合、以下の説明通りGPUメモリは32GBとLM studioには表示される。32GBメモリを搭載しているM2pro mac miniの場合、GPUメモリは21GBとLM studioには表示される。以下の説明だと16GBのはずだがそれより5GB多い。そして必要GPUメモリが17GBのgoogle/gemma-3-27Bが警告なくロードできて動く。
---一般的な説明---
Apple Siliconチップ(M1、M2、M3、およびそれ以降)では、GPUに最大でシステム全体のメモリの半分までを割り当てることができます。64GBのRAMの場合、理論上の最大値は32GBですが、実際の割り当て量はワークロードや他のプロセスによる使用状況によって変わります。
macOS Ventura 13.5以降では、「Metal Performance Shader (MPS)」機能が導入され、GPUメモリの割り当てをより細かく制御できるようになりました。これにより、特定のアプリケーションやタスクに合わせてGPUに48GB以上のメモリを割り当てることは可能になる場合があります。
2025年4月25日金曜日
頭の良い人ほど食事を欲しがらない謎
2025年4月7日月曜日
youtube動画を要約して文書にする生成AI
2025年4月6日日曜日
トランプの深謀遠慮を推測する
2025年3月15日土曜日
頭の悪い人ほど今のレベルのAIを過大評価する
2025年1月28日火曜日
中国ディープシーク社のAIの中には凜々(トリリオンゲーム)が入っている
2025年1月4日土曜日
アイザックアシモフ 第二ファウンデーション
2024年10月29日火曜日
どうでもよい高齢者の医療はアホの生成AIでよくない?
2024年9月20日金曜日
生成AIはオープンホイールのレーシングカートになぜフロントフェアリングやサイドボックスが義務付けられたのか説明できない
1990年ころまではレーシングカートの競技車両にはフロントフェアリングやサイドボックスはついていなかった。ところがそれから10年しないうちに国内カート競技車両規則でフロントフェアリングとサイドボックスの装着が義務付けられた。これは空力のためではなく安全のためだ。
1960年代のF1マシンは葉巻型の車体にむき出しのタイヤを備えていた。このような車をオープンホイール形式と呼ぶ。オープンホイール形式の車にはF1を頂点とするフォーミュラーカー(FJ1600なんてのもそうだった)とインディカーとレーシングカートがある。オープンホイールだと先行車のタイヤと後続車のタイヤが縦に接触するとそれぞれのタイヤの回転方向の相乗効果で、後続車のタイヤが上方向へ強く弾き飛ばされて危険だ。F1の場合は1970年代に接地力を重要視するようになり、フロントスポイラーをつけたり、サイドポンツーンで車体自体に逆揚力を発生させたりするようになり、タイヤの周りに構造物が付いた。構造物で邪魔されるために他車のタイヤと自車のタイヤが縦に接触する機会は少なくなって、そのことを原因とする事故は大問題ではなくなった。
ところがレーシングカートの場合は最大速度が高々100km/hなので空力部品をつけて接地力を高めるメリットはなかった。そのためずっとタイヤがむき出しの状態でレースが行われていた。カートではタイヤの接触によって後続車が上方向へ飛ばされる大事故の可能性は常にあった。そこで1990年代にレギュレーションでフロントフェアリングとサイドボックスの装着が義務付けられたのだ。これらの部品が防壁になって自車のタイヤが他車のタイヤと接触することを防ぐようになった。
しかし21世紀からレーシングカートに乗り始めた若者は「空力的な利点はなく、重くなって遅くなるだけに見えるのに、なぜこんな部品をつけなくてはならないのか?」と疑問に思うだろう。最新の国内カート競技車両規則を読んでも、部品をつけろとは書かれているが、なぜ必要なのかは書かれていない。そこでGPT-4oとかSonar Hugeとかになぜかを聞いてみる若者もいると思う。ところがどの生成AIも「タイヤが接触すると危険だから」という正解を回答できない。衝撃緩衝効果があるという一見それらしいが実は間違っている答しか回答しない。
先輩ドライバーに聞けば正解を教えてもらえるだろうし、賢い若者なら教えてもらわなくても自分で正解を導きだせるかもしれない。同じ回転方向で回っているタイヤが縦に接触したらどうなるかは、3次元の動的な空間把握ができれば容易に想像できるからだ。この想像が生成AIにできない理由は、生成AIの教師データがテキストであるからだろう。