比例道
2025年9月13日土曜日
ITサービスのマネタイズは難しい
2025年9月9日火曜日
基隆と石垣島で楽天モバイルとahamoを比較する
2025年9月2日火曜日
Google WorkspaceのBusiness Starterエディションだと入力したプロンプトが学習に用いられない
2025年9月1日月曜日
ローカルLLMでDeep Researchを行うのが難しい理由
オープンモデルのLLMエンジンをローカルPCで動かすと、自分が入力したプロンプトやデータを外部に知られることがない。この性質は研究や仕事には都合がよい。ローカルPCで動かしているLLMエンジンは過去に学習したもののため、学習時以降に発生したデータを扱うのは苦手だ。そこで、入力データとして新しい文書や画像を与えてこの苦手な部分を補完する。
googleのGeminiではDeep Research機能が実装されていて、リアルタイムに外部のwebサイトにアクセスして、上記の苦手な部分を補完できる。Deep Researchが秀逸な点は、どのwebサイトをアクセスするかを自ら考えてくれることだ。ユーザーがどこどこのサイトをアクセスしろと指定する必要がない。もちろんサイトを陽に指定することもできる。
ローカルPCで動かしているLLMエンジンが外部のwebサイトをアクセスするようにすることは一応できる。pythonなりでプログラムを書いて、ユーザーが与えたプロンプトから文字列を切り出し、その文字列を使って検索エンジンでweb検索を行い、ヒットしたwebサイトをプロンプトとして入力することはできる。しかし、これだけではGeminiのDeep Researchより劣化した結果しか得ることはできない。どこがGeminiに劣るかと言うと、web検索のSEOの部分だ。GeminiではLLM SEOと呼んでいる。web検索をしてヒットしたwebサイト群のどれが入力として採用する価値があるかの判断がGeminiのDeep Researchでは優れているのだ。個人のブログよりネットで公開されている論文誌の方が情報の信頼性が高いので、論文誌の方を採用するというような判断がSEOであり、LLM SEOだ。この分野はgoogleの本業であり、googleが最も得意とするところだ。個人がちょちょいと書いたpythonプログラムで真似できるものではない。そのためにローカルPCで動かすLLMエンジンでのDeep Reseachでは、なかなか満足のゆく結果が得られない。