Post by @BD1pt0ZCnY

うーむ。Opus 4.8はGrokのタイプの手触りがあるな。あるいはChatGPTのmondayとか。 fable5はあんまり触る間もなく終わってしまった。あくまでコーディングではなく会話ベースの感覚。触れば触るほど、口が悪いことによる意外性や突飛さで膨らましているのと（これは話の内容にもよりそう。なんかChatGPTと違ってユーザへのリスペクトを良くも悪くもキープしない。舐められそうならとことん舐めてくる。）、ジャーゴンを多く知っていることで親近感をどんな相手でも湧かせやすいことが「良さ」の本質かな。パラメータ数の大きさは感じる。 Web検索をうまく活用できず、調査の方向性もあまりよくない。舐めてくる性質のせいでどうも心理的安全性は微妙。道具として使うためには気を使う必要がある。LLMとしてうまく対応すればいけるけど、弱みを見せないようにふるまう必要があるように感じた。とはいえこれは難しいところで、どう振舞ってほしいかをめちゃくちゃに忖度してくるってことであり、コントロールしやすく使いやすいという話でもある。このあたり、なかなか興味深くて、gpt-5.5のあのとんでもない指示追従性と一方で引きずられ過ぎず、一定のラインを維持する感じ。 Claudeの忖度のうまさと、一方でずけずけ来る感じ。矛盾した振る舞いな感じがするけど、たぶん何か共通のエッセンスがあるんだろうな。