個人的には、評価で解いている課題が事前学習コーパスに含まれている場合を想像しやすいので、LLMは柔軟なコピペ器と考えているのですけど。画像・ロボット系の研究者の場合、評価で解いている状況は学習とかなり違っているので、LLMが創発的にタスクを解いていると考えがちに見える。人間が状況全体を見る癖があるから、そう見えているだけで、細かい特徴量レベルで見ると学習済みの部分問題に解いている可能性はあるんじゃないの…という検証課題を思いつきましたけど、私が簡単に思いつくくらいのことは以下略。
add a skeleton here at some point
about 18 hours ago