ChatGPTやLLMの評価と“性格”変更の影響について考える

近年、ChatGPTなどの大規模言語モデル(LLM)を使って自作漫画や文章の評価を行うケースが増えています。ユーザがLLMに特定の“性格”や厳しい評価を指示することがありますが、これは本質的にモデルの内部目的関数や生成アルゴリズムに影響を与える手法です。ここでは、その仕組みと限界について解説します。

1. LLMの性格は設定上の振る舞い
2. コンテキスト長とメモリ設定
3. 目的関数と反復評価
4. 実務上の注意点
まとめ

1. LLMの性格は設定上の振る舞い

LLMはあくまで統計的モデルであり、「性格」を持っているわけではありません。ユーザが指示する性格は、プロンプトやシステムメッセージを通じた出力スタイルの変更です。

例えば「厳しく評価せよ」と指示すると、モデルは訓練データから得た知識に基づき、言語的に厳しい表現を選びやすくなるだけです。

2. コンテキスト長とメモリ設定

コンテキスト長やプロンプト内のメモリは、モデルが一度に保持して参照できる情報量を制限します。長い文章や多くの指示を与える場合、古い情報は切り捨てられることがあります。

そのため、性格設定や細かい指示を加えても、モデルは最終的に最大の尤度（確率）に基づき応答を生成するため、完全に指示通りになるわけではありません。

3. 目的関数と反復評価

LLMは内部的に確率的生成を行っており、ユーザが賛否を繰り返すことでモデルの生成が変化するわけではありません。反復で壁打ちしたとしても、モデルは固定されたパラメータで応答を生成するため、最終的には元の目的関数に従った出力が得られます。

そのため、性格を無理に変えようとすると、内部的に矛盾する条件が生じ、生成精度が低下したりハルシネーションが発生する可能性があります。

4. 実務上の注意点

LLMの評価を利用する際は、モデルの出力はあくまで参考情報として扱うことが重要です。「性格」を変えて厳しい評価を求める場合でも、最終判断は人間が行うべきです。

プロンプトの工夫は有用ですが、モデルの統計的限界やコンテキスト長を理解した上で指示を与えることが精度向上につながります。

まとめ

LLMに“性格”はなく、指示による性格変更は出力スタイルを変えるだけです。コンテキスト長や内部の目的関数により、指示が必ずしも完全に反映されるわけではありません。ユーザはモデル出力を参考にしつつ、最終判断は人間が行うことが推奨されます。無理な性格変更はハルシネーションや精度低下のリスクを伴うため注意が必要です。