これらのリスクを軽減するため、チャットボットアプリケーションにおいてLLMの応答から特定のタグをフィルタリングすることや、レッドチーム編成を活用して継続的な脆弱性評価と防御策を講じることが推奨されます。 本稿は、AIモデルの評価に焦点を当てたシリーズの第一弾となります。今回は、DeepSeek-R1のリリースを分析します。 Chain of Thought(CoT)推論の普及は、大規模言語モデルに...