大規模言語モデルとチェスAIで対決させるとほとんどの大規模言語モデルがズタボロに負ける中なぜか「gpt-3.5-turbo-instruct」だけが圧倒的勝利
【要約】
大規模言語モデルとチェスAIの対決で、ほとんどのモデルが敗北する中、唯一「gpt-3.5-turbo-instruct」が全対局で勝利を収めた。Dynomight Internet Websiteによる実験では、50回の対局を行い、他のモデルは全て敗北したが、gpt-3.5-turbo-instructは10回の対局で全勝した。これにより、gpt-3.5-turbo-instructは他のモデルに比べてチェスのトレーニングがより充実している可能性が示唆された。
【重要ポイント】
・gpt-3.5-turbo-instructは全10回の対局で勝利。
・他のモデルは50回の対局で全て敗北。
・Stockfishの難易度は最低に設定されていた。
・実験はDynomight Internet Websiteによって実施された。