Вы когда-нибудь задумывались, что будет, если устроить совершенно новый тип тестирования для больших языковых моделей (LLM)? Например, выпустить несколько моделей на арену и заставить их соревноваться друг с другом? Именно это я и решил сделать: столкнуть LLM друг с другом в классической аркаде Street Fighter III.
Комментарий недоступен
Комментарий недоступен