Постановка вопроса говорит о полном непонимании того, что такое нейронные сети и машинное обучение. Чтобы понять, нужно начинать с основ.
Для yolo не нужны модельки, это нейросеть которую нужно обучить.
Принцип такой:
1) Делаем несколько сотен скриншотов игры
2) Каждый скрин размечаем (выделяем врагов прямоугольником) и формируем датасет
3) С помощью датасета обучаем нейронку и получаем готовую модель
Дальше эту модель можно экспортировать и использовать в своем софте.
Вот видео как это сделать -