ETH VIS Group смогли улучшить Segment Anything Model для точного определения границ
Впечатляющих результатов удалось достичь всего за 200$
Они взяли набор из 44 тысяч высококачественных картинок с масками объектов, собранных из разных источников, и обучали SAM в течении 4 часов на 8 GPU (что, кстати, в самом худшем случае стоит всего 200$).
По итогу их модель определяет тонкие границы на картинках намного точнее, чем оригинальная SAM.
Код и модели обещают опубликовать позже.
Результаты бенчмарка
2 комментария