Исследователи КНИТУ-КАИ создали программу, которая значительно улучшает точность распознавания объектов на тепловизионных снимках. Это стало возможным благодаря использованию сверточной нейронной сети и различных алгоритмов фильтрации.
Программа предназначена для анализа и визуализации объектов, основываясь на их тепловом излучении. Она обрабатывает тепловизионные изображения, в результате чего пользователи получают изображения с локализованными объектами и их категориями.
Профессор кафедры систем автоматизированного проектирования КНИТУ-КАИ Зиннур Гизатуллин рассказал, что разработка была инициирована его студентом Ильмиром Фатыховым, который занимался практикой в компании, разрабатывающей оптико-электронные системы. Он отметил, что тепловизионные технологии играют важную роль в таких областях, как медицина, безопасность и промышленность, предоставляя уникальные возможности для анализа объектов.
Для распознавания объектов была использована сверточная нейронная сеть YOLO (You Only Look Once). Этот тип нейросети эффективно работает с изображениями, выявляя пространственные зависимости между пикселями, что критически важно для анализа тепловизионных данных. Применение модели YOLO обеспечило высокую скорость и точность распознавания.
Чтобы повысить точность работы программы, были применены алгоритмы фильтрации, такие как фильтры Собеля, Гаусса, Шарпа и Лапласа. Анализ тестовой выборки показал, что использование этих фильтров улучшило точность распознавания на 8-19%. В итоге пользователи получают не только обработанные изображения, но и отчеты с классифицированными объектами.
Одним из главных преимуществ разработанного подхода является высокая точность распознавания, даже если изображения содержат шумы или имеют низкую контрастность. Программа также позволяет автоматически анализировать большие объемы изображений без участия человека, а также адаптировать систему под новые объекты и условия.
Программное обеспечение способно фильтровать шумы, улучшать изображение, обнаруживать объекты с аномальными параметрами, такие как дефекты оборудования, люди, животные или очаги возгорания. Оно также выполняет сегментацию и классификацию объектов, что полезно в сфере безопасности, промышленного контроля и медицины.
Программа была зарегистрирована в Федеральной службе по интеллектуальной собственности.
Источник: Naked-Science.