Автоматизация подготовки обучающего набора для классификации похожих изображений
Существуют методы, которые позволяют, хоть и при использовании в ограниченном круге задач компьютерного зрения, получить информацию об общем характере изображений. Данные методы основаны на поиске особенностей изображений – особых точек и дескрипторов. Их идея разработана достаточно давно, но даже сейчас они применяются во многих сферах, связанных с обработкой изображений. Для их использования в задаче классификации необходимо систематизировать и выделить общие черты дескрипторов, присущих определенным типам изображений. В рамках рассматриваемой области исследований под общими чертами можно представить некие слова, совокупность которых и будет описывать характер изображений одного типа. Некоторый набор таких слов по всем необходимым типам образует словарь визуальных слов. Предполагается, что использование алгоритмов классификации позволит выделить слова, присущих определенным типам изображений для дальнейшей классификации неизвестных изображений по определенным типам. В данной работе рассматривается приложение, основанном на комплексе существующих методов компьютерного зрения, которое позволяет упростить процесс формирования обучающей выборки, из необходимых типов изображений, для дальнейшего его использования в различных задачах. Так же приведены исследования результатов работы программы при использовании таких алгоритмов как ORB, BRISK, AKAZE осуществляющих поиск особенностей изображения в виде особых точек и их дескрипторов.
В век стремительного развития цифровых технологий, когда объёмы информации растут громадными темпами, многие IT компании стремятся автоматизировать процессы для ее обработки, создавая сложные, высоконагруженные программные и аппаратные комплексы.
В последние время для задач анализа данных быстрыми шагами развивается направление нейронных сетей, позволяющие получить сравнимые с человеком результаты в различных сферах. Но для достижения этих показателей требуется приложить не малые усилия, так как не существует алгоритма определяющего оптимальную архитектуру нейронной сети для конкретной задачи. Проектирование сети требует работы высококвалифицированного в данной области персонала, а также огромных как аппаратных, так и материальных средств, что может позволить себе не каждая современная компания.
Но недостаточно просто смоделировать архитектуру нейронной сети, ведь перед ее использованием так же необходима стадия обучения. Данная стадия предполагает наличие заранее известных начальных значений и предполагаемых конечных результатов. Формирование обучающих выборок так же требует не малых человеческих затрат. Данную проблему можно увидеть на актуальной на сегодняшний день задаче обработке изображений. Ведь в текущее время, почти у каждого современного человека имеется мобильное устройство, с помощью которого люди создают тысячи и миллионы фотографий каждый день. И для создания необходимой обучающей выборки, по которой возможно обучить спроектированную нейронную сеть или иной инструмент, позволяющий анализировать изображения, приходиться использовать кропотливый и малооплачиваемый ручной труд простых людей.
В данной работе предлагается разработать приложение, автоматизирующее данный процесс и обладающее необходимым функционалом, позволяющим без использования огромного массива данных и при умеренных вычислительных затратах, осуществить первичную классификацию изображений с высокой точностью. Тем самым позволив существенно сократить общее время на подготовку обучающей выборки.
Существуют методы, которые позволяют, хоть и при использовании в ограниченном круге задач компьютерного зрения, получить информацию об общем характере изображений. Данные методы основаны на поиске особенностей изображений – особых точек и дескрипторов. Их идея разработана достаточно давно, но даже сейчас они применяются во многих сферах, связанных с обработкой изображений. Для их использования в задаче классификации необходимо систематизировать и выделить общие черты дескрипторов, присущих определенным типам изображений.
В рамках рассматриваемой области исследований под общими чертами можно представить некие слова, совокупность которых и будет описывать характер изображений одного типа. Некоторый набор таких слов по всем необходимым типам образует словарь визуальных слов. Предполагается, что использование алгоритмов классификации позволит выделить слова, присущих определенным типам изображений для дальнейшей классификации неизвестных изображений по определенным типам.
Данная работа является продолжением исследований в области алгоритмов поиска особых точек и дескрипторов, описанных в бакалаврской работе автора: “Сравнительный анализ дескрипторов особых точек изображений с внедрением алгоритмов под операционной системой «Android»”. В данной работе предлагается сравнить результаты их применения в задаче классификации изображений, используя словарь визуальных слов.
В данной работе был проведен сравнительный анализ методов поиска особых точек и их дескрипторов на основе результатов кластеризации. Для достижения поставленной задачи была разработана программа для стационарных устройств на языке Java, обладающая всем требуемым функционалом:
Реализацию методов ORB, BRISK, AKAZE.
Формирование словаря.
Обучение алгоритма кластеризации.
Сортировка изображений по заданным группам.
Настройка параметров программы и алгоритмов.
Корректировка групп изображений
Сохранение результатов
Были проведены сравнительные тесты работы алгоритмов.
В результате выделен наилучший метод поиска особенностей, при кластеризации изображений.
Ethan Rublee, Vincent Rabaud, Kurt Konolige, Gary Bradski: “ORB: an efficient alternative to SIFT or SURF”, Computer Vision (ICCV), IEEE International Conference on. IEEE, pp. 2564 – 2571, 2011.
Stefan Leutenegger, Margarita Chli, Roland Siegwart: “BRISK: Binary Robust Invariant Scalable Keypoints”. Computer Vision (ICCV), pp. 2548 – 2555, 2011.
Pablo F. Alcantarilla, Jesús Nuevo, Adrien Bartoli: “Fast Explicit Diffusion for Accelerated Features in Nonlinear Scale Spaces”. In British Machine Vision Conference (BMVC), 2013.
Rosten, Edward, Tom Drummond: “Machine learning for high-speed corner detection”, 9th European Conference on Computer Vision (ECCV), pp. 430 – 443, 2006.
Michael Calonder, Vincent Lepetit, Christoph Strecha, Pascal Fua, “BRIEF: Binary Robust Independent Elementary Features”, 11th European Conference on Computer Vision (ECCV), pp. 778 – 792, 2010.
S. Grewenig, J. Weickert, C. Schroers, A. Bruhn: “Cyclic Schemes for PDE-Based Image Analysis”, In International Journal of Computer Vision, 2013.
X. Yang, K. T. Cheng: “LDB: An ultra-fast feature for scalable augmented reality”. In IEEE and ACM Intl. Sym. on Mixed and Augmented Reality (ISMAR), pp. 49 – 57, 2012.
, : “A Text Retrieval Approach to Object Matching in Videos”
Gabriella Csurka, Christopher R. Dance, Lixin Fan, Jutta Willamowski, Cedric Bray: “Visual Categorization with Bags of Keypoints”, 2004.
David Arthur, Sergei Vassilvitskii: “k-means++: the advantages of careful seeding.” Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms. Society for Industrial and Applied Mathematics Philadelphia, PA, USA. pp. 1027–1035, 2007.
C. Burges: “A Tutorial on Support Vector Machines for Pattern Recognition
Annalisa Barla, Francesca Odone, Alessandro Verri: “Histogram intersection kernel for image classification.” Proceedings of International Conference on Image Processing 2003, Vol. 2(1) , pp. 513, 2003
OpenCV: http://opencv.org
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!