Определение параметров ориентации плоской грани с применением нейронных сетей



Скачать 144.24 Kb.
Дата05.07.2013
Размер144.24 Kb.
ТипДокументы

ISBN 978-5-7262-1226-5. НЕЙРОИНФОРМАТИКА – 2010. Часть 2

Н.Б. ЗЕМЛЯНАЯ, М.О. КОРЛЯКОВА

Калужский филиал МГТУ им. Н.Э. Баумана

mkorlyakova@yandex.ru
ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ ОРИЕНТАЦИИ ПЛОСКОЙ

ГРАНИ С ПРИМЕНЕНИЕМ НЕЙРОННЫХ СЕТЕЙ
Рассмотрен подход к аппроксимации решений задачи минимизации функции в нейросетевом базисе. Продемонстрировано применение этого подхода к поиску параметров нормали плоской грани и калибровке камеры. Предложена модель обучения нейронной сети в виртуальном мире и представлены результаты тестирования сети в реальных сценах.
Введение
Целый ряд задач систем компьютерного зрения можно отнести к классу задач поиска параметров размещения объекта в пространстве, которое связано с некоторой фиксированной системой координат. Примером может быть поиск взаимного углового положения плоских граней (стен помещения, плоскостей детали и т.п.). Решение задачи позиционирования объекта в пространстве можно проводить как последовательное нахождение нормали к плоской грани объекта в двух связанных между собой системах координат. Каждая система координат фиксирует положение и направление оси зрения камеры, которая формирует проекцию исследуемого объекта на экранную плоскость. Задача имеет достаточно простое решение, если грань обладает характерными точками (например, углами), но в случае отсутствия таковых необходимо решать более сложную задачу. Если принять в качестве известной об исследуемой грани информации только знание ее обобщенной формы – диск или окружность, то можно говорить о характерной форме ее проекции. Условия существования проекции заданного вида для окружности неизвестного радиуса можно описать системой нелинейных алгебраических уравнений, которая включает условия получения конического сечения с основанием в форме окружности [1, 2]. Решением этой системы являются четыре варианта ориентации окружности. Причем для двух случаев окружность находится за экранной плоскостью, что не соответствует условиям задачи.

Идеальное решение возможно только для случая абсолютно точного определения координат опорных точек на эллипсе. Однако реальные снимки не позволяют определить координаты точек контура точнее, чем размер пикселя, а на самом деле из-за расфокусировки нет возможности достигать и такой точности. Таким образом, цель – определить параметры нормали к окружности (нормаль однозначно задает ориентацию плоскости окружности) по приблизительным координатам проекции окружности. Решение такой задачи было найдено в форме условной минимизации ошибки проецирования для уравнения трехмерной окружности. Уровень средней ошибки, полученной в рамках такой модели составил 5°, а время обработки одного кадра (4000х3000 пикселей) – 3-4 мин [1], что значительно превосходило целевое время (1-2 с) и целевую точность (ошибка менее 1º).
Таким образом, было принято решение перейти от модели минимизации в пространстве параметров нормалей к аппроксимации решений задачи поиска нормали с помощью нейронной сети.
Поиск параметров нормали в нейросетевом базисе
Поскольку сложность аппроксимируемой функции чрезвычайно велика, то необходимо образовать обучающую выборку, размер которой обеспечит необходимое качество обучения и обобщения [3]. Однако точное измерение параметров объекта в условиях реального стенда требует существенных человеческих затрат (нужно провести тысячи экспериментов) и применения оборудования, обладающего высокой точностью при определении расстояния, до объекта и его углового положения. Решением проблемы является проведение компьютерного моделирования условий реального стенда в виртуальной среде [5]. Решение задачи аппроксимации параметров нормали по координатам проекции окружности на экранной плоскости можно разбить на следующие этапы.

  • Формирование виртуальной модельной сцены.

  • Получение множества примеров.

  • Обучение нейронной сети.

  • Тестирование реальных примеров в условиях поворотной платформы с измерением угла поворота образца.

Первый этап работы – формирование модели сцены. Рассмотрим условия и ограничения, принятые при формировании модели:

  • измерение параметров моделируемого объекта проводится для системы с абсолютной разрешающей способностью (углы измерены точно, координаты точек виртуальной модели и ее проекции известны точно);

  • область изменения параметров объекта выбрана из соображений наибольшего соответствия реальным размерам и положениям объектов;

  • параметры камеры в модельной среде определены размерами экранной плоскости и фокуса.


Рис. 1. Схема стенда
Принятые допущения можно использовать, т.к. реальное стендовое оборудование обеспечивает аппаратную коррекцию оптических искажений линзы камеры, а разрешение камеры превосходит возможности внешних измерительных систем (т.е., потенциально, при разрешении 3000*4000 пикселя можно обнаружить изменение углового положения объекта на 1’ для расстояний до 1 м. и линейных размеров шаблона около 0.5 м). Виртуальная модель содержит :

  • глобальную систему координат ;

  • виртуальную камеру, которая имеет систему координат , где ось совпадает с осью наблюдения камеры, а фокус , камера расположена фиксировано, а фокус изменяется случайно равномерно в диапазоне для каждого запуска модели;

  • экранная плоскость камеры параллельна плоскости и перпендикулярна оси на расстоянии от плоскости ;

  • виртуальный объект – окружность с центром в точке , радиусом и нормалью , где центр, радиус и положение нормали выбирается случайно для каждого запуска модели.

В процессе фотографирования объекта (окружности) и рассмотрения только результатов съемки возникает неопределенность ориентации образующей для каждой конкретной проекции [2]. Проще говоря, каждому эллипсу, который был получен в результате центрального проекционного преобразования, соответствует 4 окружности одинакового радиуса, но с разными положениями центров и нормалей. Одна пара решений находится ниже экранной плоскости и может быть отброшена в силу физической не реализуемости в условиях реального стенда. Однако вторая пара решений лежит выше экранной плоскости , и принять решение, какой из вариантов решения верный можно только на основе анализа стереопары изображений текущей сцены. Таким образом, необходимо восстановить в виртуальной модели вторую окружность и определить ее нормаль.

Рис. 2. Виртуальная сцена
Обозначим исходную окружность «Окружность 1» с нормалью , а парную ей – «Окружность 2» с нормалью (см. рис. 2). Проекция «Окружности 1» на экранную плоскость представляет собой эллипс, т.к. это обеспечено ограничениями на ориентацию окружности относительно камеры (коническое сечение, как известно, может породить параболу, гиперболу и эллипс). Направление, соответствующее наибольшей оси эллипса, определяет проекцию диаметра «окружности 1» на экранную плоскость. Этот диаметр параллелен экранной плоскости, т.к. только это направление позволяет получить наименьшее искажение размера. Таким образом, инвариантные положения окружности будут получены за счет поворота ее первой формы вокруг прямой, содержащей , где –проекция на «окружность 1» главной оси эллипса. Рассмотрим схему на рис. 3, где рассмотрено сечение конуса, охватывающего «Окружность 1» и «Окружность 2» из О-центра проекции. Поскольку общим у этих объектов является отрезок , «Окружность 2» вписана в тот же конус, что и «Окружность 1», а проекция малой оси эллипса на «Окружность 1», то отраженный относительно оси конуса отрезок принадлежит «Окружности 2». Таким образом, можно определить плоскость, которой принадлежит «Окружность 2» по трем точкам , и ее нормаль .

Рис. 3. Схема размещения решений
Проекция «Окружности 1» и «Окружности 2» на экранную плоскость является эллипсом (см. рис. 3). Эллипс может быть описан как кривая второго порядка, проходящая через 6 точек в координатах . Следовательно, определяя задачу поиска нормали по проекции, необходимо задать не менее 6 опорных точек на эллипсе и фокусное расстояние, которые сопоставим координатам нормали . Обучающий вектор будет выглядеть следующим образом:

.

Множество примеров формируется из векторов . Необходимо определить число опорных точек на эллипсе и число примеров для обучения нейронной сети, т.е. определить размер образца.

Анализ размера входного вектора производился на основе эксперимента в рамках виртуальной модели. Рассмотрены выборки сравнимых размеров и построены многослойные персептроны с разным числом входных точек. Рассмотрены образцы с 10, 15, 20, 30 и 40 точками. В результате моделирования показано, что образцы с числом точек большим 15 позволяют получить практически идентичные ошибки обобщения. Причем размер выборки и обучаемой сети быстро перестает влиять на качество обучения. Результаты этого анализа показаны на рис. 4.


Рис. 4. Зависимость ошибки обобщения от числа нейронов и объема выборки
Результирующая сеть была обучена формировать пару нормалей на множестве виртуальных примеров. Виртуальная модель показывает ошибку обобщения на уровне не более 0.5 для сети 40 сигмовидных нейронов скрытого слоя и 6 линейных нейронов выходного слоя. Модель сети была определена на основании экспериментального подбора числа нейронов скрытого слоя и числа слоев [7, 6].

Последний этап – тестирование, проводился на поворотном стенде с измерением углового положения образца. Поскольку невозможно определить абсолютное положение объекта съемки в системе координат камеры, то исследуется разница между двумя парами кадров с разным углом поворота. Пример результатов теста приведен в табл. 1.

В табл. 1 приведены значения измеренных относительных углов расположения объектов в сцене (1-й кадр и 2-й кадр). Поворот объекта и измерение углов осуществляются относительно одной оси системы. Остальные оси считаются практически неподвижными. Точность стенда (т.е. гарантия неподвижности стенда в сцене по не контролируемым осям) составляет порядка 0.5°. Диапазон поворотов объекта в сцене вокруг рабочей оси составляет около 10º. Каждую сцену снимали несколько раз, чтобы контролировать неизменность остальной сцены и характеристик освещения. В случае значительного (более 0.5°) расхождения кадров, снятых для одной сцены, ее браковали и проводили повторную съемку. Результаты анализа сцен формировались в виде параметров двух потенциальных нормалей. Для проверки качества работы нейронной сети вычислялась угловая разница между нормалями попарно. Угловая разница первой и второй пар нормалей приведена в табл. 1 – «Разница вычисляемых нормалей 1-й пары» и «Разница вычисляемых нормалей 2-й пары», а усредненная ошибка приведена в столбце «Er°».
Таблица 1
Результаты теста на поворотном стенде


1-й кадр, угол 

2-й кадр,

угол 

Разница кадров,

угол 

Разница вычисляемых нормалей 1-й пары, угол 

Разница вычисляемых нормалей 2-й пары, угол 

Er°

176

186.25

10.25

6.27

10.03

2.02

182,15

186,25

4,1

3,14

6,04

1.45

183,25

186,25

3

2,28

4,78

1.25

185,5

186,25

0,75

1.05

1,78

0.65

186,25

186,25

0

0,28

0,50

0.39


Средняя ошибка определения угла составила 1.8°, а максимальная не превышает 5º на тестовой выборке объемом 120 кадров. Анализ разницы между векторами нормали провели между каждой доступной парой кадров, т.е. около 7000 примеров (пар).

Таким образом:

  • удалось решить задачу аппроксимации сложной функции с ошибкой менее 5º (средняя ошибка 1.8°);

  • время принятия решения, составляет 20 с., т.е. сокращено в несколько раз.

Положительный опыт замены задачи минимизации в пространстве параметров на задачу аппроксимации решения позволил предположить, что подобным образом можно решать и другие подобные задачи. Однако попытка применить подход к задаче калибровки камеры дала существенно менее интересные результаты.
Калибровка камеры в нейросетевом базисе
По отработанной ранее схеме была построена виртуальная модель сцены калибровки камеры по методу PnL проблема (Perspective n Lines problem). Решение этой задачи строится на использовании точек схода, отражающих перспективные искажения семейства параллельных линий в плоскости изображения. Процесс нахождения параметров камеры построен на основе использования параллельности/ортогональности линий калибровочного стенда [8]. Из-за ошибок векторизации параллельные линии на изображении в общем случае не будут пересекаться в одной точке. Это приводит к необходимости построить точку схода как наиболее близкую к пересечениям всех возможных прямых из двух семейств калибровочного шаблона. Зная точку схода и координаты проекции шаблона, можно вычислить фокус системы и параметры нормали. Если известен геометрический размер шаблона, то можно определить точное положение камеры в системе координат шаблона. Применение методов условной минимизации позволяет получить решение с точностью на уровне 0.5° в текущей аппаратной среде за время 2-3 минуты [8]. Хотя требования к процессу калибровки значительно слабее, чем к этапу распознавания параметров нормали, но и на этом шаге работы необходимо обеспечивать достаточное быстродействие. Решением этого вопроса может быть применение новых алгоритмов, например, на основе робастного поиска параметров камеры [9]. Однако в данном случае рассмотрим аппроксимацию решения этой задачи в нейросетевом базисе.

Как и для первой задачи, необходимо создать виртуальную модель, обучить сеть и провести тестирование. Рассмотрим ограничения и особенности формируемой модельной сцены.

  • Поскольку фокусное расстояние используемых камер изменяется в ограниченных пределах, то и модель сцены подразумевает ограниченный размер фокуса и сравнимые с ним размеры экранной области.

  • Объект, исследуемый в сцене, моделируется плоскостью и двумя семействами ортогональных линий, которые ей принадлежат.

  • Общее число линий в каждом семействе установлено случайно.

  • Расстояние между линиями внутри семейства произвольно.

  • Исходное семейство линий формируется с добавление небольшого рассогласования по углам (не параллельность не более чем ±0.1º в форме нормального распределения) для моделирования неточности шаблона и ошибок оцифровки сцены камерой.

  • В качестве входного набора для обучения нейронной сети рассматриваем координаты попарных пересечений линий одного семейства прямых.

  • Выходное множество содержит параметры ориентации оси зрения виртуальной камеры в системе координат O’, привязанной к плоскости шаблона с ортогональными семействами прямых.

В рамках виртуальной модели были сформированы множества примеров с разным числом пересекающихся пар линий. Входной образ содержит координаты точек схода , вершин виртуального прямоугольного макета в проекции на экранную плоскость и фокус системы f, а выходной образ содержит – параметры вектора оси зрения камеры в пространстве координат O’

При обучении сети использовано 5000 для обучения и 5000 тестовых примеров. Конфигурация рассмотренной сети: 1-й слой М сигмовидных нейронов, 2-й слой – 3 линейных нейрона. Ошибки обобщения сети в градусах для различного числа нейронов приведены в табл. 2.
Таблица 2
Ошибка обобщения задачи калибровки


М

5

10

15

20

25

30

Er

15.24

12.8143

10.3253

10.2883

10.17

10.52


Итак, можно заключить, что для задачи калибровки камер полученное за счет аппроксимации решение намного слабее (с точки зрения ошибки обобщения) по сравнению с решением задачи через минимизацию рассогласования. Ошибка на виртуальной модели в 20 раз превосходит ошибку алгоритма, который обрабатывал реальные сцены. Однако время получения параметров нормали составляет 1-2 сек. Таким образом, можно заключить, что предложенный подход позволяет решить не любые задачи.
Заключение
Анализ двух представленных задач показал, что наиболее существенное отличие первой от второй лежит в геометрической протяженности объектов за границами экранной плоскости. Если в задачи поиска ориентации окружности размеры объекта превосходят размер экранной плоскости в 20-30 раз, то вторая задача имеет точки схода на расстоянии 1000-500 диагоналей экранной плоскости от вершин проекции шаблона.

Второе существенное отличие заключается в том, что первая задача описана системой нелинейных алгебраических уравнений, а вторая линейной. Однако это требует дополнительного исследования с целью оценки сложности сформированных пространств примеров.

Общий итог проведенной работы позволил сформировать тактику обучения нейронной сети в условиях дефицита примеров. Основные этапы работы в таких условиях предусматривают следующие шаги.

  • Формирование виртуальной модели.

  • Формирование пространства признаков по виртуальной модели.

  • Анализ признаков с точки зрения информативности.

  • Построение множества примеров.

  • Обучение сети и анализ ошибки обобщения в рамках виртуальной модели.

  • Анализ реальных сцен и корректировка виртуальной модели сцены и нейронной сети, обучаемой на ней.

Это позволяет существенно сократить этап подготовки обучающего множества примеров и использовать реальные примеры только для тестирования.
Список литературы


  1. Борисов Д.А, Гусев А.А., Земляная Н.Б., Корлякова М.О., Филимонков А.А. Поиск угловых параметров расположения объекта в пространстве на основе визуальной информации // Труды НТК «Проблемы эффективности и безопасности функ-ционирования сложных технических и информационных систем», Серпухов, 2008. – С. 101-106.

  2. Караулова Г.Т., Лашина И.В. Геометрический метод обсчета пространственных объектов с использование теории ПОС-проекций.// МАИ, электронный журнал «Прикладная геометрия», Выпуск 4, №7 (2002). - С. 17-23.

  3. Терехов. С.А. Технологические аспекты обучения нейросетевых машин// научная сессия МИФИ–2006. VIII Всероссийская научно-техническая конференция «Нейроинформатика–2006»: Лекции по нейроинформатике. – М.: МИФИ, 2006. – 244 с.

  4. Bastian Goldl?, Ivo Ihrke, Christian Linz, Marcus Magnor, "Weighted Minimal Hypersurface Reconstruction," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 29, no. 7, p. 1194-1208, July 2007.

  5. Бырков И. А., Прищепа Ю. В., Слесарев А. Ю., Шулика К. М. Применение цифровых моделей местности в задачах информационного обеспечения аэрокосмических систем // Наука и технология в промышленности. 2006. № 2. С. 48–51.

  6. Хайкин С. Нейронные сети: полный курс, 2-е изд.: Пер. с анг – М.: ООО «И.Д.Вильямс», 2006. – 1104 с.

  7. Талалаев А.А., Тищенко И.П., Фраленко В.П., Хачумов В.М. Анализ эффективности применения искусственных нейронных сетей для решения задач распознавания, сжатия и прогнозирования// Искусственный интеллект и принятие решений". № 2, 2008.

  8. Борисов Д.А, Гусев А.А., Земляная Н.Б., Корлякова М.О. Определение параметров фотокамеры в системах распознавания образов// труды НТК «Новые информационные технологии в системах связи и управления», г. Калуга, 2008 г. – С. 285-287.

  9. Damien Douxchamps , Kunihiro Chihara. High-Accuracy and Robust Localization of Large Control Markers for Geometric Camera Calibration //IEEE Transactions on Pattern Analysis and Machine Intelligence , Issue Date:February 2009 - Р. 376-383.




УДК 004.032.26(06) Нейронные сети

Похожие:

Определение параметров ориентации плоской грани с применением нейронных сетей iconПрименение искусственных нейронных сетей в сетевых технологиях и интеллектуальном анализе данных
Данная работа иллюстрирует одно из широко распространенных на сегодняшний день практических применений искусственных нейронных сетей...
Определение параметров ориентации плоской грани с применением нейронных сетей iconСтруктурный синтез Быстрых нейронных сетей
В данной статье разделе рассматривается процедура синтеза нейронных сетей, которые структурно подобны алгоритмам быстрого преобразования...
Определение параметров ориентации плоской грани с применением нейронных сетей iconНейрокомпьютерная техника: Теория и практика
В книге американского автора в общедоступной форме излагаются основы построения нейрокомпьютеров. Описаны структура нейронных сетей...
Определение параметров ориентации плоской грани с применением нейронных сетей iconНейрокомпьютерная техника: Теория и практика
В книге американского автора в общедоступной форме излагаются основы построения нейрокомпьютеров. Описаны структура нейронных сетей...
Определение параметров ориентации плоской грани с применением нейронных сетей iconАлгоритм поиска примитивов на фотографиях с применением нейронных сетей
...
Определение параметров ориентации плоской грани с применением нейронных сетей iconПластичность многослойных нейронных сетей
В работе выполнен анализ пластичности многослойных нейронных сетей. Получены точные формулы расчета степени пластичности по структурным...
Определение параметров ориентации плоской грани с применением нейронных сетей iconМетод анализа рюкзачных криптосистем с использованием искусственных нейронных сетей
Ых асимметричных криптосистем. В работе предложен новый метод анализа данной криптосистемы с использованием наращиваемого набора...
Определение параметров ориентации плоской грани с применением нейронных сетей iconПрименимость компактно поддерживаемых нейронных сетей для решения дифференциальных уравнений в частных
В работе рассматриваются численные методы решения дифференциальных уравнений в частных производных (дучп). Предложено использование...
Определение параметров ориентации плоской грани с применением нейронных сетей iconИсследование моделей сетевых устройств на базе нейронных сетей петри
Тема моего проекта «Разработка и исследование моделей сетевых устройств на базе нейронных сетей Петри»
Определение параметров ориентации плоской грани с применением нейронных сетей iconАкинин М. В., Конкин Ю. В. Применение нейронных сетей для решения задач уточнения топографических карт
Акинин М. В., Конкин Ю. В. Применение нейронных сетей для решения задач уточнения топографических карт. // Проблемы информатики в...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org