СОДЕРЖАНИЕ


На правах рукописи
УДК 004.8.032.26:537.86








МАНСУРОВ АЛЕКСАНДР ВАЛЕРЬЕВИЧ




АЛГОРИТМЫ ОБРАБОТКИ ДАННЫХ
РАДИОВОЛНОВОГО ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ПОВЕРХНОСТИ ЗЕМЛИ НА ОСНОВЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ




Специальность 05.13.18 - "математическое моделирование,
численные методы и комплексы программ"




АВТОРЕФЕРАТ
диссертации на соискание ученой степени
кандидата технических наук









Барнаул - 2006

Работа выполнена на кафедре радиофизики и волнового зондирования физико-технического факультета Алтайского государственного университета



Научный руководитель - доктор физико-математических наук,
профессор Комаров Сергей Александрович


Официальные оппоненты - доктор технических наук, профессор
Поляков Юрий Александрович


доктор технических наук, старший научный
сотрудник
Романов Андрей Николаевич


Ведущая организация - Институт вычислительного моделирования СО РАН (г. Красноярск)




Защита состоится 19 сентября 2006 года в 13.00 часов на заседании диссертационного совета Д 212.005.04 при Алтайском государственном университете по адресу 656043, Барнаул, пр. Ленина, 61, конференц-зал АлтГУ


С диссертацией можно ознакомиться в научной библиотеке Алтайского госуниверситета по адресу 656043, Барнаул, пр. Ленина, 61



Автореферат разослан __________________________ 2006 г.




Ученый секретарь диссертационного совета
доктор физико-математических наук, профессор Безносюк С.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Необходимость усиления контроля за глобальными процессами изменения климата, ростом негативного антропогенного воздействия на биосферу, а также потребности в прогнозировании природных и техногенных катастроф, в ведении хозяйственной деятельности выдвигают в качестве приоритетной задачи дистанционное зондирование природной среды. Ученые и специалисты многих стран активно разрабатывают методики изучения Земли с использованием дистанционных измерений, совершенствуется и техническая база мониторинга, и методы интерпретации данных. Ключевая роль в этом процессе отводится системам обработки данных дистанционного зондирования (ДЗ) с применением многоканальных оптических, а также микроволновым измерительным системам и радиолокаторам с синтезированной апертурой (РСА).
Радиоволновые (радиолокационные и радиометрические) методы исследования земной поверхности являются перспективными, поскольку не зависят от естественной освещенности местности и состояния атмосферы. Наблюдения в радиоволновом диапазоне чувствительны к влажностным, геометрическим и диэлектрическим характеристикам объектов. Это делает возможным ведение мониторинга объектов и определение характеристик объектов, которые недоступны для оптических систем наблюдения. Один из последних выведенных на орбиту спутников - ALOS - помимо сенсоров видимого и ИК-диапазона оборудован РСА PALSAR с разрешением от 10 до 100 м (L-диапазон). В 2007 году готовится к запуску спутник SMOS, имеющий на борту усовершенствованный радиометр L-диапазона для изучения влажности почв и солености океанов. Однако обработка результатов радиолокационных и радиометрических исследований является более сложной по сравнению с оптическими системами мониторинга и требует нетривиальных методик, адаптированных к физическим и техническим особенностям формирования данных. Также для повышения оперативности при мониторинге природных ресурсов необходимы новые методы экспресс-анализа и быстрой обработки данных ДЗ в режиме реального времени.
Одним из направлений дальнейшего совершенствования методов изучения природных ресурсов является использование искусственных нейронных сетей (ИНС), обладающих способностью реализовать широкий класс функций без априорных допущений о законах их распределения. Повышенный интерес к применению ИНС в подобного рода задачах объясняется простотой и эффективностью, с которой нейронные сети выполняют функциональные преобразования при обработке сигналов - зачастую при отсутствии определенного закона или модели, а также в условиях работы с зашумленными данными. На основе их обучения может быть обеспечено более точное и оперативное получение искомых параметров в реальном масштабе времени. Разработка эффективных алгоритмов, основывающихся на искусственных нейронных сетях, для выполнения задач подобного класса представляет собой актуальную проблему данного исследования.
Цель исследования - разработка алгоритмов восстановления температуры и влажности почвенного покрова, мониторинга овражной сети по данным дистанционного зондирования почвенного покрова в радиоволновом диапазоне с применением искусственных нейронных сетей.
Основные задачи исследования:
1. анализ методик применения нейросетевых компонент в составе алгоритмов обработки данных дистанционного зондирования;
2. разработка методики применения нейросетевых алгоритмов для обработки данных дистанционного зондирования земных покровов с целью получения оптимального решения;
3. разработка и апробация основанного на искусственной нейронной сети алгоритма определения влажности и температуры почвенного покрова по данным радиометрического дистанционного зондирования;
4. разработка и апробация алгоритма определения овражной сети по радиолокационному изображению при помощи искусственной нейронной сети.
Объект исследования. Алгоритмы и методы обработки данных дистанционного зондирования, использующие в основе своей работы искусственные нейронные сети.
Предмет исследования. Разработка и исследование алгоритмов обработки радиометрических и радиолокационных данных дистанционного зондирования поверхности Земли с применением нейронных сетей.
Методы исследования. Для реализации цели и задач работы используются: методы нейроинформатики, методы математического моделирования и оптимизации, математического моделирования взаимодействия электромагнитных волн с почвенным покровом, имеющим геометрические и диэлектрические неоднородности, методы вейвлет-анализа.
Научная новизна работы:
1. Предложены основывающиеся на ИНС алгоритмы обработки данных радиометрического дистанционного зондирования и радиолокационных изображений, сформированы схемы анализа работы предложенных алгоритмов и адаптации их к конкретной задаче;
2. Продемонстрирован нейросетевой способ определения неоднородности распределения влаги в приповерхностном слое почвы по данным многоканальных измерений в СВЧ-диапазоне;
3. Впервые предложен базирующийся на ИНС и вейвлет-анализе метод выделения овражной сети на радиолокационном изображении;
4. Экспериментально показано преимущество РЛИ SIR-C (L-диапазон) с поляризацией HV над РЛИ JERS-1 (L-диапазон) с поляризацией HH при нейросетевом определении овражной сети на радиолокационных изображениях.
Практическая значимость работы. Разработанные алгоритмы обработки данных дистанционного зондирования земных покровов в радиодиапазоне могут быть использованы в сельском хозяйстве, для оперативной обработки данных зондирования и контроля земельных ресурсов, для наполнения баз данных ГИС при интеграции результатов в геоинформационные системы, а также при решении различных задач обработки данных дистанционного зондирования Земли.
На защиту выносятся следующие положения:
1. Базирующийся на искусственной нейронной сети алгоритм определения влажности и температуры почвенного покрова по данным радиометрического дистанционного зондирования в режиме реального времени;
2. Предложенный алгоритм определения влажности и температуры почвенного покрова дает возможность находить неоднородность распределения влаги в приповерхностном 5-сантиметровом слое почвы при многоканальных измерениях в микроволновом диапазоне (4 и более каналов) на разных частотах и двух поляризациях;
3. Алгоритм выделения овражной сети по радиолокационным изображениям, полученным с помощью радаров с синтезированной апертурой с использованием искусственной нейронной сети и методов вейвлет-анализа;
4. Разработанный алгоритм выделения овражной сети выполняет классификацию наиболее точно при использовании радиолокационных изображений в диапазоне L и поляризации HV для аппарата SIR-C.
Апробация работы. Результаты диссертационного исследования докладывались, обсуждались и изложены на следующих конференциях: международной конференции молодых ученых и студентов "Актуальные проблемы современной науки" (Самара, 2000); международной конференции студентов, аспирантов и молодых ученых по фундаментальным наукам "Ломоносов-2003" (Москва, 2003); всероссийской конференции "Дистанционное зондирование поверхности Земли и атмосферы" (Иркутск, 2003); 4-й международной конференции молодых учёных и студентов "Актуальные проблемы современной науки" (Самара, 2003); международной научной конференции "Татищевские чтения: актуальные проблемы науки и практики" (Тольятти, 2004) и на XII Всероссийском семинаре "Нейроинформатика и ее приложения" (Красноярск, 2004).
Публикации. По теме диссертации опубликовано 11 работ, в том числе 5 - в научных журналах и сборниках научных трудов.
Объем и структура диссертации. Диссертация состоит из введения, главы с обзором литературы и описанием существующих методов и технологий исследования и обработки данных ДЗ, двух глав с описанием собственных исследований, заключения и списка литературы. Общий объем диссертации составляет 127 страниц, работа содержит 25 рисунков и 9 таблиц. Список литературы содержит 137 цитируемых источников отечественных и зарубежных авторов.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность работы, сформулированы задачи исследования и дана общая характеристика исследования.
В первой главе "Обзор современных методов обработки радиолокационных и радиометрических данных дистанционного зондирования" автором дается классификация современных методов обработки радиолокационных и радиометрических данных дистанционного зондирования. Анализ и обработка данных дистанционного зондирования в целом сводится к задачам классификация объектов по экспериментальным данным и определению количественных параметров (инверсии).
Традиционные подходы к решению задач классификации основывается на применении к данным статистической модели сигналов (по возможности простой), которая использует распределения вероятностей (обычно - гауссовы), связанные с классами образов. Это объясняется тем, что вследствие случайного характера протекания природных явлений результаты ДЗ подвержены случайным изменениям, маскирующим характерные различия между классами, а исследуемые классы могут перекрываться в пространстве измерений. Особенность формирования изображений земной поверхности, получаемых с радиолокаторов с синтезированной апертурой, обязывает учитывать при обработке, так называемый, мультипликативный спекл-шум, что приводит к существенному усложнению статистических моделей (гамма, К-распределение вероятностей) и самого алгоритма в целом. В большей степени это относится к многоканальным радиолокационным изображениям, алгоритмы обработки которых изначально базируются на рабочих гипотезах о распределении многомерных данных и сейчас находятся в процессе активной разработки и совершенствования, образуя отдельную большую область исследования - поляриметрию.
Решение задач инверсии связано с выбором определенной модели, описывающей изучаемый класс объектов, определением и подстройкой ее параметров в соответствии с некоторой оценкой качества работы такой модели. При обработке радиолокационных и радиометрических данных применяется модельное представление процессов взаимодействия радиоволн со средой (объектами), определение радиоизлучательных и диэлектрических характеристик объектов. В виду сложности протекающих в природе процессов, модели зачастую оказываются сложными, а функциональные зависимости не выражаются в явном виде. Модель связи между искомыми и измеряемыми параметрами может быть статистической. Тогда решение задачи выполняется статистическими методами - получением статистических оценок искомых параметров для конкретной совокупности измеряемых характеристик.
Обзор традиционных подходов к анализу и обработке данных дистанционного зондирования в радиодиапазоне позволяет отметить следующие особенности:
1. заявленные и разрабатываемые алгоритмы достаточно сложны и не столь просто реализуемы. Их применение связано с трудностями, вызванными большой размерностью входных данных, невозможностью получить ряд требуемых параметров непосредственно из результатов радиоволнового зондирования, а также рядом прочих факторов, приводящих к нелинейности задачи в целом;
2. точность работы сложных алгоритмов недостаточна и пока проигрывает обработке данных непосредственно человеком. Используемые модели работают, исходя из определенного рода приближений и допущений. Алгоритмы используют вероятностные модели, которые только пытаются соответствовать реальному поведению данных, либо только для таких вероятностных моделей возможно обосновать и реализовать рабочий алгоритм;
3. эффективные методы классификации, базирующиеся лишь на данных радиоволнового зондирования, существуют только для ограниченных случаев. Остается открытым вопрос о совместном использовании информации, полученной в радиоволновом диапазоне, с информацией, полученной из других источников. Актуален вопрос доступности данных - некоторые методики обработки могут предъявлять к данным ДЗ невыполнимые на сегодняшний момент требования (например, невозможность в данный момент получить информацию в нужном диапазоне, с нужной поляризацией и т.п.).
Исходя из изложенного материала, можно утверждать, что обратные задачи ДЗ являются слабо формализованными (плохо структурированными, плохо определенными) задачами. Но подобные задачи и являются преобладающими в человеческой деятельности. Слабо формализованные задачи обладают следующими свойствами:
1. Ошибочностью, неоднозначностью, неполнотой и противоречивостью знаний о предметной области и о решаемой задаче. Для этих задач трудно строить формальные теории и применять классические математические методы, поскольку в ситуациях, в которых они возникают, имеет место один из двух случаев: а) уровень формализации соответствующей предметной области и (или) доступная информация таковы, что они не могут составить основу для синтеза математической модели, отвечающей классическим математическим или математико-физическим канонам и допускающей изучение классическими аналитическими или численными методами; б) математическая модель в принципе может быть построена, однако ее синтез или изучение связаны с такими затратами (сбор необходимой информации, вычислительные ресурсы, время), что они существенно превышают выигрыш, приносимый решением, либо выходят за пределы существующих технических возможностей, либо делают решение задачи бессмысленным.
2. Ошибочностью, неоднозначностью, неполнотой и противоречивостью исходных данных. В этих задачах "по определению" существует "плохая" исходная информация, характеризующая сложную в семантическом и структурном отношении ситуацию, - она ограниченная, неполная (с пропусками), разнородная, косвенная (характеристики внешних проявлений процесса, причем не всегда относящиеся к принципиальным особенностям лежащего в его основе механизма), нечеткая, неоднозначная, вероятностная. В этих задачах известно слишком мало для того, чтобы можно было пользоваться классическими методами решения (моделями), но все-таки известно достаточно, чтобы решение было возможно.
Для слабо формализованных задач в некоторых предметных областях могут быть свойственны также большая размерность пространства решения и высокая динамика предметной области.
Один из эффективных подходов к решению слабо формализованных задач, а также созданию систем, способных самостоятельно анализировать природные объекты по предоставляемой информации и формировать экспертное заключение состоит в использовании информационных моделей на основе искусственных нейронных сетей (ИНС). Основной принцип такого подхода состоит в моделировании внешнего функционирования системы с помощью "черного ящика" с чисто информационным описанием - на основе данных экспериментов или наблюдений. Обычно такие модели проигрывают формальным математическим по степени "прозрачности" и "объяснимости" получаемых результатов, однако важной особенностью таких моделей является отсутствие ограничений на сложность моделируемых систем, а также возможность функционировать в режиме реального времени, что является все более актуальным аспектом в области обработки данных мониторинга Земли.
Использование ИНС позволяет избежать ряда проблем при решении задач инверсии и классификации данных ДЗ. Преимущества ИНС очевидны в случае, когда исследуемые данные являются разнотипными и плохо согласуются с известными законами распределения, на которых базируются статистические алгоритмы. Несмотря на популярность карт Кохонена и RBF-сетей, наиболее распространенным типом ИНС является многослойный персептрон, для которого имеется развитая база алгоритмов обучения. В работах большинства исследователей применение ИНС называется эффективным и успешным в сравнении с традиционными методами при соответствующих ограничениях и допущениях, однако попыток провести анализ работы использующего ИНС алгоритма практически не проводится. Между тем, привлечение развитых методик нейроинформатики позволит получать дополнительные знания о работе создаваемых ИНС и проблемной области исследования, что приведет к получению оптимальных для данной проблемы ИНС-решений. Этот этап является важным, поскольку позволяет удостовериться в правильности работы ИНС, расширить знания об особенностях проведенных измерений и зависимости искомых параметров от входных величин, скорректировать необходимый набор измеряемых данных для последующей обработки.
Таким образом, опираясь на большое количество проведенных исследований для самого широкого спектра задач обработки данных дистанционного зондирования, можно сделать вывод о целесообразности и перспективности применения ИНС для решения задач данной работы. Также следует отметить необходимость интеграции методик нейроинформатики по исследованию и оптимизации нейросетевого блока в общую методику разработки базирующегося на искусственной нейронной сети алгоритма обработки данных ДЗ, что дополняет основную задачу исследования - разработку алгоритмов обработки данных радиометрического и радиолокационного дистанционного зондирования с применением искусственных нейронных сетей.
Во второй главе "Восстановление параметров почвенного покрова по данным радиометрического зондирования" изложен способ нейросетевого определения температуры и влажности почв по данным радиометрических измерений, методика оптимизации и анализа нейросетевого алгоритма (решение задачи инверсии).
При дистанционном зондировании важным является факт зависимости мощности принимаемого излучения от температуры, влажности, шероховатости и минералогического состава почв. В целях удобства проведения исследования работы нейросетевого алгоритма этап выполнения радиометрических измерений (получение значений радиояркостных температур) смоделирован искусственно.
Радиояркостная температура TB связана с мощностными характеристиками излучения следующим соотношением:

(1)

где TC - температура растительного покрова, K; TS - температура почвы, K; Rsur - коэффициент отражения для поверхности; ? - коэффициент прохождения для растительности (в работе полагается ? = 1).
Вычисление коэффициента отражения осуществляется численно методом инвариантного погружения из-за вертикальной неоднородности входящей в коэффициент отражения комплексной диэлектрической проницаемости (КДП). Неоднородность реализована посредством введения профилей влажности
W = W(z).


Рис.1. Используемый в работе профиль влажности W = W(z)

Вариацией параметров d1 и d2 реализуются практически все возможные профили влажности почв, оказывающие влияние на интенсивность излучения.
Для расчета входящей в коэффициент отражения комплексной диэлектрической проницаемости (КДП) почвы (?) в работе использована рефракционная модель диэлектрических свойств смесей. Она представляет собой описание влажностной зависимости диэлектрической проницаемости почв. Модель является наиболее успешной при работе в диапазонах СВЧ, учитывает двойственность диэлектрических свойств почв, определяемых содержанием связанной и свободной воды [Комаров С.А., Миронов В.Л. Микроволновое зондирование почв. - Новосибирск: Научно-издательский центр СО РАН, 2000 - 289 с.]. Различие между свободной и связанной водой устанавливается при представлении влажностной зависимости для квадратного корня из комплексной диэлектрической проницаемости, поскольку экспериментально наблюдается точка излома влажностной зависимости при значениях объемной влажности W=WT. Меньшие значения соответствуют влаге в грунте в связанном состоянии, большие - в свободном. Учитывая, что , рефракционная модель имеет вид:

(2)



где ?' и ?'' - действительная и мнимая часть КДП почвы, ns - коэффициент преломления для почвы, nd - коэффициент преломления для сухой смеси, nb - коэффициент преломления для связанной воды, nu - коэффициент преломления для свободной (несвязанной) воды, k - коэффициент поглощения с индексами, аналогичными коэффициентам преломления, WT - объемное содержание связанной воды; W - объемное содержание свободной воды.
Значения радиояркостных температур вычисляются для широкого диапазона температур (273К ... 301К), влажности (W = W(z, d1, d2)) и типов почв, которые задаются через WT (0.02 ... 0.21). На основе опыта предыдущих исследований проведено моделирование измерений с орбитальных комплексов SMOS (1.43 ГГц, L-диапазон, углы визирования 50? и 20?, поляризация H и V) и AMSR (10.7 ГГц, 55?, поляризация H и V). К значениям радиояркостных температур для приближения модельных результатов к реальным добавлен аддитивный случайный шум с нормальным распределением и стандартным отклонением ? = 1К или ? = 2К. Влияние неровности поверхности учитывается с помощью параметра RGH, задающего среднеквадратичное (эффективное) значение возвышенностей. Таким образом, входными данными являются 6 каналов со значениями радиояркостных температур на разных частотах и поляризациях. Определяемыми параметрами являются температура почвы, влажность на поверхности W и влажность в слое почвы толщиной 5 см от поверхности Wsl.


Концепция получения и работы алгоритма определения температуры и влажности почв по данным радиометрического наблюдения с применением ИНС, а также получения и обучения самой нейронной сети приведена на рис. 2. В работе использована ИНС типа "многослойный персептрон" с функцией активации "рациональная сигмоида" с двумя скрытыми слоями. Данные проходят предобработку - перенормировку в интервал [-1; 1]. Обучение ИНС осуществлено методом обратного распространения ошибки с оптимизацией по методу сопряженных градиентов. Число нейронов в скрытых слоях подбирается в процессе выполнения численного эксперимента, изначально полагается по 1 нейрону в каждом скрытом слое и далее увеличивается по мере необходимости. Из комплекса обученных ИНС выбирается наилучшая. На каждом этапе из 4000 сгенерированных отсчетов случайным образом отбирается 5% для составления обучающей выборки. Тестовая выборка включает в себя 50% отсчетов. Точность определения температуры поверхности задана равной ? 2К, точность получения W и Wsl равной ? 0.02.
Основными показателями оценки качества определения целевых параметров являются коэффициент корреляции (R) и среднеквадратическая ошибка (RMSE) между полученными и тестовыми данными. В условиях созданной искусственно модельной реальности во всех случаях наиболее удачной оказывалась ИНС с 5 нейронами в каждом скрытом слое. Примеры, на которых ИНС не смогли обучиться, удалялись из обучающей выборки - таких примеров иногда оказывалось до 30 % от всего числа, что в последствии не сказывалось отрицательно на работе ИНС. Увеличение числа нейронов в скрытых слоях приводит к ухудшению работы ИНС - сокращению числа определенных с заданной точностью искомых параметров и увеличению среднеквадратической ошибки. Такое поведение объясняется тем, что ИНС теряют свои обобщающие свойства и обучаются реагировать на влияние различных случайных параметров как на полезный сигнал, поскольку обладают достаточным запасом вычислительной мощности.
Выполненные численные эксперименты и результаты нейросетевого определения температуры и влажности почв приведены в Таблице 1. Согласно результатам, ИНС является устойчивой к шуму, присутствующему во входной информации, адаптируемой к вариациям профиля влажности и неровности поверхности. Обладая при аппаратной реализации высоким параллелизмом и требуя для работы непосредственных результатов измерений, предложенный алгоритм способен функционировать в режиме реального времени. Для всех определяемых параметров R > 0.900, а значение RMSE ? 3.210 для TS и RMSE ? 0.360 для W и Wsl. Наличие на входах ИНС аддитивного шума с ?>0К в большей степени влияет (ухудшает) на восстановление параметра TS , а неровность поверхности RGH - на определение влажности W и Wsl. Близость к поверхности переходного слоя толщиной d2 увеличивает общий градиент влажности в почвогрунте, что усиливает восприимчивость системы к температурным шумам на входе и неровности поверхности.

Таблица 1.
Восстановление параметров почвенного покрова с помощью использующего ИНС алгоритма по данным радиометрического зондирования


TS, K
W
Wsl

R
RMSE, К
R
RMSE
R
RMSE
1
WT=0.05...0.21, d1=8, d2=0.05...3
0,989
1,115
0,979
0,022
0,979
0,022
2
WT =0.05...0.21, d1=8, d2=0.05...3, ?=1K
0,973
1,729
0,977
0,024
0,977
0,024
3
WT =0.05...0.21, d1=8, d2=0.05...3, ?=2K
0,910
3,141
0,972
0,026
0,972
0,026
4
WT =0.05...0.21, d1=3, d2=0.05...3
0,986
1,239
0,978
0,023
0,973
0,024
5
WT =0.05...0.21, d1=3, d2=0.05...3, ?=1K
0,971
1,796
0,974
0,025
0,968
0,026
6
WT =0.05...0.21, d1=3, d2=0.05...3, ?=2K
0,922
2,925
0,971
0,026
0,961
0,029
7
WT =0.05...0.21, d1=1, d2=0.05...3
0,986
1,298
0,980
0,022
0,943
0,030
8
WT =0.05...0.21, d1=1, d2=0.05...3, ?=1K
0,974
1,698
0,976
0,024
0,926
0,034
9
WT =0.05...0.21, d1=1, d2=0.05...3, ?=2K
0,908
3,210
0,965
0,029
0,887
0,042
10
WT =0.05...0.21, d1=3, d2=0.05...3
0,986
1,239
0,978
0,023
0,973
0,024
11
WT =0.05...0.21, d1=3, d2=0.05...3, RGH =1.0
0,989
1,218
0,965
0,029
0,959
0,029
12
WT =0.05...0.21, d1=3, d2=0.05...3, RGH =2.0
0,988
1,165
0,959
0,031
0,951
0,032
13
WT =0.05...0.21, d1=3, d2=0.05...3, RGH =3.0
0,985
1,300
0,959
0,031
0,951
0,032
14
WT =0.05...0.21, d1=8, d2=0.05...3
0,989
1,115
0,979
0,022
0,979
0,022
15
WT =0.05...0.21, d1=8, d2=0.05...3, RGH =1.0
0,986
1,269
0,972
0,025
0,972
0,025
16
WT =0.05...0.21, d1=8, d2=0.05...3, RGH =3.0
0,984
1,305
0,971
0,026
0,971
0,026
17
WT =0.05...0.21, d1=8, d2=0.05...3, RGH =6.0
0,983
1,410
0,942
0,036
0,942
0,036
18
WT =0.05...0.21, d1=1...5, d2=3
0,972
1,792
0,975
0,024
0,975
0,024

Выполнение для ряда экспериментов параллельно с алгоритмом, использующим искусственную нейронную сеть, традиционной для лабораторных расчетов линейной регрессии подтверждают адекватность ИНС-подхода в целом.
Вычисленные значения W и Wsl позволяют определять градиент влажности в приповерхностном слое почвы. Полагая, что над исследуемым участком профиль влажности задается выражением (3), а Wsl характеризует объемное содержание влаги в верхнем 5-см слое почвы (среднее в слое), градиент влажности GR вычисляется следующим образом:

(3)
(4)

В рамках исследования свойств полученных в исследовании алгоритмов выполнено определение констант Липшица и значимости входов ИНС. Сравнение констант Липшица ИНС и обучающей выборки позволяет сделать вывод о способности уже обученной ИНС данной конфигурации реализовать искомые зависимости, кроме эксперимента №18, где выборочная константа намного превышает константу для ИНС. Разумное усложнение архитектуры нейронной сети с целью увеличения константы для ИНС это неравенство не изменяет, и оценка работы не улучшается.


Рис. 3. Последовательное сокращение числа входных параметров ИНС экспериментов №3 и №4 (Таблица 1).

Анализ значимости входов ИНС выполнен путем поэтапного удаления наименее значимого входа и последующим тестированием полученной ИНС (рис. 3). Для сетей, функционирующих в условиях смоделированной в исследовании реальности, установлено, что для почв с глубоким верхним однородным слоем (d1=8), наиболее значимыми и достаточными для работы являются всего два входа - значения радиояркостных температур с аппарата AMSR (10.7 ГГц, 55?, поляризация H и V). В прочих случаях (d1=3, d1=1 или RGH ? 0) для ИНС достаточными для функционирования оказываются 3 входа, данные в одном из которых отличаются от данных в двух других либо по частоте, либо по углу обзора аппарата (например, два входа - измерения на частоте 10.7 ГГц, угол 55?, поляризация H и V, и третий вход - 1.43 ГГц, угол 50?, поляризация H). Сокращение размерности входного пространства позволяет уменьшить требуемый объем измеряемых данных и исключить дополнительную шумовую нагрузку на ИНС в виде малозначимых входов. И все же в условиях, приближающихся к реальности, ИНС для большей стабильности должна обладать как минимум 4 входами (две различных частоты и поляризации соответственно), а лучше - всеми исходными 6.

Таблица 2.
Сравнение числа итераций при обучении для 1 общей (3-в-1) и
3 независимых ИНС

Итераций при обучении

3-в-1
Ts
W
Wsl
1
WT=0.05...0.21, d1=8, d2=0.05...3
1286
26
37
35
3
WT =0.05...0.21, d1=8, d2=0.05...3, ?=2K
1517
1654
1347
1410
4
WT =0.05...0.21, d1=3, d2=0.05...3
1732
1028
1512
1587
15
WT =0.05...0.21, d1=8, d2=0.05...3, RGH =1.0
1625
20
1318
1405


Исследование ИНС как системы, дающей комплексный ответ, демонстрирует возможность в некоторых случаях (близких к идеальным) получить выигрыш в скорости обучения ИНС в 10-30 раз, если алгоритм использует комплекс независимых ИНС, каждая из которых отвечает за свой один выходной параметр всей системы (Таблица 2). В сравнении с одной универсальной ИНС в терминах R и RMSE видимый выигрыш отсутствует.
В третьей главе "Мониторинг сети оврагов с помощью нейронной сети по радиолокационным изображениям" изложены результаты разработки и апробации способа мониторинга сети оврагов с использованием искусственной нейронной сети и методов вейвлет-анализа (решение задачи классификации).
В качестве объектов исследования были взяты радиолокационные изображения (РЛИ) территории Алтайского края, полученные в период с 1992 по 1997 гг. с аппарата JERS-1 в L-диапазоне, поляризация HH, разрешение 12.5 м в 1 пикселе, а также многоканальные изображения аппарата SIR-C в L-диапазоне, разрешение 25 м в 1 пикселе. Основным дешифровочным признаком оврагов на РЛИ является высокий уровень интенсивности сигнала за счёт отражения от вертикальных стенок (склонов), а также из-за наличия растительности на склонах (если овраг поросший). Сложность состоит в том, что подобная высокая интенсивность сигнала характерна и для искусственных объектов, лесополос и лесных/кустарниковых массивов, и для некоторых площадей, занятых сельскохозяйственными культурами. Овражная сеть протяженна вдоль направления развития эрозионных процессов, а прилегающая к ней территория зачастую отчуждена и занята степной или луговой растительностью.
Для проведения классификации в качестве целевых заданы участки, определяющие: 1) овражную сеть, 2) лесные и кустарниковые участки (насаждения), 3) прочие элементы. С учетом "похожести" на РЛИ лесополос и искусственных насаждений, имеющих линейную форму, на линии оврагов, они вынесены в отдельный класс для повышения избирательности работы базирующегося на ИНС алгоритма. Общая схема выделения овражной сети на радиолокационном изображении приведена на рис. 4.



Изображение-"маска" для определения областей высокой интенсивности сигнала формируется по исходному изображению проходом окна размером 3х3 пикселя с последующей бинаризацией и фильтрацией от помех. Информация об особенностях интенсивности и текстуры на анализируемом участке получается с помощью прямого вейвлет-преобразования для дискретного сигнала в окне размером 64х64 пикселя над рабочим участком с последующим переходом к многомасштабному анализу изображения с извлечением его текстурных свойств.
На каждом шаге прямого преобразования сигнал распадается на две составляющие - приближение с более низким разрешением и детализацию, что по аналогии с преобразованием Фурье называют соответственно низкочастотной (НЧ) и высокочастотной (ВЧ) составляющей. В терминах теории обработки сигналов один шаг преобразования эквивалентен свёртке сигнала с соответствующими НЧ-фильтром h и ВЧ-фильтром g - квадратурными зеркальными фильтрами, определяющимися через набор своих коэффициентов.
В работе применяется вейвлет-функция Добеши (Daubechie - D4), для которой h и g задаются 4 коэффициентами c0,...c3 :

(5)

Значения коэффициентов определяются из условий, налагаемых на сами вейвлет-функции и выбираемый базис, и оказываются равными:

(6)

Основной подход к извлечению текстурных свойств изображения базируется на локальных статистических свойствах интенсивности пикселей и заключается в вычислении статистик первого и второго порядков (матриц смежности). Многомасштабное представление изображения является более революционным и эффективным шагом в текстурном анализе изображения, что подтверждается исследованиями зрительной системы человека. Математической основой многомасштабного текстурного анализа является теория вейвлет-анализа, информация о текстуре при этом извлекается из НЧ-составляющей изображения и ВЧ-детализирующей информации. С каждым шагом вейвлет-преобразования масштаб рассматриваемого изображения уменьшается в 2 раза.
Вейвлет-преобразование в рабочем окне размером 64х64 пикселя выполняется дважды, в результате чего из полученных коэффициентов преобразования Dn,k вычисляется 7 энергетических спектральных коэффициентов Wn, которые подаются на вход нейросетевого решателя (рис. 5).


Рис. 5. Выполнение вейвлет-преобразования в рабочем окне и вычисление спектральных коэффициентов.

Нейросетевой решатель включает в себя ИНС типа "многослойный персептрон" с функциями активации вида "рациональная сигмоида". ИНС состоит из двух скрытых слоев и обучается методом сопряженных градиентов. Данные проходят предобработку - перенормировку в интервал
[-1; 1]. На выходе решатель выдает ответ о принадлежности элемента (фрагмента) изображения к целевым классам. В силу того, что работа с РЛИ ведётся в специализированной среде ENVI 3.2, реализация адаптивного алгоритма выполнена в виде подпрограммы-модуля, который написан на языке IDL и интегрируется в среду ENVI. На РЛИ выделяются участки (ROI - Region Of Interest), по которым получаются обучающие и тестовые выборки. Модуль включает в себя процедуру формирования изображения-"маски", вычисления коэффициентов вейвлет-спектра и реализацию имитатора ИНС.
На начальном этапе ИНС содержат по 10 нейронов в каждом скрытом слое. Результаты работы алгоритма на тестовых участках РЛИ приведены в Таблице 3.
Исходя из приведенных результатов, работа с фрагментом радиолокационного изображения SIR-C, L-диапазон, поляризация HV позволяет получить более высокую точность классификации (на 7% - 17%).
Это опровергает предварительно проведенное изучение и анализ множества входных данных W1 ... W7, согласно которому наилучшее распознавание овражной сети должно было происходить на РЛИ JERS-1, L, HH. Точно определяются активные овраги; участки с поросшими и пологими склонами относятся к классу "насаждения". Возникающие ошибки классификации, очевидно, происходят в силу особенностей формирования РЛИ над искусственными объектами и территориями, занятыми под сельхозугодия, когда текстурные характеристики и значение интенсивности сигнала становятся схожими со значениями, характерными для объектов первых двух классов.


Таблица 3.
Результат тестирования алгоритма определения сети оврагов на различных фрагментах РЛИ


Зона оврагов
Насаждения
Прочее
Изображение
Верно
Неверно
Всего
Верно
Неверно
Всего
Верно
Неверно
Всего
Фрагмент 1
(JERS-1, L, HH)
724
83%
146
17%
870
354
89%
44
11%
398
407
90%
43
10%
450
Фрагмент 2
(JERS-1, L, HH)
290 92%
26 8%
316
197 87%
30 13%
227
224
92%
19
8%
243
Фрагмент 3
(SIR-C, L, HV)
332
98%
3 2%
335
370 96%
12 4%
382
338
94%
23
6%
361


Таблица 4.
Результат тестирования различных конфигураций ИНС на фрагменте изображения SIR-C, L-диапазон, поляризация HV


Зона оврагов
Насаждения
Прочее
№ ИНС

(нейронов в слоях)
Верно
Неверно
Всего
Верно
Неверно
Всего
Верно
Неверно
Всего
1 (1-2)
320 95%
15 5%
335
358 94%
24 6%
382
381
92%
32
8%
413
2 (2-3)
331 98%
4 2%
335
372 97%
10 3%
382
386
93%
27
7%
413
3 (2-5)
330 98%
5 2%
335
371 97%
11 3%
382
384
93%
29
7%
413
4 (3-6)
332 98%
3 2%
335
375 98%
7
2%
382
382
92%
31
8%
413


Проведенный анализ значимости элементов входного вектора нейронной сети позволяет сократить ее размерность с 7 до 4 входов. Однозначного определения значимых входов (спектральных коэффициентов) для всех исследуемых ИНС достичь не удается. Во многом это определяется схожестью спектральных коэффициентов по своему смыслу (например, W3 и W6, W2 и W5, ...). Все же для большинства ИНС значимыми являются вход W7, который пропорционален интенсивности сигнала по рабочему окну, а также группа входов W3-W6, соответствующая ВЧ-составляющей двойного вейвлет-преобразования.
Определение оптимальной конфигурации нейронной сети выполнено путем последовательного наращивания числа нейронов в двух скрытых слоях (от 1 нейрона и более).
Согласно полученным данным (Таблица 4), приемлемый результат обработки тестовой выборки достигнут уже на первом этапе (ИНС №1). Существенных изменений в дальнейшем не происходит (ИНС №2 - ИНС №4). В качестве оптимальной выбрана ИНС №2, имеющая 2 нейрона в первом скрытом слое и 3 нейрона во втором. Анализ работы уже обученной ИНС №2 позволяет предположить, что основными рабочими элементами скрытых слоёв являются первый (1) нейрон первого скрытого слоя и нейроны 1 и 2 второго скрытого слоя, что повторяет конфигурацию ИНС №1. Оставшиеся нейроны обеспечивают дополнительную стабильность и коррекцию работы нейросети.



Рис. 6. Исходный фрагмент (а) и результат обработки (б) радиолокационного изображения

На конечном этапе выполнения классификации отбираются нужные для дальнейшей работы классы, а остальные фильтруются. Полученный результат либо используется непосредственно для визуального анализа и совмещения с картографическими и прочими изображениями местности, сопоставления с подобными предыдущими данными для осуществления процесса мониторинга роста сети оврагов, либо переводится в векторный формат для последующего использования в пакетах ГИС.
Пример выделения овражной сети на радиолокационном изображении представлен на рис. 6: а) - исходный фрагмент, б) - результат работы алгоритма.

В заключении диссертации формулируются основные выводы и результаты работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Основные результаты работы заключаются в следующем:

1. Проведен анализ возможностей применения нейросетевых компонент в составе алгоритмов и методов обработки данных дистанционного зондирования; выполнено сравнение с традиционными методами обработки и сформулирована необходимость интеграции методик нейроинформатики по исследованию и оптимизации искусственных нейронных сетей в процесс получения алгоритмов обработки данных дистанционного зондирования, использующих искусственные нейронные сети.
2. Разработан и апробирован алгоритм нейросетевого определения влажности и температуры почвенного покрова по данным радиометрического дистанционного зондирования. Выполнено исследование рабочей нейронной сети предлагаемого алгоритма с целью определения оптимальной внутренней структуры и вектора входных данных.
3. Применение основанного на искусственной нейронной сети алгоритма определения влажности и температуры почвенного покрова позволяет определять неоднородность распределения влаги в приповерхностном 5-см слое почвы.
4. В результате проведенного исследования работы алгоритма определения влажности и температуры почвенного покрова установлена необходимость многоканальных измерений (4 и более каналов) на разных частотах и поляризациях. Также отмечено, что в условиях, близких к идеальным (модельным), комплекс из нескольких нейронный сетей с одним выходом обучается в 10-30 раз быстрее, чем одна нейронная сеть с тремя выходами. В остальных случаях существенного выигрыша в скорости обучения, а также в терминах R и RMSE не наблюдается.
5. Разработан и апробирован алгоритм определения овражной сети по радиолокационному изображению с применением искусственной нейронной сети и методов вейвлет-анализа, позволяющий получать достоверный результат в более чем 85% случаев. Выполнено исследование нейронной сети предлагаемого алгоритма, в результате которого определена оптимальная внутренняя структура и вектор входных данных нейронной сети. Проведено исследование работы предложенного алгоритма на радиолокационных изображениях JERS-1 и SIR-C.
6. Применение метода нейросетевого определения овражной сети по радиолокационному изображению на изображении SIR-C (L,HV) увеличивает нижний порог точности распознавания до 94%.


ПУБЛИКАЦИИ ПО ТЕМЕ ИССЛЕДОВАНИЯ

1. Мансуров А.В. Применение нейронной сети для обработки результатов волнового зондирования почвенного покрова (определение влажности почв по радиояркостным температурам) // Тезисы докладов Международной конференции молодых ученых и студентов "Актуальные проблемы современной науки". Естественные науки. Часть 1. Секции: 1.1. Математика, 1.2. Физика, 1.3. Механика, 1.4. Геология. - Самара: СамГТУ, 2000. - с.51
2. Мансуров А.В. Применение нейронных сетей в обработке результатов радиометрического исследования гидрологического состояния почв // Физика, радиофизика - новое поколение в науке: Выпуск 2. Сборник работ аспирантов и студентов. / под ред. В.В. Полякова. - Барнаул: Изд-во Алт. ун-та, 2001. - с. 69-72.
3. Мансуров А.В. Нейросетевой подход к определению параметров почвенного покрова // Международная конференция студентов, аспирантов и молодых ученых по фундаментальным наукам "Ломоносов-2003". Секция "Физика" - М.: Физический факультет МГУ, 2003. - с.156.
4. Мансуров А.В. Применение искусственных нейронных сетей для определения параметров почвенного покрова // Тезисы докладов Всероссийской конференции "Дистанционное зондирование поверхности Земли и атмосферы". - Иркутск: ИСЗФ СО РАН, 2003. - с. 30.
5. Мансуров А.В. Нейросетевой способ восстановления влажности и температуры почв по данным дистанционного радиометрического зондирования // Молодежь Сибири - науке России: Сборник материалов межрегиональной научно-практической конференции. - Красноярск: СИБУП, КРО НС "Интеграция", 2003, часть II. - с. 25-30.
6. Мансуров А.В. Нейросетевая обработка данных мониторинга процессов замерзания/оттаивания вечной мерзлоты // Труды 4-й Международной конференции молодых учёных и студентов "Актуальные проблемы современной науки". Естественные науки. Части 4-8 Секции: Физика. Науки о Земле. География. Химия. - Самара: Изд-во СамГТУ, 2003. - с. 18-20.
7. Комаров С.А., Мансуров А.В. Восстановление параметров почвенного покрова территорий с помощью нейронной сети по данным радиометрического зондирования // Известия Алтайского государственного университета. - 2004. - №1. - с. 99-107.
8. Мансуров А.В. Нейросетевое прогнозирование и обработка данных мониторинга окружающей среды // Материалы Международной научной конференции "Татищевские чтения: актуальные проблемы науки и практики". Актуальные проблемы экологии и охраны окружающей среды. - Тольятти: Волжский университет им. В.Н. Татищева, 2004. - с.89-93.
9. Мансуров А.В. Нейросетевая методика мониторинга сети оврагов по радиолокационным изображениям // Нейроинформатика и ее приложения: Материалы XII Всероссийского семинара, 1-3 октября 2004 г. - Красноярск: ИВМ СО РАН, 2004. - с. 88-89.
10. Мансуров А.В. Мониторинг сети оврагов с помощью нейронной сети по радиолокационным изображениям // Известия Алтайского государственного университета. - 2005. - №1. - с. 124-127.
11. Мансуров А.В. Нейросетевой метод определения температуры и влажности неоднородно увлажненных почв по данным СВЧ-радиометрии // Омский научный вестник. - 2006 (в печати).





Мансуров Александр Валерьевич

Нейросетевые алгоритмы обработки данных
радиолокационного и радиометрического
дистанционного зондирования поверхности Земли


Автореферат


Подписано в печать Печать РИЗО
Объем 1.0 п.л. Формат 60х84/16 Бумага офсетная
Заказ № Тираж 100 экз.

Типография Алтайского государственного университета
656 049, Барнаул, ул. Димитрова, 66
??

??

??

??




2





СОДЕРЖАНИЕ