Принципы создания экспертно-информационных систем




Для целей ОВОС

Проведение любой экологической экспертизы основывается на использовании информации о состоянии окружающей среды и знаний о процессах, в ней происходящих.


Деградация наземных экосистем.Оценка степени деградац экосистемы проводится по критериям, которые определяют не тивные изменения в структуре и функционировании экосистем учитывают их пространственную дифференциацию по степе нарушенное™, а также динамику процессов деградации.

При оценке экологического состояния территории учитываеС ся как площадь проявления негативных изменений (так как п~ равной степени деградации участка территории возможность в становления обратно пропорциональна его площади), так и п странственную неоднородность распределения участков разн степени деградации на исследуемой территории. Скорость деград ции экосистем рассчитывается по 5—10-летним рядам наблюд ний.

Фитоценозы.Растительность как биотический компонент л~ бой природной экосистемы играет решающую роль в структур но-функциональной организации экосистемы и определении границ.

Фитоценоз не только весьма чувствителен к нарушениям окр; жающей среды, но и наиболее наглядно отражает изменение эк логической обстановки территории в результате антропогенно воздействия. Индикаторы оценки состояния растительности р~ личаются в зависимости от географических условий и типов эк систем. При этом учитываются негативные изменения как в стр туре растительного покрова (уменьшение площади коренных а социаций, изменение лесистости), так и на уровне растительн-сообществ и отдельных видов (популяций): изменение видово. состава, ухудшение ассоциированности и возрастного спектра ц нопопуляций.

Плотность популяции видов-индикаторов — один из важне ших показателей состояния экосистемы, высокочувствительный основным антропогенным факторам. В результате антропогенно воздействия плотность популяции «отрицательных» видов-инд каторов снижается, а «положительных» — возрастает. Порогов значением антропогенной нагрузки следует считать снижение (ю повышение) плотности популяции вида-индикатора на 20%, критическим значением — на 50 %.

Одним из существенных параметров популяции является во растной аспект — доля участия в ней особей разных возрасти-состояний. Возрастные состояния устанавливают на основан-комплекса морфологических признаков или абсолютного возрас в тех случаях, когда его определение не представляет особых труднений.

Состояние растительности можно рассматривать как индик тор уровня антропогенной нагрузки на природную среду обит ния (повреждение древостоев или хвои техногенными выброс ми, уменьшение проективного покрытия и продуктивности пас


6.2.1. Структура ЭИС

Считается, что информационные системы, ориентированные на задачи охраны окружающей среды и устойчивое развитие, вклю­чают в себя системы экологического мониторинга и служат функ­циональной основой процесса управления экологически безопас­ным развитием на различных иерархических уровнях территори­ального деления. Соответственно, такие системы должны обеспе­чивать решение множества задач:

обработку и накопление в базах данных результатов локального и дистанционного мониторинга и выявление параметров окружа­ющей среды, наиболее чувствительных к антропогенным воздей­ствиям;

анализ результатов экологического мониторинга и подготовку интегрированной информации и электронных карт, отражающих состояние окружающей среды региона;

накопление информации по временным трендам параметров окружающей среды с целью экологического прогнозирования;

имитационное моделирование процессов, происходящих в окру­жающей среде, с учетом существующих уровней антропогенной нагрузки и возможных результатов принимаемых управленческих решений;

оценку риска для существующих и проектируемых предприя­тий, отдельных территорий с целью управления безопасностью техногенных воздействий;

разработку прогнозов вероятных последствий хозяйственной деятельности и рекомендаций по выбору вариантов безопасного развития региона для систем поддержки принятия решения;

предоставление информации для экологического образования, для средств массовой информации и т.д.

Экспертно-информационные системы должны быть ориенти­рованы на комплексное использование результатов экологическо­го мониторинга, обеспечивая преобразование первичных резуль­татов измерений в форму, пригодную для поддержки принятия решений. При этом по мере перехода от первичных результатов экологического мониторинга к знаниям о состоянии окружающей среды меняются методы работы с информацией. Таким образом, в такой информационной системе можно выделить три уровня, ори­ентированных на решение различных задач экологического мони­торинга и отличающихся по методам работы с экологической ин­формацией:

1) знания для поддержки принятия решений;

2) информация о состоянии окружающей среды;

3) данные экологического мониторинга.

Поддержка принятия решений основывается на знаниях, при этом в идеале каждое утверждение верхнего уровня (рис. 6.3) долж-


Информация — это любые сведения о состоянии окружаю среды.

Знание — это проверенное практикой, приводящее к прав ным предсказаниям отражение действительности.

Информация, фиксированная в определенной форме, приг. ной для последующей обработки, хранения и передачи, называ ся данными. Организованный определенным образом массив д ных, хранимый в вычислительной системе, носит название б данных. Комплекс баз данных и специальных методов и сред (программных, организационных и т.п.), позволяющих работа информацией о состоянии окружающей среды широкому кр пользователей, называется информационной системой.

Термин «данные» был введен в информатике для того, что
подчеркнуть необходимость преобразования информации в ф
му, пригодную для ввода в компьютер, например в числа или стр
ковые переменные, набитые на перфокарты. В последние годы б
годаря развитию технологий мультимедиа с помощью компью
ров стало возможным обрабатывать практически любые типы
формации об окружающей среде — зарисовки, звуки, видео,
термин «информация» стал часто использоваться как синоним т
мина «данные». В то же время термин «данные» часто используем
для обозначения первичной цифровой информации о состоян^.
окружающей среды. '(

Экспертной системой принято называть систему искусственна го интеллекта, которая создана для решения задач в конкретн проблемной области. Еще одно возможное определение: экспе ная система — это программа, которая ведет себя подобно эксп ту в некоторой проблемной области. Структура экспертной сие мы определяется следующими модулями:

1) временные базы данных, предназначенные для хранения ходных и промежуточных данных текущей задачи;

2) базы знаний, предназначенные для хранения долгосрочна сведений (фактов) и правил манипулирования данными; '

3) база программ, реализующих последовательность правил zC решения конкретной задачи на основе информации, хранящей в базах знаний и базах данных;

4) компонент приобретения знаний, автоматизирующий пр цесс наполнения базы знаний;

5) объяснительный компонент, формирующий пояснения
том, как система решала поставленную задачу.

В проблемной области «экологическая безопасность» основн задачей, которая ставится и перед экспертами в этой области, перед экспертными системами, является поддержка принятия шений. Поэтому любые информационные системы, ориентирова ные на поддержку принятия решений, будем называть эксперты информационными системами (ЭИС).


теров слишком мала, а методы математического моделирования окружающей среды недостаточно отработаны, чтобы их резуль­таты могли бы широко использоваться для поддержки принятия решений в области природоохранной деятельности. Поэтому в настоящее время накопление знаний, необходимых для поддер­жки принятия решений, основывается на различных реализаци­ях системного подхода, таких как методология оценки воздей­ствия на окружающую среду, индикаторы окружающей среды и устойчивого развития и т.п.

Оптимальной средой ддя размещения подобной информацион­ной системы является Интернет. С помощью языков программиро­вания HTML, JavaScript, 1ауасравнительно легко создать иерархи­ческую модель мультимедийных данных, установив при необходи­мости гипертекстовые связи и обеспечив удобный доступ ко всей или к части имеющейся информации для широкого круга пользо­вателей. Таким образом, кстати, реализованы многочисленные сер­веры Агентства по охране окружающей среды (U.S. ЕРА The United States Environmental Protection Agency, http://www.epa.gov/), о которых рассказывается в подразд. 6.2.3.

Данные экологического мониторинга, используемые для под­держки принятия решений в области природоохранной деятель­ности, чрезвычайно разнообразны и, как правило, включают:

данные дистанционного (спутникового) мониторинга;

данные подспутниковых наблюдений, полученных с помощью локальных методов мониторинга, с борта исследовательского суд­на и т.п.;

данные официальной статистики и архивные данные.

Кроме этого, при анализе данных экологического мониторинга все чаще используются результаты математического моделирова­ния. Такая сложная структура данных вынуждает на настоящем этапе разделить стадии анализа данных и представления результатов ана­лиза, так как средства для анализа данных, в том числе и средства интеллектуального анализа данных, — это большие пакеты при­кладных программ, которые нет никакого смысла размещать в сети Интернет.

Этапы интеграции данных экологического мониторинга $ ЭИС представлены на рис. 6.4. На первом этапе первичные данные эко­логического мониторинга интегрируются в хранилища данных. На втором этапе данные экологического мониторинга анализируются с помощью стандартных пакетов, реализующих те или иные мето­ды интеллектуального анализа данных (см. подразд. 6.2.2), а ре­зультаты анализа представляются в сети Интернет.

Схема интеграции данных экологического мониторинга в хра­нилище данных представлена на рис. 6.5.

При интеграции данных экологического мониторинга в храни­лище данных часто возникает проблема оценки достоверности ис-


Питулько



 

 

  Поддержка принятия решения    
 
  »    
  Системный анализ информации о состоянии окружающей среды    
       
  Обработка результатов наблюдений    
  J    
щ, ^^^^^Окружающая среда;Щ%Ш? ШШШ///УУ/У//////////////У///^^^ И  
 

Рис. 6.3. Иерархические уровни ЭИС

но подтверждаться информацией, хранящейся на среднем уро а при необходимости и первичными данными нижнего уровня.'

На нижнем уровне ЭИС системы для хранения данных о со янии окружающей среды используются различные системы уп^ ления базами данных (СУБД), а для обработки результатов блюдений — различные программные продукты: редакторы лиц, пакеты прикладных программ типа MathCAD и многие гие. Такое разнообразие программного обеспечения обуслов громадным числом разноплановых задач обработки результатов блюдений за состоянием окружающей среды, полученных с по щью локальных и дистанционных методов экологического мо торинга.

На среднем уровне ЭИС для анализа информации о сост окружающей среды используются географические информац ные системы (ГИС), а также системы типа MATLAB, в кото реализованы различные методы интеллектуального анализа ~v ных. Подобные системы, обеспечивая ввод, хранение, обно~ ние, обработку, анализ и визуализацию всех видов экологичес информации, позволяют систематизировать ее выдачу для уп ления природными ресурсами, реализуя опыт, накопленный циалистами в этой области.

В будущем системы поддержки принятия решений в обла экологической безопасности неизбежно будут основываться1 математическом моделировании процессов, происходящих в п роде. Это неудивительно, так как схема «модель-гипотеза -» э перимент -» установленный факт» составляет основу проце познания практически в любой из многочисленных областей временной науки. В рамках математических моделей станет в можно и сопоставление между собой сведений из разных ист ников, и свертывание результатов мониторинга, и прогнози вание последствий того или иного хозяйственного решен К сожалению, вычислительная мощность современных комп


6.2.2. Программное обеспечение ЭИС

Системы управления базами данных.Для манипулирования дан­ными (вводом, поиском и т.п.) в информационных системах ис­пользуется специальное программное обеспечение, называемое СУБД. Этот вид программного обеспечения в последние годы очень быстро совершенствуется. С одной стороны, СУБД все шире ис­пользуются для манипулирования новыми типами информации (мультимедиа, географические информационные системы и т. п.) С другой стороны, созданы новые технологии (архитектура «кли­ент—сервер», базы данных, гипертекст и т.п.), которые позволя­ют обеспечить доступ к информации широкому кругу пользовате­лей в рамках сети Интернет, открывая тем самым принципиально новые возможности для изучения окружающей среды.

В настоящее время фактическим стандартом систем управле­ния базами данных для ПК является СУБД Microsoft Access. Па­кет Microsoft Access for Windows — мощное средство управления базами данных, которое поддерживает реляционную модель дан­ных и позволяет создавать сложные приложения на языке Visual BASIC (VBA). Microsoft Access можно применять для поиска и обработки всевозможных данных, а также для подготовки отчет­ных документов. Пользовательский интерфейс достаточно прост и предоставляет пользователю возможности для манипулирова­ния базами данных, так что освоение пакета обычно не вызывает сложностей.

В связи с бурным развитием сети Интернет, которая является гигантской распределенной базой данных, возрос интерес к та­ким СУБД, как Oracle. В настоящее время эта система управления базами данных установлена на многих серверах Сети.

Реляционные базы данных. В подавляющем большинстве СУБД для ПК информация организуется в виде двумерных таблиц, и их часто, хотя и не всегда корректно, называют реляционными база­ми данных.

ФайлыОВБ стандарта d BASE представляют собой ото­бражение двумерной таблицы со столбцами-полями и строками-записями. При поиске информации в этих файлах часто приходит­ся использовать сведения о положении данных в файле (номер строки таблицы, номер записи файла DBF), и в этом отношении стандарт dBASE не удовлетворяет требованиям, предъявляемым к реляционным базам данных. Пока базы данных на ПК были отно­сительно невелики и их можно было разместить в одном файле DBF, это обстоятельство не играло существенной роли, а при­вычная простота таблицы привлекала к этому способу организа­ции информации многочисленных пользователей. Но при увеличе­нии размеров баз данных хранить их в одной таблице становится Невозможным и возникает необходимость выполнения других тре-


Исходные данные экологического мониторинга

Интеграция данных экологического мониторинга в хранилище данных

Хранилище данных {Data Warehouse)

Математическое моделирование^ ^ Анализ данных (Data mining)

Информация для поддержки принятия решений

Рис. 6.4. Этапы интеграции данных экологического мониторинга в Э

ходных данных в соответствии с требуемым уровнем метрола ческого обеспечения. Невозможно оценить их достоверность ] повторения эксперимента из-за постоянно меняющихся уело-Это порождает трудно разрешимые проблемы. Один из возмог путей проверки достоверности данных экологического монитор! может быть основан на сопоставлении их с данными, получен ми из других источников.

Исходные данные экологического мониторинга

Временные базы данных

Модули для проверки достоверности данных и преобразования их к единым форматам

Хранилище данных

Рис. 6.5. Интеграция данных экологического мониторинга в хранили

данных


новным средством для получения информации из реляционных баз данных.

Язык структурированных запросов SQL (Structu­red Query Language) был разработан корпорацией IBM в 70-х гг. XX в., но всеобщее распространение получил существенно поз­днее, когда после появления компьютерных сетей, связывающих компьютеры различных типов, потребовались стандартные языки для обмена информацией. Благодаря своей независимости от спе­цифики компьютера, а также поддержке лидерами в области тех­нологии реляционных баз данных SQL стал и в ближайшем обо­зримом будущем останется таким стандартным языком. Синтаксис SQL похож на синтаксис английского языка и позволяет констру­ировать достаточно сложные запросы. SQL является непроцедур­ным языком, в нем отсутствуют многие стандартные для проце­дурных языков конструкции — функции, циклы, условные опера­торы. Он состоит из инструкций, которые передаются СУБД, обес­печивая выполнение определенных действий. Эти инструкции на­зываются предложениями, но чаще используется термин «коман­да SQL».

Интерпретаторы команд SQL встраиваются во многие процедур­ные языки программирования, такие как Visual BASIC, C/C++. В этом случае команда обычно формируется в виде строковой пе­ременной.

Всеобщее распространение компьютерных сетей породило еще одну, кроме необходимости разработки стандартизованного языка запросов, проблему Эта проблема возникает, когда несколько пользо­вателей с разных компьютеров начинают изменять одну и ту же базу данных. До тех пор пока база данных открыта «только для чте­ния», особых трудностей не возникает, но как только нескольким пользователям позволяется модифицировать базу, возникают труд­но разрешимые конфликты. Эти проблемы преодолеваются в рам­ках модели базы данных типа «клиент—сервер».При реализации этой модели система управления базами данных разде­ляется на две части: «клиент» и «сервер». Программа «клиент» раз­мещается на пользовательской машине и позволяет формировать запросы (как правило, на языке SQL), которые по сети передаются на специализированную машину (сервер), где работает программа «сервер». Таким образом, термин «сервер» иногда относится к ком­пьютеру, а иногда к программному обеспечению. Программа-сер­вер обрабатывает запрос, формирует из базы данных требуемую вы­борку записей и отсылает ее программе-клиенту. Если пользователь предполагает изменять информацию в запрошенной выборке, дос­туп любого другого пользователя для модификации выбранных за­писей блокируется (монопольный захват). Если пользователь запра­шивает информацию «только для чтения», то доступ к выбранным записям не ограничивается (коллективный захват).


бований реляционной модели. В связи с этим важное значение им понятие «нормализация».

Нормализация не является жестко фиксированным по тием или установленной раз и навсегда процедурой. Нормали ция — скорее набор правил, которыми стоит руководствоват при проектировании реляционных баз данных. Одно из них глас «В таблице не должно быть повторяющихся полей и дублировах информации». Например, если к фрагменту подобной таблицы г бавить информацию об авторах книг, то в стандарте dBASE фр мент будет выглядеть следующим образом (табл. 6.6).

У первой книги один автор, и для хранения его имени дос точно одного поля. Но у второй книги уже два автора, а мо быть книги и с большим числом авторов. Поэтому возникает п вый вопрос: сколько полей следует предусмотреть для хранен таблице информации о фамилиях авторов книги? При этом в т лице появится несколько однотипных полей для хранения им авторов книг. Некоторые из этих полей будут пустыми, если ч~ ло авторов книги меньше числа зарезервированных полей, многих полях будет значиться одна и та же фамилия, если о человек является автором более чем одной книги, т. е. инфор ция будет дублироваться. Такую таблицу обычно называют нормализованной, и ее не следует включать в реляционную б данных.

Как следует организовывать информацию в реляционной данных, можно проиллюстрировать на простейшем примере б BOOKS.MDB, созданной с помощью СУБД Microsoft Access База BOOKS.MDB предназначена для хранения информащ книгах.

В 90-е гг. XX в. реляционная модель данных превратилась в новное средство организации информации в базах данных не тс ко на ПК, но и на больших ЭВМ. В рамках этой модели был раз ботан язык структурированных запросов SQL, который стал

 

  Пример ненормализованной таблицы Таб лица й I
Номер записи Название Автор 1 Автор 2 Автор 3 Год Страниц!
Анализ про­цессов ста­тистически­ми методами Д. Химмель-блау     960 i
Методы ре­шения некор­ректных задач А.Н.Тихо­нов В. Я. Арсе­нии   286 '

более 50 типов графиков и диаграмм. Oracle содержит очень надеж­ную систему защиты данных, их целостности и непротиворечи­вости.

Мультимедиа. Термином «мультимедиа» (multimedia) обозна­чаются интерактивные компьютерные системы, обеспечивающие работу с разнообразными типами данных: неподвижными и дви­жущимися изображениями (включая видео), а также текстом, вы­сококачественным звуком. В соответствующих базах данных хра­нится не только текстовая информация, но и оцифрованные филь­мы, звуки и музыка, факсимильные изображения и многое дру­гое. Современные системы управления мультимедийными базами данных поддерживают технологию «клиент—сервер», описанную выше, а сами базы данных оказываются распределенными по уз­лам всемирной компьютерной сети. При этом возникает новая ситуация, которая в ближайшие годы будет определять развитие цивилизации, — большинство знаний, накопленных человече­ством, оказывается интегрированным в глобальную информаци­онную систему, а доступ к этим знаниям открыт для каждого члена общества.

Технология мультимедиа широко используется в образовании — для создания обучающих программ, тренажеров, различных эн­циклопедий и справочников. На одном компакт-диске (CD-ROM) можно разместить тексты, составляющие библиотеку средних раз­меров, или фильм, но чаще на таких дисках размещаются тексты, движущиеся изображения, звуки и видеоклипы, связанные в еди­ную интерактивную систему, последовательность событий в кото­рой определяется пользователем.

Хранилища данных.Следует отметить, что в последние годы не только появляются новые технологии, но и несколько меняется подход к формированию баз данных. Базы данных, из которых из­влекаются знания, должны отвечать определенным требованиям, и чтобы подчеркнуть это, используется специальный термин «хра­нилище данных».

Термин «хранилище данных» (Data Warehouse) означает пред­метно-ориентированный, интегрированный, поддерживающий хронологию, неизменяемый набор данных, организованный для целей поддержки принятия решений. Можно выделить две основ­ные трудности при создании хранилищ данных, ориентированных на поддержку принятия решений:

неопределенность задачи -г- какая именно информация может понадобиться для поддержки принятия решений в постоянно и быстро меняющемся мире, какие цели и задачи будут актуальны­ми завтра и т.п.;

неоднородность информации — разные и зачастую плохо опи­санные форматы файлов данных, полученные на разных приборах и не стыкующиеся между собой результаты измерений.


Основной механизм, который позволяет избежать конфли между пользователями, заключается в разбиении процесса об ботки информации на элементарные события — группы ком SQL, которые могут выполняться (или не выполняться) толь все вместе. Такие группы команд называются транзакциями. Тр закция начинается всякий раз, когда на вход сервера начшг поступать команды SQL, если никакая другая транзакция не я~ ется активной. Она заканчивается либо командой внести изме ния в базу данных, либо отказом от внесения изменений (отка Если в процессе выполнения команд возникает какая-либо оши ка, автоматически выполняется откат, и база данных остается исходном состоянии.

Распределенные базы данных. Успехи модели баз данных т «клиент—сервер» привели к очевидной идее, что не только работку информации можно распределить между несколь" компьютерами, но и саму информацию хранить в разных мест Поэтому в начале 90-х гг. XX в. все большую привлекательно ' для пользователей ПК стали приобретать распределенные б данных и соответственно СУБД, разработанные для больших ЭВ Современные информационные системы очень редко реализух ся на одном ПК, и поэтому возникают проблемы использова данных, хранящихся на разных ЭВМ, с обеспечением при э высокой надежности работы и защиты данных. Многолетний о~ решения таких проблем, накопленный при разработке СУБД больших машин, широко используется при создании сетей ПК. Под распределенной базой данных понимается логиче единая база данных, которая размещается на нескольких ЭВ Гигантской распределенной базой данных является сеть Инт нет. Для пользователя любого из компьютеров, объединение сеть, в узлах которой распределена такая база данных, она в лядит как единое целое и одинаково доступна. При этом возни ет много проблем с обеспечением целостности и непротиворе вости хранимых данных и одновременно приемлемого быстр, действия прикладных программ, работающих с распределенн базой данных. Лишь в очень немногих системах управления ба ми данных (Sybase, Ingres, Informix) эти проблемы решены достаточном объеме, самой известной из них является СУ Oracle.

Система управления базами данных Oracle фирмы Oracle явд ется одним из лидеров рынка многоплатформенных СУБД. О может работать на более чем двухстах типах ЭВМ, включая I типа IBM PC и Apple Macintosh. В программное обеспечение э" СУБД входит одна из наиболее полных реализаций языка струг рированных запросов SQL, а также генераторы меню, отчетов4 других экранных форм. Кроме того, программное обеспечение п зволяет на основании информации, хранящейся в СУБД, стро


использования. Аппаратные средства включают компьютеры (плат­формы), на которых работает ГИС Такие ГИС, как ARC/INFO, функционируют на достаточно большом числе платформ — на мощных серверах, обслуживающих клиентские машины в локаль­ных сетях и Интернете, на рабочих станциях и отдельных ПК. Кро­ме того, ГИС используют разнообразное периферийное оборудо­вание — дигитайзеры для оцифровки карт, лазерные принтеры, плоттеры для печати карт и т. п. Программное обеспечение позво­ляет вводить, сохранять, анализировать и отображать географи­ческую информацию. Ключевыми компонентами программного обеспечения являются:

средства для ввода и манипулирования географическими дан­ными;

система управления базой данных;

программные средства, обеспечивающие поддержку запросов, географический анализ и визуализацию информации;

графический интерфейс пользователя, облегчающий исполь­зование программных средств.

Данные — возможно, наиболее важный компонент ГИС. Гео­графические информационные системы работают с данными двух основных типов:

пространственные (синонимы: картографические, векторные) данные, описывающие положение и форму географических объек­тов, и их пространственные связи с другими объектами;

описательные (синонимы: атрибутивные, табличные) данные о географических объектах, состоящие из наборов чисел, текстов и т. п.

Описательная информация организуется в реляционную базу данных — отдельные таблицы связываются между собой по клю­чевым полям, для них могут быть определены индексы, отноше­ния и т. п. Кроме этого, в ГИС описательная информация связыва­ется с пространственными данными. Отличие ГИС от стандартных систем управления базами данных (dBASE, Access и т.п.) состоит как раз в том, что ГИС позволяют работать с пространственными данными.

Пространственные данные в ГИС представляются в двух Основ­ных формах — векторной и растровой. Векторная модель данных основывается на представлении карты в виде точек, линий и плос­ких замкнутых фигур. Растровая модель данных основывается на представлении карты с помощью регулярной сетки одинаковых по форме и площади элементов. Различия между этими моделями данных поясняются рис. 6.6.

Здесь показано, как объекты местности — озеро, речка, поле — отображаются с помощью векторной модели линиями и полиго­нами, ас помощью растровой модели, по-разному окрашенными квадратиками.

i


Во многих случаях легче повторить дорогостоящий эксперимега
чем пытаться извлечь результаты из архивных данных предыдуим
го аналогичного эксперимента. |

Первым этапом создания хранилища данных является интегр|
ция. При интеграции исходных данных в хранилище необходим
обеспечить единые правила наименования, унифицированные едн
ницы измерения для однотипных объектов, единую систему пре|
ставления (атрибуты) для таких объектов и т.п. Кроме того, дм
интеграции данных о состоянии окружающей среды важна едим
система географических координат. Другой важной особенности
данных, включаемых в хранилище данных, является подцерж!
хронологии. В настоящее время в датировке данных о состояни
окружающей среды царит полная неразбериха. Например, труця
сказать, какая дата — 7 марта или 3 июля — имеется в виду!
записи 99/03/07. Однотипная датировка данных с учетом смем
тысячелетия должна решить все эти проблемы. В результате коне!
ный пользователь будет иметь единое представление о временна
привязке всех данных. Сформированное хранилище данных дола
но представлять собой неизменяемый набор данных, т. е. коне!
ным пользователям данные будут доступны в режиме «только дя
чтения». Это простейший способ обеспечения целостности даннй
при одновременном обеспечении высокой скорости доступа к нш
При необходимости изменять данные пользователь может воспол|
зоваться витриной данных (Data Mart). Это сравнительно небол!
шой набор данных, чаще всего являющийся выборкой из хращ
лища данных, свободно изменяемый и дополняемый пользоват!
лем. Обычно витрины данных используются для агрегирования дщ
ных из хранилища с тем, чтобы повысить скорость анализа да|
ных. •

Геоинформационные системы. Результаты экологического мон^ торинга всегда имеют географическую привязку, поэтому оптималз) ным способом организации анализа сведений о состоянии окруЩ ющей среды будет тот, который основывается на ГИС. Географ^ ческие информационные системы предназначены для создания цш| ровых карт и анализа событий, происходящих на планете. Во мноп! отношениях географическая информационная система — это ц пичная СУБД, примеры которой рассмотрены выше.

Термин «географическая информационная система» означав организованный набор аппаратуры, программного обеспечена географических данных и персонала, предназначенный для э(| фективного ввода, хранения, обновления, обработки, анализа визуализации всех видов географически привязанной информаци Особое значение для успешной работы ГИС имеет персонал: оп< раторы, программисты, системные аналитики и т.д. Технически специалисты, проектирующие и поддерживающие систему, i многом определяют ее свойства и эффективность последующе]


Рис. 6.8. Векторный способ представления пространственных данных

нии. На обоих рисунках на верхних фрагментах представлено Ла­дожское озеро.

На рис. 6.7 это изображение, полученное прибором A VHRR спут­ника NOAA и визуализированное с помощью растровой ГИСIDRISL Его форма несколько искажена, что объясняется особенностями орбиты спутника.

На рис. 6.8 представлена карта в проекции Меркатора, сформи­рованная из покрытий PONETvi DNNETкартыDCWс помощью ГИС ARC/INFO и визуализированная с помощью ГИС ArcView. При увеличении изображения в первом случае увеличивается размер прямоугольных ячеек — элементов изображения (пикселей), из которых состоит растровое изображение. При этом ни форма, ни цвет прямоугольников (величина сигналов) не изменяются.

На рис. 6.7, # хорошо видны прямоугольники, из которых со­ставлено изображение острова Котлин. Изменение цвета пикселей на границах острова объясняется тем, что эти сигналы определя­ются отражением и от поверхности острова, и от поверхности Финского залива.

При увеличении изображения на рис. 6.8, б полигон, соответ­ствующий острову Котлин, преобразуется в подобный полигон большей площади. Для большего полигона увеличивается длина отрезков замкнутой ломаной линии, определяющей его границу, при этом ширина этой линии не изменяется.

На рис. 6.9 показан процесс объединения в простейшую циф­ровую карту двух слоев цифровой карты DCW:



 


 


а О

Рис. 6.6. Модели пространственных данных: а — растровая; б — векторная; / — точка; 2 — полигон; 3 — дуга; 4 -


узел ]


Упрощая ситуацию, можно сказать, что растровая модель д ных — это набор одинаковых по величине, но по-разному о] шенных квадратиков. В векторной модели данных озеро изобр; ется окрашенным многоугольником, который в ARC/INFO вается полигоном (polygon), а речка — ломаной линией, кото] называется дугой (arc). Начало и конец этой ломаной линии наз| ваются узлами (node).

Другой пример растрового и векторного способов отображе: пространственных данных представлен на рис. 6.7 и 6.8, где пс зано, как изменяются фрагменты изображения при его увел]

Рис. 6.7. Растровый способ представления пространственных данных | 266


мент карты DCW, р. Нева изображается в виде полигона, а речки, впадающие в нее и в Финский залив, обозначены ломаными ли­ниями.





©2015-2017 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.

Обратная связь

ТОП 5 активных страниц!