Подсистема ввода информации - это устройства для преобразования пространственной информации в цифровую форму и ввода ее в память компьютера или в базы данных.
Данные для использования в ГИС должны быть сначала преобразованы в подходящий цифровой формат, поэтому под вводом данных понимается процедура кодирования данных в компьютерно-читаемую форму и их запись в базу данных ГИС.
Ввод данных включает три главных шага - сбор, редактирование и очистка, а также геокодирование данных. Последние два этапа называют также предобработкой данных.
Существует множество способов ввода данных для работы с ГИС, по сути сводимые к следующим.
Ввод с помощью клавиатуры. Качественные и количественные характеристики цифруемых объектов, а также статистические данные вводят с клавиатуры компьютера. Этот способ редко применяется для пространственных данных. Он может быть совмещен с ручным цифрованием, обычно более эффективно используется как отдельная операция.
Координатная геометрия включает процедуры, используемые, чтобы ввести данные, требующие очень высокой точности расположения. Этот способ характеризуется очень высоким уровнем точности, получаемым за счет полевых геодезических измерений. В целом способ очень дорогой, наиболее широко используемый для целей земельного кадастра.
Процесс преобразования данных с бумажных карт в компьютерные файлы называется оцифровкой. В современных ГИС этот процесс может быть автоматизирован с применением сканерной технологии, что особенно важно при выполнении крупных проектов, либо, при сравнительно небольшом объеме работ, данные можно вводить с помощью особого прибора - дигитайзера. Некоторые ГИС имеют встроенные векторизаторы, автоматизирующие процесс оцифровки растровых изображений.
|
Ручное цифрование является наиболее широко используемым методом ввода пространственных данных с карт. Для цифрования применяют дигитайзеры и сканеры. С помощью дигитайзеров на исходной карте прослеживают и обводят контуры и другие графические обозначения, а в память компьютера при этом поступают текущие координаты этих контуров, линий или отдельных точек в цифровой форме. Сам процесс прослеживания оператор выполняет вручную, с чем связаны большая трудоемкость работ и возникновение ошибок за счет обвода линий. Эффективность данного метода зависит от качества программного обеспечения цифрования и умения оператора. К главным недостаткам относятся большие временные затраты и допущение наличия ошибок.
Сканирование подразумевает автоматическое получение цифрового изображения карты с помощью сканера. Сама карта размещается на планшете или на барабане. Сканирование выполняется быстро и точно, но приходится дополнительно разделять (распознавать) оцифрованные элементы: реки, дороги, другие контуры и т.п. Точность метода определяется размером ячейки, который можно отсканировать (минимальный фрагмент карты - около 20 микрон (0,02 мм). Полученное изображение затем нуждается в дальнейшей обработке и редактировании для улучшения качества, иногда преобразовании в векторный формат. В некоторых ГИС сканированные изображения могут непосредственно использоваться для производства карты.
Ввод существующих цифровых файлов подразумевает использование доступных наборов данных различных ведомств и организаций. Приобретение и использование существующих цифровых наборов данных является наиболее эффективным способом заполнения ГИС. В настоящее время все более широкое распространение получает преобразование данных других цифровых источников таких как, данные на магнитных носителях, данных, доступных в сети Интернет (цифровые карты, цифровые космические снимки) и пр. Однако, нужно помнить, что пока изображения, распространяемые в Интернет зачастую имеют низкое разрешение, растровый формат и ограниченные размеры.
|
Главным критерием выбора формы ввода данных является тип источника данных: для снимков предпочтительнее использовать сканирование, карты можно цифровать или сканировать. Другой критерий связан с типом модели используемой базы данных: сканирование лучше подходит для растровой модели, цифрование - для векторной.
Есть много способов ввода данных. Одни выглядят примитивными, вроде помещения прозрачной сетки на карту. Другие - более современны, так, например, используют устройства цифрового ввода - дигитайзеры и сканеры. Перед тем, как использовать структуры данных, модели и системы, необходимо преобразовать нашу реальность в форму, понимаемую компьютером. Методы, при помощи которых это будет сделано, зависят в некоторой степени от имеющегося оборудования и от конкретной системы. Во-первых, подсистема ввода спроектирована для переноса графических и атрибутивных данных в компьютер. Во-вторых, она должна отвечать хотя бы одному из двух фундаментальных методов представления графических объектов - растровому или векторному. В-третьих, она должна иметь связь с системой хранения и редактирования, чтобы гарантировать сохранение и возможность выборки того, что мы введем, и давать возможность устранять ошибки и вносить изменения по мере необходимости.
|
Вначале необходимо определить, какой тип ГИС, векторный или растровый, будет использоваться, а также будет ли ваша ГИС способна преобразовывать эти типы данных один в другой. Некоторые программы работают главным образом на растровых структурах данных, в то время как другие оперируют в основном векторной информацией.
Хотя преобразование между векторной и растровой формами - дело достаточно обычное, есть несколько вещей, о которых следует помнить. Чаще всего при преобразовании векторов в растр результаты получаются визуально удовлетворительными, но методы растеризации могут давать результаты, которые не удовлетворительны для атрибутов, представляющие каждую ячейку. Это особенно верно вдоль границ областей, где имеется неопределенность с присвоением ячейкам растра атрибутов с одной или другой стороны границы. С другой стороны, преобразуя растр в вектора, вы можете сохранить подавляющее большинство атрибутивных данных, но визуальные результаты будут час-то отражать блочный, лестничный вид ячеек растра, из которых преобразование было произведено. Существуют алгоритмы сглаживания этого лестничного эффекта, использующие математические методы сплайн-интерполяции. Не вдаваясь в подробности, укажем, что это просто графический прием, сглаживающий зубчатые линии и острые углы. Как ранее указывалось, существуют многие инструменты для ввода в ГИС векторных данных. Ограничим обсуждение дигитайзерной оцифровкой как распространенным "классическим" методом. Некоторые программы требуют ввода точек в определенной последовательности, в то время как другие этого не требуют. Документация и/или сама программа сообщит вам об этом. Кроме того, программа укажет, какие пронумерованные кнопки используются для ввода конкретных типов объектов. Одни кнопки используются для указания положения точечных объектов, другие - для обозначения концов прямых отрезков, третьи - для смыкания многоугольников. Многие ошибки оцифровки, особенно у новичков, происходят вследствие нажимания не тех кнопок, что требуется. Конкретная процедура оцифровки зависит также от структуры данных, которая используется программой. Одни требуют указания положений узлов, другие - нет. Одни требуют явного кодирования топологии во время оцифровки, другие используют программные методы построения топологии после того, как база данных заполнена. Правила различны для разных программ, и нужно заблаговременно просмотреть соответствующую документацию для выяснения этих стратегий. Эта работа может рассматриваться как часть процесса подготовки карты, а не самой оцифровки.
Атрибутивные данные в векторных ГИС вводятся чаще всего с использованием клавиатуры компьютера. Хотя этот способ ввода данных предельно прост, он требует такого же внимания, как и ввод графические объектов. Причины две. Первая: опечатки совершаются очень легко. Вторая, и возможно, наиболее проблематичная: атрибуты должны быть связаны с графическими объектами. Ошибки в таком согласовании - одни из наиболее трудных для обнаружения ошибок, поскольку их не всегда можно заметить на взгляд, и они не проявляются до начала выполнения какого-нибудь анализа. Хорошей практикой является проверка атрибутов в процессе ввода, возможно, во время частых коротких перерывов для их просмотра. Время, потраченное на это, окупится затем с лихвой при редактировании.
Ввод растровых данных следует иной стратегии, нежели ввод векторных данных. Растровый ввод иногда все еще делается с использованием накладной сетки, когда атрибуты вводятся последовательно, друг за другом. Широкая доступность сканеров быстро вытесняет этот трудный метод ввода, однако его применение хорошо иллюстрирует разные методы, используемые программами оцифровки для ввода ячеек растра. В прошлом часто использовался также метод оцифровки растра с помощью дигитайзера, когда полученный с дигитайзера контур объекта в виде векторов затем заполняется пикселями уже самой программой оцифровки.
Прежде всего, необходимо решить, какую площадь должна занимать каждая ячейка растра. Это решение должно быть принято до начала оцифровки или наложения сетки, чтобы сообщить программе оцифровки размер ячейки или дать оператору сведения о размерах квадратов сетки. Кроме того, нам следует решить, пригодится ли какой-нибудь метод кодирования (типа группового или блочного кодирования), который мог бы сократить процесс. При том, что методы сжатия данных хороши для уменьшения их объема, использование этих методов при вводе может оказаться не менее важным благодаря сокращению времени ввода. Некоторые растровые ГИС, не поддерживающие ввод с дигитайзера или поддерживающие ввод и с клавиатуры, и с дигитайзера, имеют команды, позволяющие вводить данные в виде цепочек или блоков атрибутов. Выбрав метод ввода, вы должны решить, как каждая ячейка растра будет представлять различные имеющиеся темы. Помимо разрешения растра, это может быть наиболее важным мщением, которое вы должны принять. Рассмотрим этот вопрос более подробно.
Для ввода растровых данных наиболее широко применяются сканеры. Однако следует учитывать, что введенные со сканера тематические данные не становятся автоматически тематическими данными в растровой ГИС. Дело в том, что однородно закрашенные на карте области после считывания сканером неизбежно получают некоторый разброс значений, вследствие многих причин: неоднородность нанесения краски на карту, незаметная для глаз, неоднородность подсветки в сканере, износ карты и т.д. Кроме того, тематические карты обычно печатаются офсетным способом, который предполагает образование всего богатства полутонов и цветовых оттенков смешением мельчайших точек красок небольшого числа цветов. При сканировании эти незаметные на глаз точки, превращаются во вполне самостоятельные пиксели, образующие "винегрет" на месте внешне однородной по цвету области. Естественно, такие карты не пригодны для анализа. Результат сканерного ввода в сильной степени зависит от соотношения разрешений сканера и полиграфического растра. Именно сложность решения этой проблемы приводит иногда к решению использовать упомянутый выше способ ввода растровых данных посредством векторной оцифровки контуров объектов с последующим преобразованием в растр.