ГИС-статистика

1 1 1 1 1 1 1 1 1 1 Рейтинг 5.00 (1 Голос)

Пространственно-временная статистика

Возможности и преимущества ГИС-статистики

Методы и процедуры статистического анализа и моделирования широко используются в географических исследованиях в силу стохастической природы многих географических явлений, как природных, так и социально-экономических. Наряду с использованием стандартных непространственных статистических алгоритмов и процедур, в настоящее время в географии получают широкое распространение методы нового раздела математической статистики - Пространственной статистики или Геостатистики.

Какие особенности имеет и что нового дает статистическое моделирование и анализ в среде ГИС?

Одним из главных преимуществ ГИС-статистики являются богатые возможности визуализации процесса статистического моделирования на всех его этапах, начиная с отбора необходимых для анализа географических объектов, интерактивного графического представления промежуточных результатов в виде различных компьютерных диаграмм и динамически связанных "окон", и кончая сложными 3-х мерными изображениями геостатистических поверхностей и объемов. Таким образом, создается информационная среда, в которой исследователю намного легче принимать решения в процессе статистического моделирования и анализа географических явлений.

Следует отметить, что. в настоящее время существует определенный дефицит средств статистического моделирования в ГИС. Так, например, популярные коммерческие ГИС-пакеты ARC/INFO, SPANS и GENAMAP обеспечивают довольно ограниченный круг статистического анализа низшего уровня (дескриптивная статистика), включая расчет базовых статистических показателей, преобразование данных и простейшую статграфику. С другой стороны, в этих пакетах реализованы макроязыки, позволяющие пользователю разрабатывать собственные статистические модули. К сожалению, отсутствие интерфейса высокого уровня для доступа к базе данных ГИС и статистической графике делает эти языки недостаточно эффективными. Исключением является модуль статистического анализа SAM, состоящий из комплекса программ, написанных на языке С. Этот модуль функционирует в среде ARC/INFO и предполагает использование макроязыка AML.

Особого внимания заслуживает язык статистического программирования S-Plus, использование которого в ГИС значительно расширяет возможности геостатистического моделирования благодаря применению динамического "оконного" интерфейса и компьютерной графики.

Другим направлением развития ГИС-статистики является разработка интерфейса, обеспечивающего возможность более тесного соединения коммерческих ГИС-пакетов со стандартными статистическими пакетами, например MINITAB, SPSS, SAS и другими. При этом для экспорта необходимых файлов из ГИС используется, как правило, формат ASCII.

Альтернативным к перечисленным выше представляется подход, при котором в стандартные статистические пакеты добавляются функции ГИС. Например, современные версии пакета SPSS обладают способностью строить тематические карты, хотя до реализации полноценных пространственных функций ГИС дело здесь пока не дошло.

Пространственно-временная статистика в IDRISI

В качестве примера ГИС-реализации методов пространственно-временной статистики рассмотрим статистический блок пакета IDRISI. Следует отметить, что в этом популярном растровом ГИС-пакете, пожалуй, наиболее полно представлен спектр методов статистического моделирования, что, наряду с доступностью и простотой освоения, делает его в некотором смысле уникальным.

Всю совокупность методов, включенных в статистический блок IDRISI, условно можно разделить на две группы: непространственной и пространственной статистики. Основное различие между ними состоит в том, что методы и процедуры пространственной статистики учитывают в явном виде пространственные отношения объектов геоизображения (соседство и близость растровых ячеек), в то время как непространственная статистика этих отношений не рассматривает, ограничиваясь простыми группировками атрибутивных данных, привязанных к растровым ячейкам.

В группу Непространственной статистики пакета IDRISI входят следующие процедуры:

HISTO-построение гистограммы частотного распределения числовых величин ячеек геоизображения. Данная процедура включает расчет ряда статистических параметров распределения: математического ожидания и стандартного отклонения значений атрибутивного признака в пределах всего изображения. Итоговая информация может быть представлена в графической и числовой форме. В первом случае на экран выводится общий график гистограммы, а во втором - числовая (частотная) характеристика каждого класса (интервала) значений в кумулятивной, пропорциональной и кумулятивно-пропорциональной формах представления частот распределения.

EXTRACT-процедура, обеспечивающая получение суммарных статистических характеристик выбранных объектов (совокупности ячеек определенного типа) геоизображения. При этом итоговые статистические показатели могут быть представлены на экране в виде таблицы, либо сохранены в виде отдельного файла. В число рассчитываемых параметров входят: минимум, максимум, общая сумма, среднее арифметическое, стандартное отклонение и другие.

REGRESS-регрессионный анализ двух геоизображений (или двух соответствующих атрибутивных файлов). В результате процедуры на экран выводится диаграмма распределения (корреляционное поле), график линии тренда, а также таблица статистических характеристик регрессии: уравнение регрессии, коэффициент корреляции и соответствующие показатели значимости.

CROSSTAB-качественный аналог регрессионного анализа, позволяющий выявить статистическую зависимость двух геоизображений, атрибутивные признаки которых измерены в качественных шкалах (порядковой или номинальной). Главным результатом этой процедуры является таблица сопряженности, отражающая частоту встречаемости парных комбинаций различных категорий (значений качественных признаков) сравниваемых геоизображений. Одновременно рассчитываются качественные аналоги показателей статистической зависимости и соответствующие им параметры: показатели "ху-квадрат" Крамера, число степеней свободы и другие. Кроме того, CROSSTAB обеспечивает возможность создания нового результативного (комбинированного) геоизображения, категории которого представляют собой парные комбинации категорий исходных совмещенных геоизображений (как результат выполнения логической функции AND).

RANDOM-генерирование и построение случайных гипотетических геоизображений на основе статистических моделей распределения (нормального и прямолинейного) с заданными параметрами распределения (математическим ожиданием и стандартным отклонением). Данная процедура может быть использована для построения стохастической поверхности с целью оценки вероятности появления определенных событий.

Группа процедур пространственной статистики пакета IDRISI включает:

TREND-процедура, представляющая собой пространственный аналог процедуры REGRESS. С ее помощью определяется и строится трендовая регрессионная поверхность в X-Y координатах, заданных на растровом геоизображении. Возможна реализация трех видов регрессионного полинома: линейного, квадратического и кубического. Данная процедура используется в сдучае, когда необходимо выявить наличие сколько-нибудь существенного пространственного тренда в распределении значений атрибутивного признака в пределах данного геоизображения с целью интерполяции и объяснения.

AUTOCORR-расчет коэффициента пространственной автокорреляции с использованием "I" статистики Морана. При этом в автокорреляционный анализ может быть включено все геоизображение целиком, либо его отдельные части. Данная процедура позволяет выявить наличие пространственной зависимости в распределении значений атрибутивного признака растрового геоизображения.

CENTER-расчет среднего центра (взвешенного или невзвешенного) и стандартного радиуса для множества точек геоизображения. Средний центр может рассматриваться как "центр тяжести" данной группы точек, в то время как стандартный радиус является прямой аналогией стандартного отклонения для непространственных данных и используется в качестве показателя пространственной дисперсии (разброса) точек от их наиболее вероятного положения.

QUADRAT-процедура, используемая для определения характера размещения точек, т. н. "точечного образа". Последний может быть регулярным, случайным или кластеризующимся. Одним из результатов данной процедуры является расчет отношения показателя вариации к математическому ожиданию, что может служить критерием выбора одного из 3-х перечисленных вариантов. Кроме того, QUADRAT рассчитывает плотность размещения точек геоизображения.

PATTERN-процедура, расширяющая возможности предыдущей с помощью расчета различных количественных мер на основе сравнения фиксированной ячейки с соседними. В число этих мер входят показатели относительной доступности, распространенности, доминирования, фрагментации и некоторые другие. Все они оказываются полезными, например, в исследовании морфологической структуры ландшафта.

CRATIO-расчет степени компактности выделенного полигона. При этом отношение "площадь/периметр", рассчитанное для данного полигона, сравнивается с таким же отношением для круга, как наиболее компактной геометрической фигуры.

PROFILE-расчет и построение пространственных и временных профилей. В результате получается графический образ профиля, который может быть сохранен для дальнейшего анализа в виде отдельного файла.

SAMPLE-генерирование векторного файла точек в соответствии с выбранной схемой пространственного отбора: систематической, случайной или стратифицированно-случайной. Эта процедура может быть использована при решении задачи оценки точности измерений, а также в процессе пространственного отбора точек для дальнейшего исследования.

Версия 4.1 пакета IDRISI содержит модуль Пространственно-временной статистики TSA, который реализует один из методов факторного анализа - метод главных компонент, - в процессе изучения динамики изменения растровых геоизображений, рассматриваемых в качестве элементов временного ряда. В результате работы модуля TSA пользователь получает "сжатую" пространственно-временную информацию о тенденциях и аномалиях изменения геоизображения в течение определенного промежутка времени. При этом рассматриваются, как правило, длинные временные ряды (более 20 наблюдений), так как собственно "факторизация" осуществляется на множестве разновременных геоизображений. Путем расчета компонент ("факторов") разного порядка и построения соответствующих им геоизображений, .удается выявить тонкие закономерности и аномалии пространственно-временной динамики географических явлений.


ГИС-статистика - 5.0 out of 5 based on 1 vote