Веб-приложение Shinny для анализа ассоциативности объектов в сетевых структурах
Экологические данные часто представлены таблицами встречаемости (1) или отсутствия (0) того или иного вида в пробах или местообитаниях. Для таких бинарных пространств описан многочисленный класс мер связи между каждой парой объектов, которые обычно основаны на частоте их относительной совместной встречаемости (индексы Жаккара, Съеренсена, Охаи и т.д.). Общей проблемой этих эвристических мер является отсутствие четкого критерия оценки их статистической значимости на основе стандартной процедуры проверки гипотез. Если, например, был рассчитан коэффициент Съеренсена S = 0.45, то у исследователя нет оснований утверждать, что сравниваемые виды имеют сходное распределение по изучаемой территории, поскольку их кажущая связь может быть обусловлена случайными причинами.
Настоящее сообщение описывает методику оценки значимости ассоциаций для пар видов путем моделирования эмпирических данных дискретными распределениями Х – гипергеометрическим или биномиальным. Если наблюдаемая вероятность Р(х) совместного обнаружения двух видов в x из N проб отвечает условию
Р(х) = P [X £ x] > (1 – pcrit) , то виды считаются положительно ассоциированными на уровне статистической значимости pcrit. Если справедливо условие
Р(
х) =
P[
X >
x] > (1 –
pcrit), то принимается предположение об отрицательной ассоциативности видов, т.е. их несовместимости. В противном случае считается, что распределение видов по участкам независимо друг от друга, а частота их совместного появления не отличается от случайной.
Для визуализации всех статистически значимых связей в изучаемом экологическом сообществе удобно использовать сеть, в которой узлы представляют выявленные виды сообщества, а ребра с весами
Р(
х) – ассоциации между парами видов, превышающие уровень доверительной вероятности при анализе заданного дискретного распределения. Для удобства содержательной интерпретации конфигурации графа целесообразно осуществить группировку его вершин, исходя из условий максимальной компактности и связности выделяемых кластеров.
Для реализации всей описанной методики вашему вниманию предлагается интерактивное web-приложение на базе пакета
Shinny (разработчик - н.с. ИБВВ РАН Д.Г. Селезнев), которое позволяет провести обработку данных без загрузки статистической среды R. Любой заинтересованный исследователь может обратиться on-line с помощью своего Интернет-браузера к его клиентской части по URL
http://apps.ibiw.ru/coobs загрузить файл со своими исходными данными и получить табличные и графические файлы с результатами расчетов.
Приложение выполняет визуализацию различных вариантов графов построенной сети с использованием функционала пакета
igraph, при этом настройка изображения выполняется интерактивно с помощью набора параметров, выведенных на панель управления. Пользователь также может выбрать подходящий алгоритм кластеризации вершин графа из 7 возможных методов, рекомендуемых в научной литературе.
Текст сообщения, содержащий описание методики и особенностей работы с web-приложением, может быть загружен с ресурса