Методы статистического анализа данных
Сравнения двух групп по количественным шкалам проводились на основе непараметрического критерия Манна-Уитни. Сравнения трех и более групп по количественным шкалам проводились на основе непараметрического критерия Краскела-Уоллеса.
Для описания количественных показателей использовались медиана и квартили в формате «Me [LQ; UQ]», а также среднее значение и стандартное отклонение в формате «M±S». На всех графиках для количественных переменных среднее арифметическое обозначено точкой, медиана обозначена горизонтальным отрезком, внутриквартильный размах обозначен прямоугольником, минимальные и максимальные значения обозначены вертикальными отрезками.Анализ динамики показателей в случае сравнения двух периодов производился на основе непараметрического критерия Вилкоксона, в случае сравнения трех и более периодов - на основе непараметрического критерия Фридмана. Статистическая значимость различных значений для бинарных и номинальных показателей определялась с использованием критерия Хи-квадрат Пирсона. Корреляционный анализ проводился на основе непараметрической ранговой корреляции по Спирмену.
Для описания структуры показателя использовались медиана и квартили в формате «Me [LQ; UQ]» и минимум и максимум для оценки диапазона колебания показателя в формате «(Min; Max)». Проверка соответствия распределения значений показателя закону нормального распределения производилась с помощью критерия согласия Пирсона. Определенный в результате уровень статистической значимости P характеризует соответствие распределения нормальному закону (если p>0,05, то распределения считается соответствующим нормальному распределению; если p≤0,05, то распределения считается несоответствующим нормальному распределению). Для бинарных и номинальных показателей проводится частотный анализ с оценкой доли структуру каждого значения, а также проверка гипотезы об однородности встречаемости признаков с помощью критерия Хи-квадрат Пирсона.
Для моделирования некоторых качественных целевых переменных использовались деревья классификации - метод, позволяющий предсказывать принадлежность наблюдений или объектов к тому или иному классу категориальной зависимой переменной в зависимости от соответствующих
значений одной или нескольких предикторных (независимых) переменных. В данном случае этот метод удобен, так как позволяет последовательно изучать эффект влияния отдельных переменных, а также дает возможность выполнять одномерное ветвление для анализа вклада отдельных переменных и работать с предикторными переменными различных типов. Для оценки качества построенных деревьев применялся ROC-анализ.
В диаграммах размаха среднее арифметическое обозначено точкой, медиана обозначена горизонтальным отрезком, внутриквартильный размах обозначен прямоугольником, минимальные и максимальные значения обозначены вертикальными отрезками.
Уровень статистической значимости был зафиксирован на уровне вероятности ошибки 0,05. Статистическая обработка данных выполнена с использованием пакетов прикладных программ Statistica 10 и SAS JMP 11.
3
Еще по теме Методы статистического анализа данных:
- 2.3. Методы статистического анализа данных
- Статистический анализ данных
- 2.3. Методика статистического анализа полученных данных
- Методы статистической обработки данных
- Методы статистической обработки данных
- Методы статистической обработки данных.
- Статистические методы анализа результатов
- 2.2.8 Статистическая обработка данных
- 10. Анализ стратифицированных данных
- Анализ данных рН-импедансометрии
- Анализ данных рН-импедансометрии
- Основные принципы анализа данных
- Анализ данных в программе BSPM Data Browser and Analyzer
- 2.2.3. Статистические методы