Поиск
Озвучить текст Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Глава 5. Логистическая регрессия: оценка влияния нескольких факторов на результирующий дискретный показатель

5.1. Логистическая регрессия для бинарного отклика

Часто в исследованиях встает вопрос оценки частот благоприятного и неблагоприятного исходов (бинарного отклика) в связи с несколькими факторами, часть из которых является дискретными переменными, остальные – непрерывными переменными. Для такой оценки применяется логистическая регрессия. В качестве меры воздействия фактора на частоту возникновения события логистическая регрессия использует отношение шансов.

Логистическая регрессия аналогична обычной множественной регрессии, за исключением того, что зависимая переменная (Y) является бинарной (т.е. имеет два значения, 0 и 1), а не непрерывной. Этот метод конкурирует с дискриминантным анализом как способом анализа переменной, задающей бинарный отклик. Вообще для анализа такого отклика, если независимые переменные непрерывны, могут использоваться и дискриминантный анализ, и логистическая регрессия.

Дискриминантный анализ является оптимальным методом анализа бинарного отклика в случае, когда выполнены основные условия его применения: данные получены из двух многомерных нормальных распределений с равными ковариационными матрицами. Если же какие-то из условий не выполнены, а это очевидным образом случится, если некоторые независимые переменные являются дискретными, а не непрерывными, данный метод уже не будет оптимальным, более того, он станет неадекватным исследуемым данным.

В этом случае как раз применима логистическая регрессия. Для этого метода несущественно, являются ли независимые переменные дискретными или непрерывными, выполнены ли условия нормальности, каковы дисперсии переменных. Конечно, вычисления происходят намного медленнее, чем в дисперсионном анализе и регрессионном анализе. Замедление ощутимо при больших объемах выборок и большом количестве переменных. Именно это обстоятельство препятствовало использованию метода в прошлом, однако при нынешнем развитии компьютерных технологий уже не является существенным ограничением.

Линейная логистическая модель для зависимой переменной Y, имеющей два значения (y1=0 и y2=1), и независимых переменных X1, … , Xp произвольной природы имеет вид: вероятность (Prob) того, что Y принимает значение y2,

(5.1)

Здесь {βi} – логистические регрессионные коэффициенты. Их оценки обозначаются {bi}.

Вероятность второго исхода Prob (Y = 0) = 1 – Prob (Y = 1).

Эта модель может быть записана линейным образом с использованием логарифмирования отношения вероятностей двух исходов:

(5.2)

Левая часть этого выражения называется логит-преобразованием вероятности или еще логарифмом отношения шансов.

Для продолжения работы требуется Регистрация
На предыдущую страницу

Предыдущая страница

Следующая страница

На следующую страницу
Глава 5. Логистическая регрессия: оценка влияния нескольких факторов на результирующий дискретный показатель
На предыдущую главу Предыдущая глава
оглавление
Следующая глава На следующую главу