Поиск
Озвучить текст Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Введение

В результате применения статистического метода мы получаем не истину в последней инстанции, а всего лишь оценку вероятности того или иного предположения. Кроме того, каждый статистический метод основан на собственной математической модели и результаты его правильны настолько, насколько эта модель соответствует действительности.

С. Гланц. Медико-биологическая статистика.

При экспериментальных исследованиях медико-биологических систем их характерной особенностью является отсутствие полной воспроизводимости и стабильности. Это связано с очень большим числом факторов, влияющих на исход опыта, в том числе и не поддающихся измерению. Поэтому статистические методы являются основным способом количественного описания медико-биологических объектов и явлений.

Существует множество учебников, в том числе и хороших, посвященных статистическим методам обработки данных. Однако для практического использования они не совсем удобны, поскольку описание методов начинается и заканчивается на уровне математических формул. Для понимания метода формулы незаменимы, но для реальных расчетов сейчас естественно использовать профессионально созданные пакеты прикладных статистических программ. Использование пакетов – это тоже технология, которую надо знать. С одной стороны, скорость получения статистических выводов стала неизмеримо выше, чем была при ручных подсчетах (не говоря о том, что многие методы были просто недоступны без качественного программного обеспечения и современных компьютеров), и это позволяет применять несколько альтернативных методов для проверки и подтверждения полученных выводов. С другой стороны, вопрос правильного использования статистических методов не снимается, и это относится как к выбору соответствующих модулей в пакете программ, так и конкретных опций, задающих параметры исследуемой модели.

Кроме того, исторически сложилась традиционная тематика в учебниках по статистике на русском языке, и в этой традиции не нашлось места описанию ряда очень важных методов обработки данных. В частности, автору не удалось найти удовлетворительных описаний метода Мантеля-Ханзела (Mantel-Haenszel) вычисления объединенного риска, логистической регрессии, логлинейного анализа. Эти методы изложены в настоящем руководстве, и их применение проиллюстрировано рядом примеров. Традиционные учебники, как правило, уделяют основное внимание статистическим выводам, основанным на предположении о нормальном распределении переменных, в том числе многомерным статистическим методам, таким как регрессионный, факторный, дисперсионный анализ. В практических же задачах часто требуется выявить отличия, связи, структуры для переменных, имеющих порядковую или дискретную структуру, или же для набора переменных разного типа. Для них также требуется выбор наилучшего метода, представление о границах применимости каждого из возможных способов обработки данных. Кроме того, даже для переменных непрерывного типа далеко не всегда возможно применение параметрических методов анализа, особенно при малых объемах выборок.

В самом общем виде основные задачи, для решения которых применяются методы статистического анализа, можно сформулировать следующим образом:

  1. выявление отличий анализируемых показателей и их связей в двух и более выборках;
  2. определение наличия и величины связи (или зависимости) одного или нескольких факторов с другими показателями или процессом;
  3. проведение анализа структуры данных.

Для проведения статистического анализа, как правило, достаточно владения одной из компьютерных систем анализа данных. Наиболее распространенные и универсальные системы, такие как STATISTICA, SPSS, SAS, NCSS, SYSTAT, предлагают примерно совпадающий арсенал основных методов анализа данных. В предлагаемом пособии мы будем давать ссылки на все вышеуказанные системы, но в качестве основной выбрана STATISTICA. Такой выбор связан прежде всего с удобством экспорта-импорта данных и результатов в этой системе, а также наибольшей доступностью для русскоязычных пользователей.

Для грамотного применения любого статистического пакета анализа данных нужно, во-первых, сформулировать задачу таким образом, чтобы для ее решения можно было использовать статистические методы, то есть создать математико-статистическую модель исследования. Для начинающих исследователей это наиболее трудный пункт плана работ. Как правило, статистическая модель практического исследования многовариантна и допускает использование нескольких методов. Поэтому надо представлять себе возможности, которые есть в арсенале прикладной статистики, и понимать, какие из них могут быть использованы для решения конкретной задачи. Наконец, важно учитывать, какие требования к данным сопровождают использование этих методов, и проверять выполнение этих требований.

Поскольку существует несколько возможных вариантов решения задачи, следует выбрать наиболее подходящие из них. Кроме того, использование нескольких методов позволяет проверить полученные выводы. Приведенные далее схемы показывают спектр методов, применяемых для решения наиболее распространенных задач. На схемах указаны самые известные методы, содержащиеся практически во всех статистических программах анализа данных.

Схема 1. Выявление отличий анализируемого показателя в двух и более выборках

Схема 2. Определение наличия и величины связи (или зависимости) двух показателей

Схема 3. Исследование структуры данных

Комментарии к схемам

При изучении схем 1 (1’) и 2 (2’) нетрудно заметить, что одни и те же методы могут быть использованы для решения различных задач. С другой стороны, одну и ту же задачу можно сформулировать как в рамках схемы 1, так и в рамках схемы 2. Приведем примеры.

1. Был вычислен индекс функциональных изменений (ИФИ) для пожарных и спасателей, проходивших ежегодную диспансеризацию. Исследователь хочет выяснить, есть ли отличия по этому индексу у обследованных двух профессиональных групп. Вопрос можно сформулировать следующим образом: а) «отличается ли ИФИ у спасателей и пожарных?» или б) «зависит ли ИФИ от характера работы?».

Для продолжения работы требуется Регистрация
На предыдущую страницу

Предыдущая страница

Следующая страница

На следующую страницу
Введение
На предыдущую главу Предыдущая глава
оглавление
Следующая глава На следующую главу