Поиск
Озвучить текст Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Глава 3. Графическое представление данных

Одним из важных этапов обработки и анализа информации является ее графическое представление, или визуализация. Это позволяет показать информацию не только в виде таблиц, представить наглядно и в сжатой форме необходимые данные, результаты расчетов и выводы.

Современные статистические программные продукты дают широкий круг возможностей графического представления как количественных, так и качественных данных. Рассмотрим некоторые из них.

Столбчатая диаграмма  один из наиболее распространенных методов графического представления данных, может использоваться для представления качественных данных. Столбики на диаграмме могут располагаться как вертикально, так и горизонтально. На столбчатой диаграмме можно располагать несколько переменных, что наглядно демонстрирует разницу между ними.

На рис. 3.1 представлена столбчатая диаграмма для номинального признака — степень никотиновой зависимости беременных (исследование проводилось для n=285 женщин). Диаграмма построена в Excel («Вставка»/«Диаграммы»/«Гистограмма»). Исследуемая переменная принимает следующие значения: 0 — нет зависимости, 1 — очень слабая, 2 — слабая, 3 — средняя, 4 — высокая. Для каждой категории на диаграмме имеется отдельный столбик, высота которого равна частоте появления этой категории, частота, то есть число соответствующих случаев, показана на диаграмме. Столбики диаграммы расположены на расстоянии друг от друга, чтобы показать тип данных (номинальные или дискретные).

Рис. 3.1. Столбчатая диаграмма для признака «Степень никотиновой зависимости беременных»

Столбчатая диаграмма позволяет сравнить несколько групп по некоторому признаку. На рис. 3.2 степень никотиновой зависимости представлена для трех групп.

Рис. 3.2. Столбчатая диаграмма для признака «Степень никотиновой зависимости беременных» по нескольким группам

В некоторых случаях столбчатую диаграмму заменяют круговой. Данный вид диаграммы позволяет наглядно представить структуру явления. На рис. 3.3 представлена объемная круговая диаграмма для признака «Степень никотиновой зависимости беременных». Вместо частоты появления каждого значения на круговой диаграмме отображена относительная частота, или процент. Диаграмма построена в Excel («Вставка»/«Диаграммы»/«Круговая»).

Рис. 3.3. Круговая диаграмма для признака «Степень никотиновой зависимости беременных»

Гистограмма — графическое представление количественного непрерывного признака, разбитого по интервалам. Высота каждого столбика гистограммы является частотой появления значений из соответствующего интервала.

Гистограмму можно использовать для предварительного вывода о законе распределения. Если гистограмма симметрична относительно некоторой центральной точки, то можно предположить, что данные распределены нормально.

На рис. 3.4 построена гистограмма для признака «Уровень кортизола у женщин со сроком беременности 8–14 нед» (n=243). Гистограмма построена в SPSS («Графика»/«Панель выбора диаграмм»/«Гистограмма с нормальной кривой»). Гистограмма несимметрична относительно центра, ряд столбцов диаграммы выходит за пределы теоретической нормальной кривой. Таким образом, по виду гистограммы можно предположить, что данный признак имеет закон распределения, отличный от нормального.

Рис. 3.4. Гистограмма для признака «Уровень кортизола у женщин со сроком беременности 8–14 нед» (нмоль/л)

График квантилей (Q-Q plot) является одним из способов проверки нормальности. В случае нормального распределения точки графика практически совпадают с прямой линией, характеризующей теоретическое нормальное распределение. На рис. 3.5 представлен случай нормального распределения, на рис. 3.6 — случай распределения, отличного от нормального. Графики построены в SPSS («Анализ»/«Описательные статистики»/«Разведочный анализ»/«Графики»/«Графики и критерии для проверки нормальности»).

Рис. 3.5. График Q-Q plot для нормально распределенного признака «Рост» (см)

 

Рис. 3.6. График Q-Q plot для признака «Возраст беременных женщин» (лет), распределение которого отлично от нормального

«Ящик с усами»  представление основных описательных статистик графически. Горизонтальные границы ящика — это первый и третий квартили (Q1 и Q3). Горизонтальная линия внутри ящика — это медиана (Ме), причем если медиана делит ящик на две равные части, то закон распределения близок к нормальному. Усы — это минимальное и максимальное значение.

Кроме перечисленных характеристик, «ящик с усами» показывает еще и выбросы (резко выделяющиеся значения, искажающие свойства исследуемой совокупности).

В качестве примера на рис. 3.7 и 3.8 представлены «ящики с усами» для признаков «Рост» и «Уровень кортизола у женщин со сроком беременности 8–14 нед». По рис. 3.7 можно предположить, что признак «Рост» имеет нормальный закон распределения. На рис. 3.8, предположительно, закон распределения отличен от нормального, причем имеются выбросы, номера наблюдений которых 3 и 26.

Рис. 3.7. «Ящик с усами» для признака «Рост» (см)

 

Рис. 3.8. «Ящик с усами» для признака «Уровень кортизола у женщин со сроком беременности 8–14 нед» (нмоль/л)

Графики построены в SPSS («Анализ»/«Описательные статистики»/«Разведочный анализ»/«Графики»/«Ящичные диаграммы с усами»).

Данный вид графического представления возможен также и для группы показателей (рис. 3.9).

Рис. 3.9. «Ящик с усами» для нескольких показателей

Возможность построения «ящика с усами» предусмотрена в Gretl и Excel. Для его построения в Gretl необходимо выполнить следующие шаги: «Вид»/«График»/«Коробчатая диаграмма». Для построения «ящика с усами» в Excel порядок действий следующий: «Вставка»/«Диаграммы»/«Ящик с усами».

Для продолжения работы требуется Регистрация
На предыдущую страницу

Предыдущая страница

Следующая страница

На следующую страницу
Глава 3. Графическое представление данных
На предыдущую главу Предыдущая глава
оглавление
Следующая глава На следующую главу