7.1. КОНТРОЛЬ СОБРАННЫХ ДАННЫХ
В процессе сбора эмпирических данных могут возникнуть погрешности и неточности, которые называют ошибками наблюдения. Количественно их определяет разница между зафиксированной величиной признака и действительной его величиной.
Именно поэтому необходимо проводить контроль собранных материалов. Их необходимо проверить с точки зрения полноты охвата всех единиц выборочной совокупности (например, все ли приглашенные для исследования участники прошли опрос) и правильности заполнения бланков.
Рассмотрим основные ошибки, возникающие при сборе эмпирической информации. Это ошибки регистрации и ошибки репрезентативности (представительства). В каждой из этих групп выделяют ошибки случайные и систематические.
Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или их ошибочной записи.
Причины случайных ошибок: ошибки счета и округления чисел, описки, оговорки и т.п.
Систематические ошибки регистрации возникают вследствие действия определенных постоянных причин: сознательное искажение фактов в сторону уменьшения или увеличения их величины, неточность измерительных приборов и т.д. Примером систематической ошибки может служить широко известное в статистике явление округления возраста лицами средней и старшей возрастных групп до чисел, кратных 5, или, особенно, 10. Например, вместо возраста 48–49 и 51–52 лет люди говорят, что им 50 лет.
Систематические ошибки регистрации могут быть преднамеренными и непреднамеренными.
Преднамеренные ошибки возникают вследствие того, что респондент, зная истинное положение вещей, сознательно искажает предоставляемую информацию. Например, на вопрос о конфликтных ситуациях в отделении он отвечает, что конфликты полностью отсутствуют. Это может быть связано со страхом нарушения конфиденциальности исследования, нежеланием «выносить сор из избы» и т.д.
Непреднамеренные ошибки бывают вызваны различными случайными причинами (например, невнимательностью как самих респондентов, так и людей, фиксирующих получаемую информацию; неисправностью измерительных приборов и т.д.).
В табл. 19 представлены ответы респондентов, которые формируются автоматически при использовании для сбора информации Google Forms. Как мы видим, в колонках «Ваш возраст» и «Ваш стаж работы в медицине» часть информации представлена некорректно. Некоторые респонденты представили информацию с точностью до десятых, хотя в инструкции их просили указать целое число лет. Некоторые респонденты вписали в ответ, помимо числовой информации, буквенную. И если первая ошибка не представляет собой угрозы результатам исследования, то вторая нуждается в исправлении: буквенную информацию следует удалить.
Таблица 19. Пример непреднамеренных ошибок при заполнении анкеты Google Forms
№ п/п | Отметка времени | 1. Ваш пол | 2. Ваш возраст | 3. Ваш стаж работы в медицине |
1 | 22.12.2022 16:53:43 | Ж | 36 лет | 17 лет |
2 | 22.12.2022 16:54:07 | Ж | 29 | 9 лет |
3 | 22.12.2022 16:55:02 | Ж | 41 | 22,5 |
4 | 22.12.2022 16:55:34 | Ж | 26 | 2 года |
5 | 22.12.2022 16:55:43 | Ж | 49,5 лет | 15,5 лет |
6 | 22.12.2022 16:55:57 | Ж | 22 | 3 |
7 | 22.12.2022 16:56:07 | Ж | 50 | 5 лет |
8 | 22.12.2022 16:56:40 | Ж | 30 | 9 лет |
9 | 22.12.2022 16:56:55 | Ж | 63 | 43 |
10 | 22.12.2022 16:58:02 | Ж | 25 | 5 лет |
11 | 22.12.2022 16:58:08 | Ж | 48 | 29 |
12 | 22.12.2022 16:58:40 | Ж | 41 | 19 |
13 | 22.12.2022 16:58:53 | Ж | 30 | 10 |
14 | 22.12.2022 17:00:10 | Ж | 50 | 30 |
15 | 22.12.2022 17:04:47 | Ж | 63 | 38 |
16 | 22.12.2022 17:05:35 | Ж | 28 | 8 |
17 | 22.12.2022 17:05:45 | Ж | 23 года | 4,5 года |
18 | 22.12.2022 17:06:32 | Ж | 47 | 22 |
19 | 22.12.2022 17:07:27 | Ж | 39 | 23 |
20 | 22.12.2022 17:11:38 | Ж | 36 | 14 |
21 | 22.12.2022 17:11:42 | Ж | 61 | 38 |
22 | 22.12.2022 17:11:45 | Ж | 33 | 11 лет |
23 | 22.12.2022 17:13:35 | Ж | 50 | 20 лет |
24 | 22.12.2022 17:15:16 | Ж | 49 | 32 |
Если случайные ошибки имеют разную направленность и в силу действия закона больших чисел взаимно уравновешиваются, то систематические ошибки направлены в одну сторону, поэтому уменьшают или увеличивают значение признаков, что влияет на результаты исследования.
Ошибки репрезентативности (представительства) возникают в результате формирования выборочной совокупности. Как бы тщательно и правильно она ни была сформирована, она всегда недостаточно точно отражает характеристики генеральной совокупности. Ошибки репрезентативности также могут быть случайными и систематическими.