2.1. Основные биометрические параметры и их точность
С каждым пользователем связывается основное 5-мерное пространство параметров. Эти параметры следующие: 1 — пол, 2 — возраст, 3 — масса тела, 4 — рост (длина тела) или, как вариант, индекс массы тела, 5 — уровень физической активности.
Кроме перечисленных, существуют еще и другие биометрические параметры, влияющие на особенности питания, а также ряд параметров, связанных с внешними условиями. Эти параметры относятся к более сложно определяемым величинам, таким как тип метаболизма, величина подкожного жира, тип скелета. Индивидуумы различаются также своими культурными особенностями и социально-экономическим положением. На организацию структуры питания влияет экологическая обстановка в области проживания и другие внешние факторы. Создание моделей, учитывающих зависимость индивидуальных особенностей потребления продуктов питания от этих параметров, также является целью развития цифровой нутрициологии.
Кроме того, в перечень параметров, от которых зависит структура питания, входят алиментарные заболевания, которые могут быть у пользователя и с которыми связаны специфические продукты питания или их изъятие из рациона питания.
В настоящей монографии мы рассматриваем на уровне моделей только указанные выше пять основных параметров, которые имеют следующую внутреннюю классификацию для здоровых людей.
Два класса полов: мужской пол (обозначается индексом M), женский пол (обозначается индексом F).
Пять возрастных групп населения: 1 — 18–29 лет, 2 — 30–39 лет, 3 — 40–59 лет, 4 — 60 лет — 74 года, 5 — лица пожилого возраста (75 лет и старше).
Десять классов по массе тела: от 50 до 100 кг для мужчин и от 40 до 90 кг для женщин с шагом в 5 кг.
Пять ранговых параметров для классификации физической активности. Согласно методическим рекомендациям [2] для взрослого населения вводится: 1 — очень низкая активность энерготрат, ранговый индекс k = 1,4; 2 — низкая активность, ранговый индекс k = 1,6; 3 — средняя активность, ранговый индекс k = 1,9; 4 — высокая активность, ранговый индекс k = 2,2; 5 — очень высокая активность, ранговый индекс k = 2,5.
Девять значений индекса I массы тела, который представляет собой отношение массы тела в килограммах к квадрату роста в метрах. Эта величина используется для оценки дефицита массы тела или избыточной массы тела. В соответствии с рекомендациями Всемирной организации здравоохранения [67] вводятся следующие градации:
- I < 16 — выраженная худоба;
- 16 < I < 16,99 — умеренная худоба;
- 17 < I < 18,49 — легкая худоба;
- 18,5 < I < 24,99 — нормальные пределы;
- I ≥ 25,0 — избыточная масса тела;
- 25,0 < I < 29,99 — предожирение;
- 30,0 < I < 34,99 — ожирение I степени;
- 35,0 < I < 39,99 — ожирение II степени;
- I ≥ 40,0 — ожирение III степени.
В то же время следует учитывать, что данная классификация отвечает среднему уровню физической активности, тогда как для высокого уровня (тяжелой физической работы или для спортсменов) этот индекс может сдвигаться вправо, а для низкой физической активности — влево.
Таким образом, в представленной укрупненной классификации размерность вектора собственных параметров пользователя, равная произведению количества независимых классов, составляет
n = 4500 без учета внешних факторов и заболеваний. Предполагая, что каждая компонента этого вектора определяется на основе практических измерений, то есть имеет статистический характер, для оценки относительной точности ε получаемых данных по выборке конечного объема N используем формулу [65]:
. (2.1.1)
Эта формула получается следующим образом. Набор из n классов представляет собой гистограмму распределения N пользователей по параметрам. Предполагая, что эмпирическое распределение, которое мы обозначим как f (n)(j; N), где j есть номер классового интервала, приближает объективно существующую генеральную совокупность, обозначаемую f(n)(j), и попадание в разные классы полностью случайно, используем известный результат математической статистики о том, что статистика
имеет распределение Стьюдента с N–1 степенью свободы. Данная статистика оценивает величину отклонения эмпирической частоты попадания в заданный классовый интервал от гипотетической генеральной вероятности. Здесь s2( j; N) есть выборочная дисперсия отдельной эмпирической частоты, равная
.
Поскольку N > 1, то вместо квантиля распределения Стьюдента в оценке доверительного интервала для вероятности
f(n)(j; N) можно взять квантиль нормального распределения
u1–ε/2, где ε — уровень значимости, на котором принимается решение о близости распределений. Тогда в приближении на уровне значимости ε выражение не превосходит величины
.
Поскольку уровень значимости не должен быть точнее интегрального уровня неопределенности в позиционировании доверительного интервала , то требуется также выполнение условия:
.
В результате получаем, что минимальное число N респондентов для достижения заданной точности ε в оценке вероятностей определяется условием: