Две статистики
Что вообще такое статистика? Сам термин искусственного происхождения. Введён в оборот Ахенваллем Готфридом, который заменил название курса, который он преподавал в университете с "Государствоведение" на "Статистика". И тут логичен вопрос, а какая связь между вроде бы математической дисциплиной и государственными делами? А ответ очень прост. Письменность, государство и статистика возникают одновеременно. Первые записи человечества по сути храмовые долговые расписки. Процитирую:
В крупных храмовых хозяйствах было много жрецов, которые специально занимались измерением земельных участков, организовывали прокладку каналов, вели счет собственному урожаю. Именно храм управлял жизнью соседних городов и деревень, собирал с населения подати, раздавал еду в голодные годы. Хозяйственная деятельность храмовой общины обусловила необходимость ведения учета. Самые ранние записи принадлежат храмовым чиновникам. Они должны были считать, сколько зерна, масла, мяса произведено в хозяйстве, сколько выдано работникам на пропитание, сколько осталось в распоряжении храма. Кроме того, чиновники вели учет сделок на продажу земли и прав собственности на имущество.
Как там было у В.И. Ленина в работе "Как организовать соревнование":
Учет и контроль за количеством труда и за распределением продуктов — в этом суть социалистического преобразования.
Формирование статистики и есть учет и контроль. Поэтому, статистика есть основа для понимания процессов идущих в государстве, в крупных человеческих коллективах, на производстве, да везде! Ахенвалль, выводя статистику из государствоведения с одной стороны закладывал основы для отстранённого научного анализа численных данных и развития статистического инструментария. А с другой стороны выбивал смысловую часть из статистики, отдаляя от специалистов понимание зачем вообще нужна статистика.
Те кто говорят, что статистика это раздел математики не правы. Государственные чиновники реализуя колоссальную потребность в учете и контроле создают статистику, а уже потом, философы анализируя эту практику создают математику. Так, что правильнее говорить, что математика раздел статистики. ?
Давайте внимательнее посмотрим на приведенную выше Ленинскую философскую формулу. С одной стороны учет и контроль, а с другой стороны преобразование. Отсюда становится понятно почему статистика делится на описательную статистику (учет и контроль) и статистику выводов (преобразование). Начнем с описательной статистики.
В этом месте обычно начинается красочный рассказ о терминах на примере зайчиков, котиков или рыбок для наглядности. Иногда с рисунками. Тут тема не нова и есть много хороших и наглядных книг. Есть даже манга. В общем, человеческий ум в стремлении подать материал о базовых статистиках максимально доходчиво проделал огромную работу. В общем не будем повторяться. Поэтому, основные термины рассмотрим исторически.
Представьте, Вы царь древнего Вавилона. И ваша задача - сформировать бюджет. И с этой целью Вы организуете первую в истории систему налогообложения. И какие вопросы Вам нужно для этого ответить?
Вопросы по налоговой базе:
- сколько человек живет в моем царстве?
- как население распределено по территории?
- какая производительность труда у моих поданных по различным отраслям?
- как производительность труда распределена по регионам?
Вопросы налоговой нагрузки:
- сколько собирать налогов с населения, чтобы оно не умирало с голоду?
- как распределить нагрузку по отраслям и регионам?
- в какой форме взымать налоги?
- как собирать налоги с торговцев, чтобы они не проезжали мимо моего царства?
Вопросы собираемости налогов:
- собираются ли налоги в полном объеме?
- сколько из собранных налогов доезжает до моей казны?
Прониклись масштабом задачи? Именно ввиду масштаба задачи Вы предпринимаете невиданное ранее действо - перепись всего населения царства. На языке статистики все население это генеральная совокупность. Обладая царской властью Вы можете работать с генеральными совокупностями т.е. изучая все население в целом. При этом это чудовищно дорого и очень долго! Но у Вас есть умные подданные. К Вам приходит жрец и предлагает - давайте делать перепись не каждые пять лет, а раз в пятьдесят лет, но ежегодно делать выборочные переписи т.е. оценивать все население (генеральную совокупность) по выборке. При правильной организации выборок мы практически не теряем в точности, но при этом экономим много ресурсов.
Но генеральная совокупность и выборка это не одно число, а набор чисел. В государственном масштабе это очень очень много чисел. Поэтому, много цифр заменяются на интегральные характеристики: центр (среднее, медиана, мода) и разброс (среднеквадратическое отклонение, межквартильный размах). Есть и другие интегральные характеристики, про них детально в инструментальной части. Интегральные характеристики позволяют смотреть на выборку в целом, что открывает широкий простор для анализа. Это в том числе и анализ динамики изменения выборок во времени.
И вот Вам приносят итоги переписи. Вы их просматриваете и видите, что в провинции А живет в два раза больше людей, чем в провинции Б. Но налогов с этих провинций приходит одинаково. Почему так? В провинции А вороватые чиновники? Там был неурожай? Провинция А пограничная и там больше ресурсов тратится на оборону? Или еще что? И в зависимости от того, какой ответ верен, Ваши действия будут разные. А в поиске правильного ответа помогает статистика выводов. Статистика выводов это разнообразные инструменты анализа гипотез, математического моделирования, планирования и анализа экспериментов.
На этой статье заканчиваем вводную философскую часть и переходим к инструментальной части.
0 комментариев