Книга «Искусство статистики. Как находить ответы в данных»

Дэвид Шпигельхалтер — профессор Кембриджского университета и статистик. Всю жизнь он занимается изучением данных и построением моделей, а также поиском ответов на вопросы, которые можно разрешить путем их анализа.

Книга «Искусство статистики. Как находить ответы в данных» как раз и повествует о разных аспектах работы в этой области: от простых случаев к сложным моделям и предсказаниям вероятностей и ошибок.

Искусство статистики

Основа работы с данными, по мнению автора, заключается в применении цикла решения проблем PPDAC — Problem, Plan, Data, Analysis, Conclusion (проблема, план, данные, анализ, заключение). По словам автора, на практике он не соблюдается с абсолютной точностью, но дает представление о ходе работы над проблемой и подчеркивает, что формальная составляющая в статистике — лишь часть процесса.

Эта идея прослеживается на всем протяжении книги. Автор уверенно демонстрирует различные аспекты и методы исследований в статистике, но постоянно подвергает выводы критике и задается вопросами. Действительно ли это так? Нет ли здесь других объяснений? Эта часть любого исследования кажется весьма логичной. Ведь если взять какие-то данные, обработать их и найти закономерность, то всегда можно усомниться в том, что одно связано с другим. Например, в начале книги Шпигельхалтер приводит пример из личного опыта, основанный на выживаемости детей после операций на сердце в разных больницах Соединенного королевства. В одной из больниц смертность была выше, чем в других, и в результате статистического исследования это удалось доказать.

Однако автор тут же замечает, что в подобных случаях полагаться на чистые данные глупо. Ведь эта больница могла, например, принимать более тяжелых больных, в результате говорить об этом уже было бы неразумно. Поэтому в ходе всей книги тут и там встречаются намеки или замечания о том, что простые исследования цифр могут либо быть недостаточно объективными, либо искажать реальную картину из-за различных факторов.

Искусство статистики

Одним из примеров в данном случае выступают частые заголовки в СМИ о том, что некий продукт или предмет увеличивает риск возникновения заболеваний, например рака. Автор приводит анализ влияния употребления бекона в течение всей жизни на такой исход и делает вывод, что хотя цифры вроде «на 18%» и звучат устрашающе в заголовках, в реальности не столь громадны.

Вопросу вероятностей и вовсе в книге посвящено несколько глав. Ведь в какой-то момент теория вероятностей и статистика встречаются, позволяя делать предположения, основываясь на анализе данных. Автор рассказывает о различных подходах к изучению выборок: алгоритмизации, построению деревьев классификации и регрессивных моделей. А ближе к концу затрагивает и такие темы, как байесовская статистика. Это направление в науке, изучающее степень доверия событию, т. е. если какая-то закономерность существует и успешно повторяется, то есть и определенная вероятность того, что новые события в ней появятся и будут похожими. С использованием такого подхода работают многие современные антиспам-системы. Вначале их обучают на проверенных наборах данных, а затем нацеливают на реальные. В итоге при правильной настройке типовые спам-письма отсекаются с очень большой вероятностью. При этом такие системы умеют корректироваться и дообучаться. Забавно, что этот подход был придуман британским математиком Томасом Байесом еще в XVIII веке. Как говорится, все новое — хорошо забытое старое.

Есть у «Искусства статистики» и обратная сторона. Нам нравится узнавать что-то новое и восхитительное, а половина примеров здесь мрачные и удручающие: детская смертность, серийный убийца, рак. И хотя это все жизненные темы, а автор пытается показать, что статистика может помочь спасать жизни, местами при прочтении это угнетает.

Искусство статистики
На самой обложке ни намека на название, зато переплет достаточно качественный, еще и с ляссе

Сама книга вышла в этом году впервые на русском языке. Переведена и издана она издательством «Манн, Иванов и Фербер», которое и предоставило книгу для подготовки материала. Несмотря на то что информация подана в достаточно облегченной форме, иногда читать оказывается непросто, приходится вникать и разбираться. Хороший шрифт и большие межстрочные интервалы помогают не увязнуть совсем в горе текста. Впрочем, он хорошо разбавлен иллюстрациями, а в конце есть большой глоссарий.

Издание выполнено качественно: толстая обложка, прошитые блоки на тканевой основе. Отпечатана в Ульяновской типографии. В книге почти 450 страниц, что объясняется хорошим шрифтом и теми самыми интервалами. А еще достаточно плотной бумагой, которая создает немного двойственное ощущение. От такого дорогого издания ожидаешь бумагу чуть лучше. Но главный вопрос в другом. Книга имеет цветную картонную суперобложку, которая, естественно, сразу же снимается, так как читать с ней неудобно. Под ней — толстая обложка очень приятного бирюзового цвета. Но название книги есть только на корешке. Лицевая сторона вообще лишена опознавательных знаков. А еще она очень маркая, и после прочтения появляются следы.

Но это скорее небольшие нарекания к самому изданию, тогда как основной интерес, само собой, представляет содержимое, тем более что оно публикуется на русском языке впервые.

А книга интересная. Автор поднимает множество как очень специфичных, так и весьма важных вопросов, которые могут дать читателю новый взгляд на важные проблемы. Например, в эпоху пандемии читать об исследовании эффективности лекарств и их слепых тестированиях весьма познавательно. В целом «Искусство статистики» — отличный экскурс в мир статистической науки без зубодробительных формул и занудств. Хорошая книга для технарей, желающих расширить кругозор. Вот только примеры могут показаться излишне трагичными: детская смертность, серийные убийцы и количество интимных партнеров за жизнь у среднестатистического британца.

Масса: 790 г
ISBN: 978-5-00169-250-8
Издание: твердая обложка
Страниц: 448
Формат: 240 × 175
Авторы: Дэвид Шпигельхалтер

Avatar photo
Евгений@evgeny (187 lvl)
Гик и геймер. Фанат ПК и чуточку консольщик. Редактор и автор.
Подписывайтесь на Age of Geeks в Twitter, Telegram, FB, следите за актуальным там, где вам удобно! Также вы можете присылать нам свои статьи. Если вам понравился материал, поддержите проект.
Комментарии