Продолжаем PYTHONировать – #16-05/24

Привет! Самостоятельное обучение аналитике данных идет своим чередом. Книги читаются, пет-проект пишется, документация штудируется. К сожалению, сегодня по теме блога у меня не много новостей. В начале мая взял небольшие каникулы, чтобы заняться неотложными вопросами и выпал из налаженного графика. Сейчас основная масса дел переделана и потихоньку возвращаюсь к Питону и базам данных. На учебу сейчас нужно налечь еще и потому, что следующая статья в конце мая будет отчетная – за плечами уже шесть месяцев самостоятельного обучения и не хочется упасть перед вами в грязь лицом😉

Утро начинается не с кофе. Хотя и с кофе тоже :)
Утро начинается не с кофе. Хотя и с кофе тоже :)

Несмотря на свалившиеся дела, я приступил к изучению библиотек Питона. Начал с numpy и pandas по проверенной схеме «глава книги – уточнения в документации – практика в PyCharm». Хотя, мне показалось, что NumPy можно с натяжкой назвать библиотекой. Поправьте, если я не прав, но здесь для новичка интерес представляет только класс ndarray, его логика работы и основные методы.

Книгу «Python и анализ данных» я начал недавно, но уже сейчас хотел бы отметить прекрасную главу с описанием основных концепций и механизмов языка. Материал не рассчитан на абсолютных новичков, но после прочтения предыдущего самоучителя (здесь есть мой отзыв), первая глава быстро собрала воедино и структурировала все основы. Полезная шпаргалка, чтобы освежить в памяти отличительные черты Питона.

Все кратко и по делу
Все кратко и по делу

Помимо numpy я также начал знакомство с pandas – одной из основных библиотек для анализа данных. И сразу мне стали отчетливо ясны комментарии о том, что хорошего айтишника отличает не столько доскональное знание какого-то отдельного инструмента, а способность выбрать подходящий инструмент для конкретной задачи. Например, одно из основных преимуществ numpy – упрощение логики и синтаксиса при работе с вложенными списками. Здесь они называются массивы, но суть одна. Там, где на чистом Питоне нужно продумывать циклы for с поэлементным проходом по всему набору данных, numpy делает это парой строчек кода.

Пример поэлементных преобразований в numpy
Пример поэлементных преобразований в numpy

Наверняка в pandas появятся и другие возможности оптимизации, а мне снова придется перестраивать способ мышления. Ну и хорошо, мой набор инструментов будет только расти🙂

Как бы мне ни нравилась подача материала в книге, есть у нее и один существенный недостаток. Перевод некоторых терминов порой вводит в заблуждение. Я не уверен, что вообще стоит переводить термины, вроде fancy indexing (в книге – «прихотливое индексирование») и list comprehension (в книге – «списковое включение»). Похоже, переводчик такого же мнения, потому что оставил небольшие пояснения по этому поводу😅

Трудности перевода
Трудности перевода

P.S. Как я уже сказал, в следующей статье подведу итог шести месяцев моего самостоятельного обучения аналитике данных. До этого времени планирую закончить с самыми-самыми основами pandas, и далее, в июне, приступить к бизнес-метрикам (LTV, конверсия, retention и вот это вот все). Нужно научиться считать хотя бы три-четыре основных метрики.

Также пришла пора внести основные вехи моего обучения в резюме😎 Да, хочу уже потихоньку продвигаться в сторону составления резюме и собеседований. За полгода я изучил довольно много теории и часть из нее опробовал на практике. Но пока знания эти довольно разрозненные. Поэтому, как мне часто советовали в комментариях, постараюсь сильно не засиживаться над теорией, а поскорее начать затачиваться под реальную профессию. Совсем скоро расскажу вам, чего же хотят работодатели от соискателей на позицию аналитика данных😏

8
13 комментариев

Кто на учебнике нарисован? Сначала показалось, что хорек, но у них морда не такая вытянутая

Пишут, что это тупайя) И она подбухивает

3

Это издевательство постоянно ставит на обложку виды из красной книги

1

Учить что-то айтишное по книжке это то ещё издевательство над собой; код из книжки не скопировать и быстро не проверить, могут встречаться ошибки, сама книга была написана много лет назад и ещё несколько лет ждала перевода на русский язык - с тех пор сильно устарела и не соответствует новым версиям.

Копировать код будучи учеником - быть ебанатом. Слава богу, что его нельзя копировать, потому что когда учишься, надо его печатать своими блядскими пальцами

2

Насчет копирования текста не согласен. Не перепечатываю половину книги к себе, но при печати отдельных методов или функций намного лучше запоминается материал. Работает мышечная память.

По поводу устаревания информации, есть такое дело. Но на моем этапе обучения не принципиальны отличия в материале годичной-двухгодичной давности. А оригинал книги вышел в 2022 году. Нюансы, которые обновились с тех пор буду постигать уже на реальных проектах

Комментарий удалён модератором