Собес сбер CX отделение — Transcript

Собеседование на позицию аналитика в Сбер CX: обсуждение опыта, технических навыков и задач.

Key Takeaways

  • Кандидат имеет более трёх лет опыта в аналитике с сильными навыками Python и SQL.
  • Важна автоматизация дашбордов через взаимодействие с дата-инженерами и использование Airflow.
  • Причины смены работы связаны с семейными обстоятельствами и желанием профессионального развития.
  • Позиция предполагает работу с продуктовой аналитикой и расширением бизнес-контекста.
  • Кандидат стремится к карьерному росту и освоению новых компетенций в аналитике.

Summary

  • Встреча с рекрутером Иваном и руководителем команды Эдуардом для обсуждения вакансии аналитика.
  • Кандидат Артём рассказывает о своём опыте работы в аналитике данных, включая e-commerce и банковскую сферу.
  • Обсуждаются технические навыки: SQL, Python, BI-системы, построение дашбордов и A/B тестирование.
  • Подробно рассматривается процесс создания и автоматизации дашбордов с помощью DataLens и взаимодействия с дата-инженерами.
  • Кандидат объясняет причины смены работы, включая семейные обстоятельства и профессиональный застой.
  • Обсуждается специфика продуктовой аналитики и ожидания от новой позиции.
  • Проводится разбор практических кейсов и задач на SQL и аналитику.
  • Ведётся диалог о бизнес-контексте и перспективах развития в аналитике.
  • Кандидат делится планами на карьерный рост до уровня синьор-аналитика.
  • В конце обсуждаются организационные моменты и дальнейшие шаги по вакансии.

Full Transcript — Download SRT & Markdown

00:14
Speaker A
Ой, не для меня придёт весна. Привет. Приветствую. Добрый день. Артём, добрый день. Меня зовут Иван. Я рекрутор команды Сбера. Вот сегодня со мной мой коллега Курусов Эдуард. Это руководитель команды, о которой мы говорили. Сегодня сможем пообщаться, познакомиться. Вот я тогда
00:44
Speaker A
сейчас передаю слово Эду. Вот. И я отключусь, но чуть позже вернусь с обратной связью, расскажу, как поступим дальше.
00:50
Speaker A
Угу. Хорошо. Супер. Всё, отличная встреча. Беги, беги. Артём, привет. Э, представлюсь. Э, у меня команда премиальных каналов и сегментов. Сейчас в эту команду я ищу аналитика. Э, перед тем, как я расскажу про вакансию, ставку, отвечу на твои вопросы по
01:10
Speaker A
ставке, давай обсудим твой опыт, что делал, что по технике с точки зрения SQL, Python и BI.
01:19
Speaker A
Дальше позадаю тебе вопросы по твоему опыту, параничных вопросов по задачкам и потом уже перейдём к описанию вакансии.
01:28
Speaker A
Угу. Хорошо. Ну, я тоже так кратко расскажу. Я в аналитике данных порядка чуть больше трёх лет. Всё это время был в контексте e-commerce бизнеса. То есть я начинал с компании ekoTech, там на стажировку попал, со стажировки пришёл на младшую аналитическую
01:42
Speaker A
должность. А вот, то есть занимался там отчётностью, выгрузками, нохок на Python уже был и под конец как бы моего рабочего срока там, ну, соответственно, вот, ну, по большей части в ekoTech я занимался отчётностью. Вот, соответственно, из
02:02
Speaker A
ekoTech ушёл, когда, ну, уже самостоятельно выучил довольно много всего, то есть и про атесты, и очень хорошо, ну, как я считаю, владел Python, Pandas и всем аналитическим стеком на Python. Вот. А повышения мне как бы не давали. И у меня вот знакомый
02:16
Speaker A
работал в Голоцентре, но он был в другом отделе, сказал: "У нас вроде как круто".
02:20
Speaker A
Вот отсобесился в Голоцентр, всё, меня взяли. Там у меня уже как бы был такой, ну, больше обязанностей, в общем, на мне было. То есть это и проведение A/B тестов, а, то есть со всей подкапотной статистикой. Там в Голоцентре как бы была своя платформа на
02:36
Speaker A
BI для A/B тестов, то есть которая считала доверительные интервалы сама. Вот. Но размер выборки, то есть и задача MDE, это как бы вот на нас лежало. Вот.
02:46
Speaker A
Ну, и проводил я их в Vimel с ещё одним аналитиком. Потом это, то есть анализ на Python не только ad hoc, то есть это когортный анализ, RFM-анализ.
02:58
Speaker A
Вот, то есть также Pandas, NumPy, пару раз пришлось применять Scikit-learn, то есть какие-то базовые такие модели машинного обучения, типа логистической регрессии там. Ну и, соответственно, под это всё приходилось подготавливать данные, то есть с помощью стандартизации данных, там, нормализации
03:17
Speaker A
и кодирования категориальных признаков. Вот. Потом это тоже BI часть, это поддержка дашбордов и их создание. То есть я курировал четыре дашборда, два из которых сам сделал.
03:31
Speaker A
У нас был Яндекс DataLens, использовался как BI система. И также это была работа с SQL. То есть у нас был Greenplum, была БД поверх Greenpluma.
03:45
Speaker A
Вот в Greenplume лежали агрегаты данных, а эти агрегаты уже доставались из ClickHouse. То есть в ClickHouse у нас шли логи. То есть вся такая, ну, то есть всё, что на сайте происходит, всё, что пользователь делает, это сваливалось в ClickHouse, а
04:02
Speaker A
дальше уже агрегаты шли в Greenplum. Соответственно, вот, а с ClickHouse я как бы работал, э, то есть делал оттуда выгрузки, занимался ивент-аналитикой, то есть построение воронок, как пользователь там перемещается по сайту, какая воронка. Ну, соответственно, вот если вкратце, то вот
04:21
Speaker A
так. Тогда давай чуть поуточняемся. Первое, что меня будет интересовать, мне понятно, что ты создавал дашборды с нуля, которые там ты описал на последнем месте работы. Два даша ты создал вроде как с нуля и курируешь их. Отсюда вопрос: как
04:40
Speaker A
ты их создавал? Как они живут? То есть обновляешь ли их ты сам вручную? Либо это каким-то способом автоматизировано?
04:47
Speaker A
Если да, то каким? Ага. Ну, то есть я их создавал с нуля. Их обновление оно автоматизировано. То есть это, то есть, ну, задача была у дата-инженеров, чтобы дашборд обновлялся сам. То есть там используется Airflow, вроде как. Ну, то
05:03
Speaker A
есть все вот эти инструменты для оркестрации данных, чтобы их гонять туда-сюда. Я этим не занимался. Этим занимались дата-инженеры. Но именно само построение дашборда, то есть выбор колонок, которые должны быть, типы колонок, ну, это всё запрос пишется дата-
05:18
Speaker A
инженерам, дата-инженеры уже подготавливают таблицу для этих целей. А ты им задачу сам ставил или каким образом ты... Ну вот я понимаю, что ты там, допустим, выгрузил датасет, разово создал дашборд, то есть каким образом э они отдавали и это превращалось в автономный...
05:39
Speaker A
Ну, то есть, ну, вообще, как всё было? То есть ко мне подходит, говорит, поступил запрос из отдела маркетинга, что вот так-то, так-то нужен вот такой.
05:48
Speaker A
Всё, напиши требования этим дата-инженерам, а какую-то какую таблицу тебе нужна для этого. Соответственно, я написал требования, таблицу подготовили, и на основе этой таблицы, данные, в которой обновлялись, я уже построил дашборд в DataLens.
06:04
Speaker A
А, то есть ты по сути сразу уже просишь какой-то датасет готовый от инженеров, который сам будет обновляться, и потом от него строишь дашборд.
06:13
Speaker A
Да. Ну, то есть вот с этими ETL операциями у нас занимались дата-инженеры. Не, я понимаю, что ETL и Airflow занимаются инженеры. Я не к этому, я пытаюсь понять, как автоматизация дашбордов происходит. Вот, понял. То есть, значит, у тебя прототип и готовое решение уже
06:32
Speaker A
два в одном было. Ты, по сути, просто ждал готовую витрину данных, от которой ты пойдёшь строить.
06:37
Speaker A
А если у тебя изменились требования к дашборду, ну, например, тебе там надо было построить из трёх атрибутов, и ты заказал это у инженеров, они тебе вывели витрину, а потом потребовался четвёртый, пятый атрибут, которого у тебя ещё там не было.
06:51
Speaker A
Ну, можно было бы попробовать вывести из имеющихся атрибутов что-нибудь, если это не получится, ну, соответственно, надо будет уже обращаться к дата-инженеру, чтобы добавили, условно говоря, какие-нибудь колонки, чтобы мне вот э можно было посчитать, добавить в дашборд соответственно.
07:08
Speaker A
Я понял. Так, э, дальше, э, я из твоего опыта кажется, что ты больше продуктовый аналитик, если я тебя правильно понял.
07:18
Speaker A
Да, да. Отсюда вопрос, что ты для себя вообще ищешь? А, ну, соответственно, вот этот вопрос, он так связан с причиной моего ухода с предыдущего места работы, то есть из Голоцентра. А, соответственно, я так расскажу быстренько. Короче, есть две причины. А первая причина основная —
07:38
Speaker A
это семейная. Мне надо было быть постоянно в разъездах. Я не знал, сколько это продлится. Я, конечно, команду предупредил, сказал: "Лучше ищите замену". Всё. Вторая причина — это вот то, что в Голоцентре я почувствовал такой застойчик. То есть, в принципе,
07:49
Speaker A
задачи уже кажутся однотипными. Никакого развития я не почувствовал там, ну, не чувствовал уже, ну, может, полгода. Вот.
07:56
Speaker A
А в соответствии с этим решил немного изменить контекст, то есть бизнес-контекст, в котором буду работать. А, ну вот я, ээ, по поводу разъездов, я не понял, ты сейчас до сих пор в разъездах или нет? Нет, нет. Это, то есть, это уже как
08:13
Speaker A
бы вот эта причина, по которой мне надо было быть в разъездах, она уже всё кончилась. А вот поэтому я и вышел на рынок труда. Потом, ну, я бы не искал работу, если бы я вот точно не знал, что
08:23
Speaker A
вот мне надо будет там так-то так-то восемь часов отработать. Вот. А так-то я все свои дела завершил, вот поэтому и вышел на рынок труда.
08:32
Speaker A
Так, а по поводу застоявшихся задач не до конца понял тогда. А продуктовый аналитик, как правило, тесно связан с продуктом и там его расширением, масштабированием и, соответственно, ну, напрямую там очень часто, вот как из твоего опыта я слышал, а тесты,
08:51
Speaker A
да, которые связаны с какими-то пилотами либо с какими-то новыми фичами. Отсюда не до конца мне понятно, что там стало застаиваться.
09:02
Speaker A
Как правило, там наоборот довольно-таки динамично. Ну я не знаю, может это какая-то специфика нашей команды была, но вот даже, допустим, если мы проводим A/B тесты, да, а, но особо каких-то таких новшеств мы не вносили, то есть первичные, вторичные метрики, как правило, мы
09:20
Speaker A
особо не изменяли. То есть это вот какое-то множество метрик у...
09:34
Speaker A
средний чек, как там какую-нибудь вторичную метрику, вот и в Grail просто берём там, условно говоря, количество крашей страницы.
09:42
Speaker A
Ну, и всё. Вот как бы и вот так, грубо говоря, со всеми, то есть у нас просто был спектр метрик, мы даже особо не думали. То есть у нас под, грубо говоря, каждый атест были уже выбраны метрики. Вот. Ну, это если
09:56
Speaker A
говорить про А-тесты тоже. SQL выгрузки там плюс-минус одни и те же всегда. Хок тоже уже там никаких новшеств не приносит.
10:05
Speaker A
Ну соответственно вот какое в итоге ты себе новшество-то ищешь? Я просто ищу смены контекста, ну, то есть бизнес-контекста.
10:15
Speaker A
Ну, хорошо, допустим, ты логистику поменял на банк, банковскую сферу. А давай допустим, знания твоих банковских продуктов. Скорее всего, они будут обобщённые.
10:31
Speaker A
Отсюда вопрос. А, ну, в принципе, если мы говорим про технику SQL и там Excel, Pon, всё применяется одно и то же.
10:44
Speaker A
А как понять, что тебе это не надоест через полгода либо через там 8 месяцев, когда ты, допустим, уже начнёшь понимать банковский продукт? А, ну, соответственно, в как бы, а, в любом контексте, ну, то есть так или иначе в любом продукте, даже если
11:01
Speaker A
контекст один и тот же, а способы реализации так или иначе отличаются. То есть вот, допустим, с какими базами данных вот у вас ээ команда работает?
11:13
Speaker A
Ты имеешь в виду Гринплам или какое у нас хранилище используется или что? Ну, гнплам у нас, да, и ходу. А ходуб, Хадуб - это же этот типа аналог кликхауса, правильно я помню?
11:26
Speaker A
Нет. А нет. Ну то есть он не колом, ну Хадуп - это отдельное хранилище, в котором, по сути могут быть ровно те же самые витрины, что и в Гринпламе.
11:38
Speaker A
Вот просто он быстрее обрабатывает более объёмные данные. Но там используется только Pйpark. Угу. Так, хорошо, понял.
11:47
Speaker A
И, ну, то есть Пайпак. И дальше ты уже через библиотеки можешь обработать либо выгрузить свишку и обработать там уже на SQL, как тебе удобнее. Но первично там в любом случае забор данных идёт через SPйпак и проксирование витрины, да. Ну вот, то есть соответственно это
12:03
Speaker A
новый инструмент. Просто если вот так рассматривать, вот, допустим, я бы не уходил из Голоцентра. Вот даже если откинуть первичную причину, да, вот я бы уходил из Голоцентра, ну не уходил бы, в общем и целом. А то есть, допустим,
12:15
Speaker A
смотрим через 5 лет. Вот я сейчас последние полгода не чувствовал себя как вот как специалист, который развивается.
12:21
Speaker A
Смотрим там на протяжении 5 лет, да, я вот просто стою на месте, грубо говоря, всё. То есть такая как для себя смена контекста, изучение новых инструментов, то есть просто чтобы в дальнейшем развиваться как специалист.
12:36
Speaker A
Во что развиться хочешь? Я А, ну я бы хотел бы когда-нибудь вот в ближайшие, наверное, года три выйти на уже такой полноценного синьора аналитика и в дальнейшем, ну, уже по рынку надо будет смотреть, да, что больше будет цениться. То есть, возможно, это
12:51
Speaker A
какой-то перекат. Ну, а оставался бы я в поле дата профессий, но, возможно, это какой-то перекат в DE или в DS.
13:00
Speaker A
Вот. Но пока вот ближайшие пару лет, пока я совсем не понял тогда окончание. Вроде как более динамичную работу ищешь, более какую-то перспективную, а потом перекат в Дедс, где всё очень монотонно и очень тухло.
13:16
Speaker A
Нет, я я говорю это, ну вот от рыночных как бы от э от экономической ситуации зависит, да, потому что как бы ну работа, а деньги-то тоже надо зарабатывать.
13:27
Speaker A
Не, ну тут согласен вопроса нет. А даже если бы ты сказал, что ищешь сейчас просто из-за того, что денег надо больше зарабатывать, оно было бы понятно.
13:38
Speaker A
О'кей. Давай посмотрим, как у тебя по логике. Есть задачки у меня. Давай их попробуем решить. Если надо ручка, бумажка, то скажи, либо, может, открывай эксельку, возьмёшь в эксельке, забьёшь.
13:53
Speaker A
Угу. Скажи, как будешь готов. Да. Так. Ну, я, в принципе, эксельку-то открыл уже. Сейчас я демонстрацию.
14:03
Speaker A
Поехали. Что, демонстрация нужна или так? Да, давай демонстрацию. Первое поле дата в формате date.
14:24
Speaker A
Э, второе поле, количество продаж. Пусть будет проданные ручки. Третье поле. Стоимость одной ручки в этот день.
14:47
Speaker A
Для периода возьмём пример от 8 до 14 июня одна строка, одна дата. То есть это полная прошлая неделя. Ну, первый день эта продажа была там, допустим, 100 штук по стоимости 10 руб.
15:10
Speaker A
Второй день 150 штук под стоимостью 8 руб. Так, второй день какой? Ещё раз. 150 по стоимости 8 руб. за штуку.
15:22
Speaker A
Угу. Третий 200 штук по стоимости 12 руб. за штуку. Угу. И так далее. Неважно. На языке SQL. Как будет выглядеть средняя стоимость одной ручки за неделю?
15:36
Speaker A
Так, секунду, сейчас даты напишу. Не вопрос. Ага. Так, то есть средняя стоимость ручки за неделю. Ну, для начала нам надо выподнять, как считать вообще. То есть, условно говоря, мы берём какое-то количество продаж, а, и умножаем на стоимость, правильно? Это вот сколько мы
15:55
Speaker A
заработали с ручек за вот за день. А если нас интересует именно стоимость, средняя стоимость ручки за неделю, ну, соответственно, мне кажется, мы просто можем взять количество продаж, перемножить со стоимостью и всё это сложить и поделить на количество дней.
16:17
Speaker A
Стоимость умножаем на количество, делим на количество дней. Правильно? Ну да, да, да. Давай разбираться.
16:26
Speaker A
Если мы умножим стоимость на количество, как это ты сказал, будет называться? Ну, это просто будет выручка у нас, получается.
16:33
Speaker A
А если мы поделим на количество дней, что это будет? А, ну получается, это будет типа как бы средняя выручка за день. А, а я что спросил?
16:42
Speaker A
А, то есть среднюю стоимость ручки за неделю. Так, а тогда просто кажется сумма стоимости ручек делённая на количество дней, то есть будет будет являться как аа средняя стоимость ручки в неделю. То есть зачем нам тогда поле количества продаж
17:07
Speaker A
для данного упражнения? Ну, хороший вопрос. А, возможно, это такая хитрушка для запутывания. А, либо, возможно, я чего-то не понял.
17:20
Speaker A
Обрати внимание на количество продаж в день. Количество продаж в день на 100-150-200. М. Оно меняется вместе со стоимостью. Так, ну да, да, да, верно.
17:36
Speaker A
Если ты усреднишь только по полю стоимости, что это будет? Аа если усреднять только по полю стоимости, это, ну, получается будет, а, средняя цена вот в неделю у ручки.
17:52
Speaker A
Так, но она не будет учитывать волатильность продаж. Ну да, которая очень критична для бизнеса, особенно если это масштабный бизнес.
18:03
Speaker A
Если мы представим, что датасет гораздо больше и набор данных гораздо шире, то у тебя может быть там при таком расчёте стоимость меняться там каждый день и усреднив просто среднюю по всем дням, то ты получишь, понятно, среднее арифметическое но
18:25
Speaker A
количество продаж выбрасывать нельзя. Угу. Отсюда вопрос, как учесть этот фактор? Так а так, ну, мы уже определили, что просто перемножить количество продаж и стоимость - это не вариант.
18:44
Speaker A
А просто перемножить, да, не вариант, да? Ну, потом как его ещё можно учитывать? Ам так. Ну, у меня вот появилась сейчас идея, но я вот пытаюсь её до конца довести в голове. То есть, а, как-то возможно задействовать сумму
19:18
Speaker A
продаж. А, возможно, стоит всё-таки посчитать, а с а средняя ручки умноженная. Хотя нет, тогда мы, ну, не то получим. Нас же единица интересует, правильно? Одна одна стоимость одна одной ручки.
19:59
Speaker A
Так, ну ладно. А вот можно тогда какую-нибудь подсказочку? Что-то я пока не представляю. Ну если вот Ну хорошо. Сколько средних ты знаешь?
20:08
Speaker A
Средних, ну то есть это обычная средняя, это медиана, а среднее скользящее какое-нибудь. А, ну вот так. Обычная средняя - это какая?
20:26
Speaker A
Ну, давай по порядку. Обычная средняя - это вот, ээ, просто, грубо говоря, а-а, сумма, суммирования делённое на количество. Это вот обычная средняя, ну, то есть среднеарифметическая, да?
20:42
Speaker A
Дальше какая ещё есть средняя? Средняя геометрическая. Ага. Да. Как она считается? Так, ну, средняя геометрическая.
20:59
Speaker A
Аа, по-моему, это как Сейчас скажу, забыл. О'кей. Но самое важное для бизнеса - это средневзвешенное.
21:10
Speaker A
Угу. Ну, то есть типа брать количество продаж как какой-то коэффициент, да, условно говоря. Да, всё проще.
21:21
Speaker A
Угу. То есть ты, работая в своих двух компаниях когда-нибудь с выручкой сталкивался? С выручкой, да.
21:32
Speaker A
Ну, то есть какое-то верхнеуровневое понимание Пиля знаешь? Пиля? Ну да. То есть из чего состоит ээ компании просто, ну не обязательно прямо все статьи мне сейчас описывать, но верхний уровне основные какие-то, наверное знаешь.
21:49
Speaker A
Мм, что сказать? Я с термином PL вообще не сталкивался. То есть, ну, выручка - это верх Пияли, скажем так.
22:00
Speaker A
Угу. А, как ты уже сказал, это надо количество умножить на стоимость. Ну да. Вот. А давай разбираться. Если бы была дана выручка и количество, как вернуться к стоимости?
22:18
Speaker A
Ну, просто выручку поделить на количество, и мы получим стоимость одного товара. Так. А если мы говорим про, а, допустим, а у нас есть уже количество продаж какое-то объём общий и общая выручка.
22:36
Speaker A
А, есть объём продаж и есть общая выручка. Ну, а и надо также прийти к стоимости, да?
22:45
Speaker A
Ну, если у нас есть общая выручка, то, наверное, всё также поделить на количество. Так, ну, а теперь приземли на задачу.
22:55
Speaker A
Ага. Ну, то есть, грубо говоря, если у нас, э, ну, вот выручка делённая на количество равно стоимость, ну, и типа из этого у нас имеется количество и имеется стоимость. Мы ему, ну, типа количество можем просто перенести, да, со знаком умножить
23:19
Speaker A
и получим выручку. То есть стоимость, умноженная на количество, равно выручкой. Аа, ну тогда мы, получается, считаем выручку да?
23:28
Speaker A
И если мы выручку поделим на количество дней, да, а потом поделим аа хм ну если мы делим выручку на количество дней, мы просто получаем среднюю выручку в день, да? А если мы потом будем делить на продажи в день, то мы получим
23:59
Speaker A
среднюю стоимость ручки. Ну то есть вот я имею в виду, что у нас формула выручки такая, потом выручку делим на количество дней.
24:17
Speaker A
Это средняя, это средняя выручка за день у нас получается. Ну, если среднюю количест среднее количество среднюю выручку за день делить на количество продаж каждый день, мы будем просто получать каждый день среднее. Хотя, ну я не знаю, я пока просто вот прихожу
24:49
Speaker A
к тому, к чему пришёл в первый раз. Средняя выручка за день. Вот. Ну потому что ты делаешь лишнее, а у тебя вот формула, она уже полностью готова.
25:00
Speaker A
Угу. А написана, тебе не надо ничего дополнительного добавлять. Ну, то есть стоимость, перемноженная на количество, это вот наша выручка. А нас интересует цена одной ручки обратно, да?
25:14
Speaker A
То есть если мы всё, если мы просто скажи, пожалуйста, давай так, давай так. Новая подсказка тогда. А если ты умножаешь стоимость на количество в первой строке, что ты получаешь?
25:27
Speaker A
А я получаю 1.000. Угу. А что это является? Это выручка чего? Выручка сзади. Так, теперь, когда я тебе рассказывал про выручку, я тебе говорил, есть общая выручка, а есть выручка, как ты сейчас сказал, за день.
25:44
Speaker A
Ну да, да, да. В чём между ними разница? Ну то, что общая выручка - это выручка за день. А ну это просто сумма выручек за день.
25:53
Speaker A
Так. А, ну, соответственно, вот, то есть, ну, допустим, у нас тут, ну, 1.000, да, тут дальше, в принципе, неважно. А общая выручка - это будет сумма вот этого столбца.
26:06
Speaker A
Так. А, ну и имея общую выручку. А как стоимости? Наверное, поделить на сумму количества продаж, да?
26:21
Speaker A
Это была бы средняя стоимость за день. Так, ну о'кей, понял. Потому что если ты возьмёшь просто АВГ, просуммируешь стоимость и потом поделишь, у тебя будет большая погрешность.
26:34
Speaker A
Угу. Словно у тебя среднее бы вот можешь на примере своих трёх чисел даже рассчитать и сделать пример.
26:44
Speaker A
А у тебя будет там средняя, ну, ранняя одиннадцати там и 11-25 плюс-минус такого. Угу. А если ты сделаешь средне взвешенно, у тебя может быть отклонение около 20% вверх либо вниз.
26:59
Speaker A
Угу. Хорошо, понял. Ну на сQэле это вроде как пока не там всё по SQэлю. По SQL мне уже не надо. Там, если это будет если это будет в одно действие либо в два, мне неважно. Теперь включу я тебе
27:15
Speaker A
свою демонстрацию. Угу. Видно тебе? Да, видно, видно. Дан боевой код. Угу. Как видишь, состоит из двух цэшек и одного запроса основного. [тяжело вздыхает] Задачка найти ошибки.
27:36
Speaker A
Не хочу долго тратить время. Давай по максимум 2 минуты на на одну цестоешку. Если не находишь ошибки, говори ошибок нет. Идём дальше. Такое тоже возможно.
27:48
Speaker A
Если говоришь ошибка, говори в каком месте, и я помечаю, что там ошибка. Потом, когда заканчиваю упражнение, я тебе говорю, где ты нашёл, где нет.
27:57
Speaker A
Угу. [кашель] Так, ну я тогда вслух [откашливается] буду рассуждать вот по этой ЦТшке, по структуре.
28:05
Speaker A
Угу. А, ну, то есть как минимум from есть, а alias явно не задан, но тут есть а так потом просто из селекта это перечисление колонок идёт report dt а сегмент. Ага, ага, ага. А call scale, то есть это если значение n, то мы ноль
28:27
Speaker A
вставляем. А как de marки case? Ага. In msv. MVC when client then VIPга так end как минимум есть а так ну VR1 равно 1 просто как для откладки используется, да?
29:06
Speaker A
Тарепорт. Арепорт. Ага. Так. Ну, сегмен, ну, типа, тут какой-то такой так, ну, вроде так, бегло, если посмотреть, то в первой цешке я не вижу каких-то проблем. То есть дальше идём?
29:41
Speaker A
Да, давай на вторую. А, так. Угу. Select. Так. Так, но у нас тут как минимум используется Функция агрегация. Функция агрегации сам.
30:34
Speaker A
А, но я не вижу грубая. Угу. А с датами так, ну, вроде, вроде как всё с датами нормально. То есть через дататранк, приведение к манфу.
31:02
Speaker A
А, и вот это плюс интервалы. А, так. А вот джойн можете чуть дальше пролеснуть куда?
31:24
Speaker A
А нене, не, у меня просто из-за расширения не было видно части. Ага, всё. [откашливается] П. Так, секунду.
31:40
Speaker A
Так, меня сейчас слышно? Да. Да. Просто у меня вот подвис подвисла вкладка с демонстрацией.
31:51
Speaker A
Так, всё, всё, вроде нормально. Так, ну ага, алиас. Аас вроде задан. А так, ну, пока я только нашёл тут, что у Гроубая нет.
32:08
Speaker A
И ещё м у нас тут незакрытая скобка, где продукт не равно PPS банс. Тут не закрытая скобка.
32:28
Speaker A
Или это секунду. Нет всё так. А, ну основной запрос, а вофроме задан alias а потом джойнится.
32:52
Speaker A
А, а. Угу, угу, угу. Аа, я, может, с таким не сталкивался, но, по-моему, в джойне а в конце не пишется.
33:18
Speaker A
Так, это ошибка? Нет. Да, ошибка. Потом я бы ещё посмотрел на грануляцию. Я как бы данных не видел, но тут left. И стоит посмотреть на грануляцию, соответственно, чтобы строки не размножились, допустим, а у правой таблицы там, чтобы не
33:38
Speaker A
раздуть. Ну, это в данном случае на технику пока не влияет, да. Угу. А кажется аа у нас нету энда в кейсе, где который sдукт.
35:01
Speaker A
Угу. Аа потом также ниже это вроде как [откашливается] Нуно опять же тут используется аккаунты сам, а, но нету группировки.
35:21
Speaker A
То есть тут вот это Sun Total UB и Total UB - это Угу. не очень понятно. Это как функция типа, да? Сам тут предусмотрено, да?
35:30
Speaker A
Да. Ну, тут скобок нет. Тут нету гробая. Так, аа так. А потом я, может, никогда не сталкивался с такой конструкцией, но здесь перед фромом как-то очень странно написан.
36:21
Speaker A
То есть по идее он не в селекте. Аа, ну то есть и в принципе ВР в селекте тоже странно, но он не в селекте как минимум. Перед ним нет никакой запятой.
36:35
Speaker A
А, но ему присвоен алиас. А, я не знаю пока. Вот у меня, говорю, у меня подвисло тут всё сейчас снова, поэтому я вот вижу. Ну вот тут, где from ab results, у вот выше там вот. Всё так вроде отвисло снова. М.
36:50
Speaker A
Так, да. Я про вот это я про, да. Тогда что, помечаем этой ошибкой или нет?
36:57
Speaker A
Дада. Да, ещё. А, то есть тут вместо ВР я бы кейсвен использовал бы конструкцию.
37:12
Speaker A
А Так. Ну тут, э, получается, а нет, а в самом верхнем кейсе я просто не увидел, что там есть, но он есть, так что всё нормально.
38:00
Speaker A
Вот это убираю ошибку. Нет, нет, нет. Тут же второй кейс ещё. Тут второй кейс идёт. И вот тут как раз уже энда нет.
38:08
Speaker A
А, угу. [откашливается] Так. Сдаёшься. Ну, я вот тут ещё по запятым смотрю, тут они как-то в разноброс раскиданы. То есть вот тут сначала они идут спереди, потом их сзади пишут.
38:46
Speaker A
Угу. А, ну, в общем и целом, наверное, всё хорошо. Ну, тогда правильный ответ, Всё, ошибки все нашёл. Одну лишнюю.
39:14
Speaker A
Да какая? Там, где про скобку сказал, что скобки не было. Скобка закрывающая стояла. А, ну понял.
39:21
Speaker A
Вот. Ну, в целом хорошо. Давай я расскажу тебе про вакансию. Угу. Это у меня что демонстрация до сих пор висит что? Дада.
39:32
Speaker A
Да, я, кажется, не выключился. А вот так вот, а что предстоит делать на новом месте? Как я сказал, есть доходные сегменты, доходные каналы. Я не знаю, слышал ты или нет про эти сегменты, типа private banking, VIP, либо топ Fluent и
39:55
Speaker A
а этот МВС. Они же в Сбере отражены как Сбер первый премьер и PRкинг. Угу.
40:06
Speaker A
Вот. А суть в чём? Это, соответственно, так скажем, самые богатые, самые обеспеченные люди России. По ним строится аналитика. Ну, какого рода, соответственно, сколько денег хранят, какие доходы приносят, куда ходят, чем, какими сервисами банка пользуются, а как на них влияют запуски тех или иных
40:29
Speaker A
продуктов, а-э, как их обслуживают операционисты наши, удовлетворённость их, ээ, с точки зрения того, как они пользуются нашими сервисами. Ну, то есть в основном это будет аналитика вокруг этих клиентов.
40:44
Speaker A
Если мы говорим про регулярную операционную отчётность, то это, соответственно, основные ключевые показатели по типу остатков. Остатки - это значит на карточных счетах, вкладах и инвестчетах, а либо доходы. Доходы формируются, по сути, от этих же остатков либо операций, связанных как раз-таки с
41:08
Speaker A
инвестиционной деятельностью. И этот дальше это само, соответственно, количество этих клиентов. Ну, то есть как бы они не ушли в банки конкуренты.
41:22
Speaker A
А есть как и готовые, так и где-то требуется разработка. Соответственно, если мы говорим про доработку-разработку, то путь такой: сначала создаёшь э MVP, по принципу собрал данные по своему ручному скрипту из различных срезов и собрал уже непосредственно бийку готовую. После этого заходишь в
41:47
Speaker A
датаинженеры со своим скриптом. Он не обязательно будет у тебя прямо идеально написан. Тут нету такого прямо критичности. и ставишь им задачу на разработку датапродукта в виде витрины по принципу, как ты описывал, эти элько и они обновляют.
42:04
Speaker A
Ну вот они тебе отдают результат, ты его верифицируешь, подтверждаешь и непосредственно протягиваешь бийку. Если всё хорошо, даш работает без тебя. Ну бывают, конечно, там э техбои и надо, соответственно, заходить в инженеров, спрашивать, что случилось.
42:20
Speaker A
Вот. А-а, если мы говорим прохоки, в самих баз данданных в Сбере, ну, то есть в виде дата продуктов, под которыми ты будешь подключаться и смотреть, исследовать, э, выгрузки, очень много, э, так много, что, короче, ты их в жизни
42:35
Speaker A
никогда не запомнишь. А для этого есть, естественно, э датамаркет, в котором можно найти что-то.
42:46
Speaker A
Но, как правило, ты заходишь в какую-то продуктовую команду, спрашиваешь того, кто там работает, что мне можно взять, чтобы вот выполнить такую-то задачу.
42:54
Speaker A
Примерно принцип такой. Угу. И дальше выполняешь свойхок, который может быть связан там, ну, например, если кто-то умирает там, например, из доходного сегмента, ну неважно, тут, кстати, уже будет даже, может быть, не доходный сегмент, просто, допустим, умирает основной держатель
43:10
Speaker A
остатков и, допустим, в какой момент его остатки полностью родственники забирают по принципу наследия. Вот. А, ну для этой задачи, например, вот мы не знаем, как размечаются родственники наследников.
43:25
Speaker A
Вот. А, и для этого там идём, соответственно, в другую команду, которая занимаются родственными связями. И там непосредственно спрашиваем, как разметить таких клиентов, чтобы по ним посмотреть, как они приходят, забирают.
43:38
Speaker A
Вот это тебе один из кейсов. Таких кейсов бывает разное. Множество задачи бывают разные. Могут быть простохок выгрузка по принципу выгрузимы датасет в виде сводной таблицы и отдайку.
43:54
Speaker A
Бывают выгрузки в виде исследования. Если мы говорим про исследование, где идёт долгая какая-то раскопка, то она может там тянуться месяц, может тянуться полтора. Почему? Потому что ты сначала выгрузишь один датасет, его покрутят, покажут на какой-то первичной, так скажем, прогонной презентации, тебе
44:11
Speaker A
могут накидать идеи либо там дополнительные задачи с точки зрения того, что дополнительно повыгружать, посмотреть. Соответственно, дальше это будет в какие-то дополнительные выводы выливаться.
44:23
Speaker A
Ну например насколько вот, допустим, у нас была база клиентов 1.000, да, там в прайтбнкинге стало 2.000. Что произошло с экономикой этого канала? Стали ли мы хуже себя чувствовать в банке с точки зрения того, что у нас косты по этим клиентам выросли
44:42
Speaker A
или нет, или же у нас выросли только доходы? Ну и, естественно, ты на эти ответы начинаешь копать все базы данных, всё поднимать вообще всю подноготную, выкапывать вообще все датасеты, которые только возможно, в частности управленческие кубы. Это про PL, это про
44:58
Speaker A
опедог, это про опексы и всё остальное с этим связано. И какие-то просто бизнесовые таблицы, где в которых будет просто разметка этих клиентов и какой банкир их обслуживает.
45:11
Speaker A
Вот. Ну и дальше это будет переливаться у тебя в презентацию, которая будет уже верифицирована как с штабом B2C, то есть у нас штаб CX, есть штаб B2C, есть ещё а департамент финансов и департамент инвестиционной экспертизы.
45:31
Speaker A
Соответственно, консолидируются все команды, встречаются, ты там показываешь, что ты там нарыл, там, допустим, какие-то задачи они сами возьмут себе в проработку, а какие-то с тобой обсудят, чтобы ты у себя поселектил, добавил свою выгрузку. Ну, например, там они тебе дадут условно
45:46
Speaker A
свою готовую витрину по этим по опексам, ну, по клиентам. это операционные расходы, либо э-э ну э-э могут быть они, соответственно, приземлены на одного клиента.
46:03
Speaker A
Посмотреть, что происходит с экономикой на одного на бизнес-юнит экономикой на одного, получается, где юнит - это один клиент. Вот. А-а, ну и соответственно дальше это, когда полностью будет подтверждено верифицировано может пойти уже на высшее руководство. Ну, типа, как я не знаю, в курсе ли ты про
46:22
Speaker A
первых зампредов, э, Германа Оскаровича, либо там его, так скажем, э, вице-президентов. Ну, в общем, и целом, короче, туда это на эти слои, так скажем, руководства может это исследование перейти. Поэтому важно как минимум перепроверять свои датасеты, чтобы они были корректные.
46:42
Speaker A
Естественно, тут будут все смотреть на твои датасеты, и кто-то может задаться вопросом: "А корректно ли ты выгрузил?
46:47
Speaker A
Дай мне, пожалуйста, скрипты. Я посмотрю, и ты, соответственно, передашь ему скрипт, и он тебе там проверит. А вдруг это, соответственно, с такого кейса не произойдёт. Важно самому всё перепроверять. Да, на первых порах буду я тоже контролировать, смотреть ээ на
47:01
Speaker A
качество того, что ты отдаёшь. Я на тех задачах, которых тебя буду погружать, если, соответственно, когда-то сам уже стартовал и знаю, что должно быть на выходе. Естественно, если ты там получишь что-то другое, я задам тебе вопрос, почему у тебя здесь такая цифра.
47:14
Speaker A
Угугу. Вот поэтому тут на первых порах переживать не стоит за этот счёт. С точки зрения рутинности и, э, так скажем а скучности.
47:26
Speaker A
У нас, как я сказал, из-за того, что есть много кругов согласования, есть определённый уровень эго мы называем это налог, скажем так, это как это бюрократия правильно называется, [фыркает] бюрократической работы. То есть, э-э, пока ты со всеми сходишь, повстречаешься, пока найдёшь людей, кото
47:49
Speaker A
с которыми надо согласовать, ты на это можешь потратить некоторое время. Ну, как некоторое, например, в летний период в основном все в отпусках.
47:56
Speaker A
Соответственно, чтобы всё согласовать, может уйти 2 недели, потому что пока там один в отпуске, другой в отпуске, ты будешь свою встречу передвигать, пока там к одному сходишь, кто скажет: "А это было не ко мне, надо поставить с другим
48:06
Speaker A
человеком встречу". Ну, соответственно, вот эта вот история, э, тягомотины может затянуться. Тут вопрос уже будет к тебе сам, готов ли ты это принимать или нет? Ну, такова реальность у нас. Это это почти в каждом банке. Так.
48:19
Speaker A
Угу. Единственное исключение - это, соответственно банки-стартаперы в которых только процессы строятся и всё там на хаосе. Вот. Но в основном банки выстроены по методологии, по каким-то дорожным картам готовым. Соответственно, тебе необходимо эти дорожные карты соблюдать. Угу.
48:36
Speaker A
Вот. А-а, дальше, э, операционка примерно, наверное, процентов 30. 20 - это дэши, э, которые будут, э, получается доработка либо разработка.
48:54
Speaker A
Процентов 30 - этоховая задача. То есть непосредственно летит задача от руководства, и тебе надо там в определённые сроки её соблюсти.
49:06
Speaker A
Ну и остальное - это, соответственно, общение с заказчиками либо постановка задач инженер. То есть, грубо говоря, 3030 эток и операционка.
49:18
Speaker A
Ну, операционка просто бывает какого рода? Она бывает какого-то объёмного, да, и тут нужны, так скажем, ресурсы и инициатива от тебя, как эту операционку можно оптимизировать и автоматизировать. Тогда её у тебя по проценту станет меньше.
49:33
Speaker A
Либо просто живи с этим и, так скажем, терпи. Вот. Если есть идеи, то, конечно, всё пожалуйста приходи давай обсуждать и планировать эту задачу по операционке, чтобы её стало меньше, будет больше времени на исследование на Тхоке.
49:50
Speaker A
Вот по поводу стека технического, как я уже говорил, у нас Greenplan плюс. В гн есть также ещё клиckхаус и клиckстрим.
50:03
Speaker A
Кликстрим он по сути там подключение такое же как гринпламу, но некоторые залазят через ходуп, соответственно, и так, и так, пожалуйста, но он работает очень медленно. А с точки зрения ГП и Хадупа, как я уже сказал, там витрины данных плюс-минус
50:25
Speaker A
одинаковые. Они, как правило, дублируются, что туда, что туда. Зачем это сделано? Ну, кто-то пишет только на SQэле, кто-то пишет на Питоне и плюс SQэле. Соответственно, если тебе удобно писать на Питоне через SPй Park, ты можешь, как я сказал, залезть в ходу
50:41
Speaker A
написать, ээ, как собрать тебе датасет и потом уже крутить его в ходупели. Ну, либо выгрузить уже готовый датасет непосредственно в Excel. Вот вопрос.
50:52
Speaker A
Хм, ну, в принципе, мне так всё понятно. В общем и целом, поэтому вопросов особо нет.
50:59
Speaker A
Единственное, это можешь такой между нами вопрос: "А как вообще аналитиком в Сбере работаете?" Потому что я что-то статьи читал, да, там прямо у Сберов там прям вообще именно в отделе аналитики так прямо всё плохо. Там никто идти к
51:12
Speaker A
вам не хочет, что такое. Ну, смотри, ну если бы никто не хотел идти, то тогда бы аналитиков у нас не было. Ну да.
51:20
Speaker A
Э поэтому кажется, что статья какая-то желтоватая немножко с точки зрения, как это вообще работает.
51:28
Speaker A
Ну, есть, естественно, периоды пика, когда загрузка прим жёсткая, и, скажем так, можно перегреться. А, например, вот у нас есть периоды бизнес-плана и полугодовой корректировки. Полгодовая у нас сейчас идёт.
51:45
Speaker A
А-а, что для этого может от тебя потребоваться? И, возможно, ты будешь тут тоже под с такой, скажем, напряжёнкой.
51:55
Speaker A
будут лететь очень многие хоки там либо дополнительно какие-то небольшие выгрузки по типу, что происходит с клиентом, чтобы заложить это в бизнес-план, и сроки будут, ну, выполнимые, но и, скажем так, стрессовать будешь по поводу того, что, э, они ограничены очень сильно,
52:18
Speaker A
мягко выражаясь. Вот. А второй момент - это с точки зрения отхоков. Как я сказал, они могут быть просто выгрузкой. И тут твоё отношение самого как к такому, что типа, допустим, придут, скажут: "Вот, выгрузи мне там три поля, в эксельку прокинь и отдай". И
52:36
Speaker A
это надо отдать руководству. Ну, то есть условно это не самая интеллектуальная выгрузка, но такие задачи там пару процентов на них тоже выделяется.
52:47
Speaker A
Вот. А с точки зрения там функционала нет. Э, у нас функционал используется такой же, как на рынке, поэтому тут деградации какой-то есть. Та в таком ключе ты спросил. Такого нет. А-э, плане там каких-то допний, ну, как минимум ты будешь знать финансовую
53:06
Speaker A
отчётность плюс ээ банковские продукты и продукты экосистемы. Угу. То есть, если там, допустим, мы говорим про расширение кругозора в плане того, как люди там пользуются звуком, который конкурент Яндекс-музыки, либо око, которое конкурентки на поиску, то ты сможе, допустим, в каких-то задачах
53:31
Speaker A
можешь это встретить и там поуглубляться поизучать. Угу. Если тебе это интересно. Вот. Но в самом простом выражении, конечно, от тебя требуются цифры, если мы так упрощаем. Ну, в любом случае от аналитика требуются цифры и выводы. И, естественно, то тут ээ
53:50
Speaker A
если откинуть всё в сторону, садишься в базу данных, занырнул, выгрузил, отдал. Вот примерно такой подход. Вот. Я не могу сказать, что где-то на рынке, а он отличается.
54:00
Speaker A
Угу. Так, ну, понял, понял. Ну, тогда, в принципе, всё. У меня больше вопросов никаких нет.
54:06
Speaker A
С точки зрения того, где располагается офис и что у нас офисная работа, тебе об этом HR рассказывал? вечер рассказывал.
54:13
Speaker A
Да, мы у нас есть, что мы пытаемся выбить пилот по поводу гибрида для аналитиков, [тяжело вздыхает] потому что вот именно из-за гибрида, как правило, к нам и не особо хотят идти.
54:29
Speaker A
Вот если уж говорить откровенно, вот мы основная проблема просто с тем, что чувствительные данные используется, но вот какие-то периодические сдвиги в этом плане на пилот идут, чтобы ноутбук подрубался непосредственно к стационарному компу и дальше уже обрабатывать данные. Угу.
54:47
Speaker A
Не знаю, в этом году получится или нет. Какие-то попытки были, но пока у меня обратной связи по этой теме ещё нет.
54:56
Speaker A
Угу. Понял, понял. Если вопросов больше нет, то можем разойтись. Спасибо тебе за встречу. Было приятно познакомиться. Довольно-таки неплохой у тебя бэкграунд. Вот. Э по поводу обратной связи направлю через А вот по поводу этапов я тебе не рассказал. Я сейчас заканчиваю. Сегодня,
55:17
Speaker A
может быть, в понедельник ещё какие-то собисы будут, я их заканчиваю. Дальше, соответственно, если всё ок, то а этот эсбэшка и непосредственно офер Угу.
55:28
Speaker A
для финалиста. Возможно приглашу познакомиться в офис во время СБ. Ну это просто будет условно получасовая встреча, чтобы пообщаться лично, посмотреть друг на друга. Если вдруг какие-то вопросы дополнительные возникнут, научной встречи взять, обсудить. Возможно, они потребуются. И тут уже сам как бы СБ прошёл, офер
55:47
Speaker A
получил, решай, выходишь, не выходишь. Угу. Хорошо. Вот. А, и момент тоже, который важный, учитывая, что а-а SQL, так скажем, по технике у тебя всё неплохо, но по бизнесовой части будет немножко ну, вообще я всем кандидатам говорю, что когда вы приходите ко мне на работу, то
56:09
Speaker A
важно будет самостоятельное э решение каких-то проблем. То есть, да, понятно, есть какие-то общие проблемы там организационные, когда надо ко мне прийти и задавать вопросы, а есть какие-то, допустим, найти витрину данных, и мы знаем, допустим, к кому обратиться. Это не значит, что надо на
56:29
Speaker A
каждый такой вопрос приходить ко мне и, э, допустим, пытаться через меня находить источники, чтобы вам какую-то задачу выполнить. Где-то можно и самому что-то взять. Там, например, есть витрина, есть у неё владелец, можно ему сразу, например, написать. Не обязательно заходить через меня,
56:45
Speaker A
спрашивайте, а как мне кому-то написать? То есть я разо условно показал, как найти источник. Дальше можно и самому.
56:50
Speaker A
Вот порядок работы примерно такой есть вдруг что. Вот, чтобы не было потом неожиданности, что что происходит, я ничего не понимаю.
57:01
Speaker A
Вот. Э, и маленький момент у нас, соответственно, возможно в где-то я видел в ба, как в банке Сбербанке э, есть одна проблема с тем, что когда приходишь только на работу, первую неделю, не понимаешь, чем что тебе делать, ты находишься просто в ожидании,
57:19
Speaker A
пока тебе доступ все согласуют. Ну, я слышал во многом во многихтехах, там в том же Яндексе.
57:26
Speaker A
Вот поэтому это будет, но за это время можно, соответственно, закрыть всю там основную там, скажем так, обучалку и потом уже начинать спокойно работать и выполнять задачи.
57:41
Speaker A
Угугу. Вот и всё. Теперь точно всё. Всё понял. Ну всё, тогда хорошего. Спасибо. Тебе тоже пока.
57:49
Speaker A
Пока. Кажется. Кажется, что отмечается. знаешь что, что показал? M.
Topics:собеседованиеаналитика данныхСберPythonSQLBIдашбордыA/B тестированиепродуктовая аналитикакарьерный рост

Frequently Asked Questions

Как кандидат автоматизирует обновление дашбордов?

Кандидат создаёт дашборды на основе готовых витрин данных, которые обновляются автоматически с помощью инструментов оркестрации данных, таких как Airflow, за что отвечают дата-инженеры.

Почему кандидат решил сменить место работы?

Основная причина — семейные обстоятельства, требовавшие разъездов, которые теперь завершились, а также профессиональный застой и однотипные задачи на предыдущем месте.

Какие технические навыки выделяются у кандидата?

Кандидат обладает навыками работы с Python (Pandas, NumPy, Scikit-learn), SQL (ClickHouse, Greenplum), BI-системами (Яндекс DataLens), а также опытом проведения A/B тестов и построения аналитических моделей.

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

Or transcribe another YouTube video here →