Подкаст «Go учиться!» | Forbes Education

Поиск оптимального ответа: как работает и зачем нужен искусственный интеллект

Запись подкаста «Go учиться!». Гость – Михаил Неверов, директор по анализу данных Х5 Tech

В этом выпуске подкаста «Go учиться!» говорим о высоких технологиях. Теперь в фокусе искусственный интеллект. Как он проник в большинство сфер нашей жизни и почему его работа так незаметна?

Часть основных концепций работы искусственного интеллекта (ИИ) была придумана еще в середине прошлого века. Но воплотились они относительно недавно, когда появились мощности для обработки больших массивов данных, а также стала внедряться работа с Big Data. При этом сам термин «искусственный интеллект» для многих все еще остается чем-то из области научной фантастики: разговор о нем часто неминуемо приводит к рассуждениям об опасностях, которые технологии несут человечеству. Однако на деле искусственный интеллект активно применяют во многих отраслях: промышленности, медицине, ретейле, образовании и так далее.

С помощью искусственного интеллекта, например, работают программы навигации, проводятся хирургические операции. ИИ даже умеет рассчитывать, какие товары должны оказаться на полках магазина в определенном районе и как именно их необходимо разложить.

На что еще способен ИИ? Как научиться управлять такой неоднозначной технологией? И почему в эту сферу можно прийти из смежных отраслей?

Выясняем у директора по анализу данных Х5 Tech Михаила Неверова.

Расскажите, откуда вы начинали и как добрались до нынешней должности?

Изначально я пришел в компанию развивать продукты. Все, с чем я работал, так или иначе, было связано с большими данными. Но опыт взаимодействия с большим массивом данных у меня был и до этого. Я работал и в венчурном фонде, и в крупной FMCG-компании [FMCG – товары повседневного спроса – прим. ред.]. Все мы сталкиваемся как минимум с Excel, хоть это и небольшие данные, но мы постоянно с ними работаем.

Работа продакт-менеджера связана с аналитикой, с изучением паттернов поведения и так далее. Если вы работаете с очень большим B2C-продуктом, например, сайтом для знакомств или приложением, посвященным электронной коммерции, у вас в любом случае возникнет потребность общаться с аналитиками. Это люди, которые сильно лучше вас понимают математику и как устроена работа с данными. Вы тоже будете вынуждены в эту историю погружаться просто для того, чтобы задавать правильные вопросы, и понимать, можно ли на них вообще получить ответы. Вот такая длинная вводная.

Мы запустили большую, и, наверное, одну из первых крупных экосистем для ритейла в России, «Диалог» – это серия из четырех продуктов, завязанных на анализе данных. У нас команда аналитиков, наверное, в какой-то момент была больше, чем команда разработки, потому что это центральный продукт. И основная польза для конечного потребителя заключалась в вещах, связанных с данными, со знанием, которое вы из них извлекаете. Возьмем самый простой пример. Допустим, вы продаете творожные сырки в магазинах. В какой-то момент вы понимаете, что продажи упали. Вы это видите наглядным образом: меньше заказывают, меньше отгрузка. С помощью нашей платформы вы можете понять, что дальше произошло с точки зрения уже потребителя, то есть он в принципе перестал покупать сырки, он вместо сырков ваших стал покупать какие-то другие, или все сырки стали проседать. Это та аналитика, которая помогает вам принимать решения. Дальнейшие продукты были построены как раз вокруг этих знаний о наших пользователях. И снова пришлось больше взаимодействовать как с командой, связанной непосредственно с аналитикой, так и с командой, которая занимается архитектурой данных, потому что у X5 Retail Group несколько петабайт [единица измерения, равная квадриллиону байт – прим. ред.] данных о клиенте.

Так возникает большое количество проблем. Обычно всеми любимый Excel работает со всем объемом данных, но когда у вас их очень много, вы можете оперировать только их ограниченным количеством. Вам нужно из огромного Data Lake, хранилища, их извлечь, с ними что-то сделать, чтобы эти данные были пригодны для работы, и после этого на них уже выстраивать аналитику. Так вот, проблема заключается не только в том, чтобы извлечь их, но и держать готовыми. Этим всем занимается команда ETL [буквально «извлечение, преобразование, загрузка», то есть управление хранилищами данных – прим. ред.], связанная с инженерией данных, то есть и с этими командами тоже приходилось много взаимодействовать.

После того как мы триумфально анонсировали «Диалог», произошел мой переход в команду, связанную уже напрямую с аналитикой. Здесь нельзя сказать, что я сидел-сидел, прочитал две книжки и переквалифицировался. К сожалению, так не получилось. Я в предыдущий раз попытался так поменять работу, но не вышло, просто книжек не хватило.

Это было скорее эволюционное движение, чем революционное. Довольно длительное, которое началось еще до того, как я вообще пришел в X5 Retail Group. Наверное, первая моя большая работа с аналитиками произошла, когда я работал в венчурном фонде. Там были большие, высоконагруженные В2С-продукты, которые всегда опираются на аналитику, на поведенческие паттерны и так далее.

Как здесь появился искусственный интеллект? Это просто как бы стало логичным продолжением аналитики?

Это очень хороший вопрос. Давайте сначала тогда определимся, что такое искусственный интеллект. ИИ – это очень большая область знаний. Когда мы говорим про искусственный интеллект, мы подразумеваем какие-то алгоритмы, связанные с машинным обучением. Забегая вперед, можно сказать, что нейросети и машинное обучение – это просто один из способов работы с данными и решения прикладных задач, если мы не говорим про совсем глубокие научные изыскания. Хотя та же самая фундаментальная наука потом реализовывается в практике. То есть это просто способ сделать так, чтобы человек не делал то, что хорошо делает автомобиль.

Для примера давайте возьмем элементарный алгоритм. Вы хотите купить проектор. Есть определенный набор требований. Вы для себя решаете: «Я хочу купить проектор, который должен стоить от стольких-то до стольких-то, он должен соответствовать таким-то характеристикам, пользоваться им планирую 10 лет, и купить его хочу на сайте объявлений б/у товаров». Таким образом вы создали некий набор установок. Дальше вы начинаете этот сайт мониторить. «Ага, тут повыше цена, но он в лучшем состоянии, здесь дешевле, но состояние и комплектация отличается». Вот такие задачи проще решать с помощью машины. Вы фактически программируете машину.

При определенном усложнении этого паттерна, но с той же логикой, можно говорить, что вы сделали искусственный интеллект, который занимается покупкой этих самых проекторов. Все остальное, то есть различные сложные способы принятия решения, например, Random Forest, применяется для решения все той же задачи.

В какой-то момент вы понимаете, что у вас очень большой объем данных, и вам нужно принять решение, как будут вести себя ваши потребители, если они придут и не будет любимого вина на полке. Нужно найти ответ на вполне прикладной вопрос: что нам поставить на полку, если какой-то продукт выбывает? Для этого вы начинаете просто использовать эти алгоритмы. Они могут усложниться, но нет такого, что начало использования искусственного интеллекта чем-то выделяется.

Все сильно зависит от того, что происходит вокруг, какую прикладную задачу вы решаете. Но в общем и целом – это поиск оптимального ответа в ситуации, когда человек справится явно хуже, чем машина. Есть достаточно большое количество, например, медицинских стартапов, которые применяют искусственный интеллект, но пока нет ни одного успешного, который бы заменил, условно, терапевта, просто потому что к нему приходит огромное количество людей, и они по-разному формируют свои жалобы. Большой объем разных вводных как раз лучше обрабатывает человек. Плюс люди могут обманывать, специально или не специально. Это тоже нужно учитывать.

В ситуации, когда мы используем обезличенную информацию, очищенную от большого количества переменных, машина справится сильно лучше человека. Например, если нужно по снимку с помощью нейронных сетей найти какие-то потемнения в легких. Машина не устает, она умеет постоянно повторять с предсказуемым результатом одно и то же действие. Она может обратить внимание на паттерн, который врач просто в силу отсутствия опыта не может сделать.

Возьмем в пример тот же медтех. Мы понимаем, что если у человека есть в легочной альвеоле потемнение, то с высокой долей вероятности он чем-то заболеет. В рамках одного специалиста это выяснить очень тяжело. Обычно нужно, чтобы люди собрались, всю информацию каким-то образом обработали и вместе пришли к выводу. Машина просто может найти этот паттерн, когда ей не задают даже вопрос. Она сама для себя принимает решение: «вот у меня есть причина, а есть следствие». Если совсем упрощать, то это работает так.

Соответственно, искусственный интеллект может принять оптимальное решение в заданных параметрах, он может запомнить оптимальное решение и постоянно искать вещи, которые ему помогли, но не может выйти за рамки первоначально поставленной задачи, и он не может придумать что-то новое. Это мы уже сейчас в область философии уходим, но есть такой термин, как сильный искусственный интеллект, он тоже достаточно спорный. Это ситуация, когда машина может самостоятельно поставить себе задачу, самостоятельно оценить новое для себя решение и обучаться дальше. Например, когда машина придумывает тот цвет, которого не сделал еще человек.

Над чем вы работаете сейчас?

Фундаментально ритейл, в котором я работаю, не изменился с того момента, как торговля появилась как вид. Это огромное количество продавцов, они продают товары, и цена зависит от важности для покупателя этого товара, от его редкости и от накладных расходов. Мы играем в ту же самую игру. Нужно что-то где-то купить, желательно дешево и много, привезти это ближе к людям, продать максимально мелкими и получить максимальную выгоду. Это все прикладные и понятные задачи. Для ритейла важны прогнозирование спроса, работа с ассортиментом, с географией, то есть где мы что продаем, где лучше открывать магазин, а где хуже, и все, что связано с управлением ценой. Можно еще промоушен сюда включить. Это все базовые вещи, вокруг которых строится наша основная работа. Это менее интересно, чем разворачивать компьютерное зрение в магазинах или ставить кассы самообслуживания с биометрией. Но с точки зрения cost/income, то есть того, сколько вы вложили и сколько получили из бизнеса, это основное, чем мы занимаемся.

Как вы прогнозируете, где открыть магазин? За счет каких переменных это высчитывается?

Их очень много. Основная – как много людей живет в том или ином районе, какой там уровень среднего дохода. Из этого мы уже понимаем, какая у нас ожидаемая маржинальность и, условно, какой процент должен быть дорогих вин. Если мы открываемся где-то рядом с дачным поселком, у нас будет один ассортимент, а если в центре Москвы, то немножко другой. В каких-то местах он вообще не будет сильно различаться, потому что молоко, хлеб, яйца, бананы есть везде, но вот набор тех же вин – разный. На самом деле, там чуть больше учитывается факторов, но основные переменные – такие.

Дальше начинается понятная, простая работа: ты, с одной стороны, пытаешься предсказать, где будет хорошо, с другой стороны, ты используешь знания, которые у тебя уже есть, для того, чтобы понять, что такое хорошо и чего вы ждете.

Как вам кажется, как в будущем может применяться искусственный интеллект?

В ближайшем будущем, мне кажется, постепенно войдут в нашу жизнь метавселенные. Сейчас это очень популярно, туда идут деньги. А мы понимаем, что любые исследования состоят из двух вещей: можно ли на этом заработать, и готовы ли мы с точки зрения технологий. Тот же самый перцептрон [разработанная в 1958 году модель восприятия информации мозгом – прим. ред.], на основе которого сформулирована концепция нейросетей, это были 60-70-е годы прошлого века. Все достаточно давно было описано – логика принятия решений, почему да как это устроено. Но стало популярно в последние полтора десятка лет просто потому, что вычислительные мощности стали доступны. Для метавселенных у нас это есть, мы с этим будем много сталкиваться.

Второе, что скоро случится, это генеративный контент. Различные картинки, музыка, какие-то совмещения фотографий – сейчас же популярны сервисы, которые позволяют совместить две картинки или по текстовому описанию эту картинку получить. Это достаточно легко, наглядно, понятно, как этим пользоваться, и не требует отдельного регулирования. Уже сейчас можно сделать презентацию, заменив все иллюстрации сгенерированными. В одной из последних версий PowerPoint была добавлена возможность, когда вы просто набрасываете фотографии, и вам предлагается несколько вариантов, как их разместить.

Автопилоты еще. Технически мы были достаточно давно готовы к автопилотам – в плане скорости роста технологий, но активно стали их применять только в последнее время. По-моему, сейчас где-то в Соединенных Штатах Америки есть так называемый полный автопилот. Но есть вопросы у законодательства: если машина ошибется и что-то пойдет не так, кто будет виноват? В московских автопилотах всегда сидит человек. Его задача – в случае чего схватить руль, выкрутить, нажать на тормоз. Эта технология требует регуляции, законодательного вмешательства.

С точки зрения замены человека для принятия решений и впоследствии его отстранения от этого занятия, возможно, в каких-то областях оно будет возможно, и то в любом случае будет «рубильник». Где-то я читал новость, что люди пытались сделать робота-чиновника или нейросеть для принятия решений. Но это пока эксперименты, потому что мир слишком сложный. Люди не всегда поступают рационально, откровенно говоря, чаще даже нерационально. Все мы знаем историю про детекторы лжи, полиграф. И до сих пор продолжаются разработки паттернов, которые будут более точно определять, говорит человек правду или нет. Более того, пока даже нет единого мнения в научном сообществе, насколько это хорошо работает, потому что люди очень разные, они по-разному реагируют. Вам могут сказать название города, вы отреагируете, а у вас он связан с какими-то воспоминаниями. Машина посчитает, что у вас есть какой-то эмоциональный всплеск.

Как коллеги с узкой специализацией, которыми вы руководите, вас воспринимают? Как человека, который пришел руководить ими извне? Как вы находите с ними общий язык, есть ли вообще эта проблема? Или в направлении Big Data и искусственного интеллекта нет проблемы с тем, кто какой ВУЗ закончил, кто какую специальность получил, где кто работал? С другой стороны, как вы видите идеальную образовательную траекторию для человека, который хочет работать в сфере искусственного интеллекта и в больших данных?

Мне нравится думать, что у нас нет никаких проблем с командой, потому что я никогда не говорил, что являюсь техническим специалистом. Если представить это в декорациях сериала «Доктор Хаус», то я, наверное, главврач больницы, а «докторы Хаусы» у меня в подчинении. Моя роль – организация процесса, извлечение максимальной пользы для бизнеса, для компании в происходящем. Это умение в каких-то ситуациях сформулировать правильно задачу, не техническую, а бизнес-задачу. И все, что связано с классическим менеджментом, тоже присутствует. Когда мы начинали работать в этой конфигурации, ровно об этом мы и договаривались. Я буду очень рад, если меня в какие-то команды возьмут джуном работать с моим уровнем знаний. Все мои ребята сильно глубже меня в техническом плане. У меня классическая Т-образная модель: есть смежные знания, потому что я изначально занимался продакт-менеджментом, который вынуждает тебя быть в каких-то ситуациях профессиональным дилетантом. Я могу написать запрос SQL, нарисовать интерфейс, в Jupiter что-нибудь написать – все это будет очень сильно на «тройку», но я могу это сделать. Еще могу обсудить задачу с бизнесом, с инженером, с дизайнером. И дальше все просто перешло на уровень выше, то есть мы теперь обсуждаем с коммерческим департаментом какие-то цели, я понимаю, что нужно сделать департаменту маркетинга, и так далее. В этом моя основная польза.

Происходит симбиоз: я закрываю какую-то зону компетенций, которой просто нет, не потому что люди где-то хуже или лучше, а просто потому что бо́льшую часть своего времени они потратили на изучение как раз фундаментальных вещей. Так строится взаимодействие.

У меня, естественно, был дикий синдром самозванца первые два месяца, потому что предыдущий руководитель был потрясающим специалистом именно с точки зрения инженерной части. Но в какой-то момент нас стало сильно больше, и потребовалось именно менеджерская роль. Нужно было все это разделить на понятные структурные единицы, интегрировать с финансовой частью, сделать из отличного пиратского корабля галеон флота ее величества. Управляемость, предсказуемость, и, ожидаемый результат в ожидаемое время – это были мои основные задачи.

Ровно об этом мы с командой и договаривались. У нас очень высокая автономность руководителей управлений – и с точки зрения инженерной части, и с точки зрения принятия решений о найме. Я могу сказать: «Ребята, нужно автоматизировать найм, давайте подумаем, что мы с этим можем сделать». И вот мы думаем, делаем систему, которая позволяет очень быстро собеседовать junior-специалистов. У нас есть прям система, которая генерирует задачки. Я не знаю, насколько хороши эти задачки, это уже коллегиальное мнение людей, которые имеют гораздо больше знаний. Но я получаю нужный результат – мы гораздо быстрее собеседуем junior-специалистов, у меня меньше люди этим занимаются. Вот так построена наша работа.

Как вы видите идеальный путь в профессию через образование?

Если человек имеет желание работать в сфере, связанной с большими данными, то, заканчивая или ещё поступая в ВУЗ, он не до конца понимает, как будет выглядеть мир, в котором он окажется. Когда мы поступали, страна сильно изменилась, как и сама отрасль. Сейчас будет то же самое, это регулярно происходит. Таково мое личное мнение, но я здесь неспециалист, я первый раз живу.

Я бы использовал какое-то фундаментальное образование – физика, математика, где это возможно, Computer Science, прикладная математика, информатика – все, что связано с фундаментальными знаниями, сверху которых можно достраивать. Если вы шесть лет не учили теорию вероятности, статистику, вы вряд ли сможете хорошо организовывать и проводить глубинные исследования, связанные с математикой. Вот выучить Python можно достаточно быстро. Но выучить его – это то же самое, что научиться работать в Figma, просто дольше. Что делать этой Figm’ой или Python’ом – вопрос все равно остается. Вы либо понимаете, для чего его применять, и тогда говорите: «Я буду заниматься разработкой» – тогда вам большие данные не очень как бы и нужны, потому что вы, условно, делаете сайты. Это история с ядром, с пониманием, как устроены процессы, то есть фундаментальная наука. Поэтому я бы, наверное, начинал с этого.

Говоря о точке входа в профессию, нужно тоже понимать, куда ты хочешь попасть как с точки зрения отрасли, так и с точки зрения роли. Есть классический треугольник: одна сторона связана с инженерией, другая – с математикой, а третья - с бизнесом. Ты можешь быть неплох в математике, хорошо понимать, как устроен бизнес. Очевидно, что тогда ты будешь неплохим дата-аналитиком, и когда тебе скажут: «Посчитай нам RTO [показатель допустимого времени для восстановления данных – прим. ред.]» или какой-то другой бизнес-показатель, продуктовый показатель, ты будешь в этом хорошо ориентироваться. Но когда тебе нужно будет настраивать процесс поднятия данных, перелив их на какую-то витрину, в таблицы, чтобы ты мог этим пользоваться, у тебя компетенций не хватит. Тут нужны люди, которые связаны с инженерией данных, то есть немного другая роль.

Еще есть отрасль. Понятно, что в медицине, в финансах и в ритейле будут разные требования к людям. У нас сейчас в X5 Retail Group есть кафедра промышленного анализа данных в ритейле в МФТИ, где мы готовим специалистов, которые максимально быстро включатся в наши задачи. Но если выпускников этой магистратуры отправить не в ритейл, а в какой-нибудь биотех, то лучше взять людей с улицы, говоря про начальные позиции, либо сильно дорабатывать опыт людей для того, чтобы они погрузились в продуктивную работу, потому что на кафедре мы формулируем те задачи, которые решаем в повседневной жизни.

Роль влияния отрасли будет усиливаться. Этот путь уже прошла разработка. Долгое время у нас был просто разработчик, который делал все: мог принтер перезагрузить, сайт собрать. Потом произошло разделение труда. С одной стороны, упрощение задач, и не нужно разбираться во всем, потому что есть готовые библиотеки, готовые решения, есть люди, которые кусок этой цепочки раньше или позже уже обработали, и ты можешь просто взять и использовать их решение. Такая же вещь будет происходить – и уже потихонечку происходит – во всем, что связано с большими данными. Понимание того, как в целом устроена отрасль, в которой ты работаешь, что в ней лучше подойдет, будет все больше и больше цениться.

Возможно ли гуманитарию прийти на эти позиции? С учетом того, как углубляется область знания сейчас?

Зависит от позиции и конкретной ситуации. Если вы, например, приходите в НИИ, закончив журфак или философский факультет, то вряд ли сможете решать какие-то фундаментальные задачи. Но заниматься имплементацией можно. Например, вы разработали какое-то промышленное решение, у вас есть хороший опыт в работе сталелитейных заводов, вы понимаете, как они устроены, и где там узкие места в процессе, где точно нужно прикладывать знания, то в эту ситуацию вы вплетаетесь достаточно хорошо. Зависит от того, какую проблему вы решаете, какими инструментами планируете это делать, какова ваша роль. Если мы просто говорим: «Знаете, я работал барменом, выучил Python», то понятно, что придется заходить на позицию junior-специалиста со всеми вытекающими, то есть у тебя будет наставник, ты будешь решать задачи, страдать, потому что так принято в IT, это обязательное условие. Но если ты приходишь в стартап, который занимается разработкой, например, системы для управления баром, то есть какой у тебя должен быть алкоголь, где он должен стоять, насколько часто используется, какой чем можно заменять в коктейлях, то ты с со своим набором знаний будешь гораздо ценнее. Спустя какое-то время, когда у вас появится очень много данных, возможно, вы заведете отдельного специалиста по анализу данных, и он уже на тебя будет смотреть, ты будешь для него источником информации, кладезем знаний. Вот тут твой Python уже станет другой переменной в этой связке.

Все зависит от ситуации, от проблемы, которую вы решаете. Если мы возьмем выхолощенную историю, очевидно: чтобы стать хорошим разработчиком, нужно иметь хорошее образование, хорошую память, усидчивость и много упражняться. Но жизнь устроена немножко сложнее.

Блиц

Легко ли работать с искусственным интеллектом?
Наверное, легче, чем без него.

ИИ работает 24/7, а вы?
А я нет. У меня есть определенная нагрузка, которая состоит из вещей, связанных с моей обычной деятельностью, и есть нагрузка, связанная с моим обучением, которое постоянно идет, не прекращается. Я учу английский, пытаюсь до конца добить Python. Недавно перепроходил историю с SQL, чтобы ничего не забыть, до этого я рисовал интерфейсы. Это я делаю, чтобы быть в тонусе, потому что если ты прекращаешь что-то делать руками, твоя ценность резко снижается, ведь ты уже не можешь просто взять и набросать интерфейс или написать простой запрос. Даже если ты это не делал достаточно долго, все равно эти знания должны быть свежими. И есть обычная работа: встречи, какая-то рабочая активность. Это идет на протяжении всего дня.

Не хочу быть пафосным и говорить, что я работаю постоянно, но когда я ложусь спать, то включаю подкаст, чтобы узнать, что у нас произошло с метавселенными, а он на английском, потому что на русском хороших подкастов об этом нет. Это работа или нет? Я не знаю. Я это зачитываю в «полезное время». Неполезное время – это когда я включил Playstation и взял джойстик в руки.

Как стать специалистом по ИИ в 2022 году?
Я бы начал с математики, потом придется что-то выучить – либо язык программирования R, либо Python, чтобы со всем этим взаимодействовать. Но вообще отраслевой стандарт у нас Python. Нужно оказаться в компании, которая готова в это вкладываться. Я с огромным уважением отношусь к людям, которые занимаются фундаментальными исследованиями, наукой, или которые сами для себя пытаются что-то делать. Но если вы не прикладываете это к практике, если нет проверки ваших идей, гипотез, разработок о реальность, то их ценность и для вас снижается. Когда вы не видите подтверждения, что вы сделали что-то хорошее, это полезно и зарабатывает деньги – пусть не вам, но желательно, конечно, вам, – то мотивация теряется.

Можно ли стать миллионером, работая с ИИ?
Я думаю, да. Вопрос в том, какую задачу вы решите. Есть избитый пример с разорившимся медицинским стартапом Theranos. Там использовались какие-то алгоритмы, которые делали презентацию, чтобы получить ответ на все вопросы. Эти люди уже стали миллионерами, миллиардерами, работая с ИИ, просто не до конца получилось. Другая известная история – с Tesla и Илоном Маском. Вопрос не в том, используете вы или нет искусственный интеллект, а в том, какую задачу вы решаете. Сейчас есть большое количество нерешенных задач в области искусственного интеллекта, поэтому все развивается. Дерзайте.
Сезон 2