Иван Самсонов

Лид продуктового направления по ML, ВКонтакте

17 октября 2023

Я погонщик нейросетей - го со мной. Иван Самсонов, Лид продуктового направления по ML в ВК

Статья подготовлена волонтёром ProductCamp Кириллом Медниковым: https://t.me/MednikovK

О спикере

Меня зовут Ваня Самсонов, и я работаю во ВКонтакте. Отвечаю за машинное обучение в обработке текстов, картинок и звука. Если кто-то из вас пользуется ВК звонками, там есть шумодав. Мы используем нейросети, чтобы глушить шумы, такие как собаки, метро или орущие дети, чтобы звонки были более комфортными.

Создал ИИ

Думаете, что все в мире развивается благодаря ученым и военным, которые что-то придумывают и делают большие работы? Это верно, но машинное обучение имеет свою специфику. Когда компьютеры стали доступны дома, геймеры стали основными толчками для развития технологий. Видеокарты и графические процессоры, разработанные для обработки визуальной информации в играх, оказались критически важными для перемножения тензоров и матриц в машинном обучении. Сейчас машинное обучение основано на вычислениях на видеокартах.

Научиться писать промты за 10 дней

Мы, как продуктовые команды, работаем с машинным обучением. Проведя эксперимент, мы выяснили, что даже человек, который занимается креативной профессией, и тот, кто 10 дней практиковался с использованием Chat GPT, похожи по стилю текстов. Модельки могут рисовать, генерировать звук и текст, а некоторые даже могут пройти капчу.

Модельки могут хорошо выполнять декомпозированные задачи, но не умеют планировать и ставить задачи. Они быстро перестраиваются и адаптируются к изменениям. Но несмотря на ограничения, они уже умеют очень многое.

Мы в безопасности

Пока модели не умеют планировать, мы в безопасности. Плюс, в безопасности мы еще почему? Потому что наши с вами потенциальные руководители не умеют декомпозировать задачи и ставить их такими маленькими кусочками. А именно, в решении маленьких кусочков задач и сила машинного обучения, и вот этих вот текущих и других генеративных нейронных сетей.

Поэтому, когда вы будете ставить задачу, постарайтесь максимально сузить её. Попробуйте разбить задачи, а не просто типа "сделаем сайт, который привлекает лидов и продает". Нет, сделаем кнопочку, сделайте мне текст, сделайте мне наполнение корзины и так далее. Прямо разбейте задачи, и тогда вы увидите очень крутой эффект.

Что AI думает. Чему AI учат. Что AI дают скачать

Если вы сейчас пойдете и напишете что-нибудь в GPT или в другую текстовую модель, то, скорее всего, увидите вот такой милый экологичный ответ: "Не волнуйтесь, все хорошо, разложат".

"Поддерживать разговор с такой моделью было бы очень приятным, но это не правда. На самом деле, разработчики в течение полугода работали и вводили ограничения, чтобы модель не предоставляла информацию о вредных или незаконных действиях, например, рецепт сваривания метамфетамина.

Внутри модели содержится огромное количество данных, включая закрытые отчеты больших компаний, военных данных и другие конфиденциальные материалы, что делает ее невероятно мощной

Однако существуют специалисты, так называемые "джейлбрейкеры нейронных сетей" или просто хакеры, которые пытаются обойти ограничения и извлекать информацию из моделей. Они могут долго исследовать и задавать правильные вопросы, чтобы получить ответы на сложные вопросы или извлечь ценную информацию, за которую были заплачены значительные суммы.

Ресурсы

Поэтому, если интересно узнать, как "похакать" такие модели, существуют ресурсы, которые помогут вам в этом. Там есть ресурсы, которые постоянно обновляются. В четверг проверил, было уже часть не актуально. В субботу ребята уже до обновили информацию и вечером можно было уже по-новому хакать. Стало чуть более сложно, но все еще можно и соответственно вы посвящая время тому пониманию, как это работает, какие нужны запросы вставлять, как она отвечает, почему она так отвечает. Сможете докапываться до очень крутых вещей и делать ее действительно своим прям карманным помощником.

Где тут деньги?

Раз мы продукты, значит, мы все отвечаем, так или иначе, за деньги. И не важно, что кто-то скажет, что он отвечает за счастье пользователей, за время проведенное или количество аудитории. Все равно это метрики, которые позволяют зарабатывать деньги, потому что счастливый пользователь с большей вероятностью принесет вам доход, и если таких пользователей много, то это еще лучше.

Так вот, деньги здесь в том, что, как говорил Сибрант на прошлой лекции, модель она тупо усердная. Она не умеет фантазировать, не умеет придумывать новое. Да, на некоторые вещи она умеет перефразировать, она умеет дополнять информацию, но она просто очень усердная.

Ваша задача - быть максимально любопытными и задавать ей вопросы вот так. Не получилось, дай постараюсь другим способом, скажи, раскрой четвертый пункт, а потом еще раскрою. А почему так? Задавайте ей вопросы, делайте так, чтобы она пыталась вам ответить, и не ведитесь, если она будет говорить: 'А я чего-то не знаю, я не могу вам этого ответить'. Нет, она может, и вот прямо приходить и стараться добиться от нее того, что вы хотите."

Если бы нейросети учились как люди

А здесь прям мемасик про меня, потому что иногда я учусь, учусь, а мне уже 30, потом тяжело становится, пойду-ка я займусь еще чем-нибудь другим, посмотрю, потому что тем сложнее учиться, это прям правда, на себя заметил

В чем еще сложность моделек, особенно современных и больших? Каждая итерация модели - это обучение в 30-40 дней на тысячах видеокарт.

Актуальность данных

А теперь представьте, вот Chat GPT, которым вы пользовались, она сделана с информацией, скачанной из интернета до середины 21 года, то есть где-то апрель-май 21 года и дальше что было, она не знает. Соответственно, предположим, что они на все информации дообучились, на сегодняшний момент месяц учились и к концу обучения она не знает про последний месяц. Блин, нафига нужна модель, которая не умеет актуальные данные? Вообще, для того чтобы все это обучать, нужно очень много чистить, собирать, и можно в итоге получить такую штуку, что модель деградирует и будет выдавать более глупые вещи.

Так в чем же сила и в чем вообще здесь фишка? Об этом почему-то говорят очень мало. То есть, я это видел, наверное, в двух из 100 пабликов или выступления которых говорят ребята рассказывают про Chat GPT.

Вся сила - в оракулах и плагинах

Основная ее сила заключается в том, что ей не нужно знать всю информацию самой по себе. Например, разработчики создали плагины, которые позволяют модели ходить в интернет и получать информацию из разных источников. Если я спрошу у модели прогноз погоды, она может ответить, что не знает. Но если я уточню, например, "дай мне погоду в Москве на сегодня", она сможет найти соответствующий плагин, обратиться к Gismeteo, получить контактную информацию и передать мне актуальную погоду в Москве. Таким образом, она не решает задачу напрямую, а перераспределяет поток в поисковую систему или другие источники, что открывает возможности для эволюции поисковых систем.

Это позволяет модели быть максимально универсальной и использоваться в различных продуктах. Она может общаться с каждым из ваших продуктов, что открывает потенциал для монетизации. Например, если вы занимаетесь электронной коммерцией и хотите купить растение, модель может помочь вам найти магазин в Москве, где можно купить фикус, предоставить актуальную цену и адрес. Вы можете создать API, которое модель будет понимать, и каждый из вас сможет монетизировать свои продукты, позволяя машинке понимать, кому обратиться за информацией.

Таким образом, модель может стать ценным помощником и открывает множество возможностей для бизнеса, давая доступ к актуальной и полезной информации.

Плагины

Понимаете, в этом сейчас сила. Я удивлен, что об этом вообще никто не говорит. Очень малое количество и действительно можно отправлять туда свои плагины и актуальную информацию с ваших сайтов. Есть еще одна клевая штука - представьте, если модель может давать другой модели задания. Точно так же, как мы даем задания разработчикам, пишем ТЗ, также и модели могут общаться друг с другом. Представьте такой мир, где существует большое количество моделей, которые могут давать друг другу задания.

Подскажите, у кого из вас на работе есть модельки с машинного обучения? Вот, подняли руки. Какое-то количество людей. Я уверен, что скоро этих людей будет больше. И вот, это будет выглядеть примерно так - у вас есть тысячи моделек, они друг с другом общаются, и вы не понимаете, что там происходит. Но в этом разобраться не так уж и сложно, потому что есть база моделей, которую собирают разработчики, и туда мы тоже загружаем свои модельки. На субботу было около 175 тысяч моделей, каждая решает свою узкую задачу - оптимизировать цену, рекомендовать, расшифровывать текст или картинки.

Представьте, что через полгода или через год люди, которые пишут модели, начнут хорошо писать объяснения, что делает их модель. А вы, как продукты, сможете объяснить, какую бизнес-ценность она может вам принести или запросить, чтобы она решила вашу бизнес-задачу. То есть моделе вы даете запрос, она ищет здесь модель, которая максимально подходит под вашу задачу, поднимает ее, дает ей задачу, и этот ответ приходит к вам. Задача решена.

Что вам нужно?

Таким образом, это мир, где есть вы, как погонщик нейронных сетей, которых реально много, и вы можете даже не задумываться зачем она это поднимает. Вы сформулировали задачу четко, модель пошла, нашла как это сделать, решила задачу.

Для того чтобы вы могли комфортно общаться с моделькой, вам нужно понимать, что там находится внутри. Это открывает огромные возможности для бизнеса и позволяет эффективно использовать нейронные сети и обмениваться информацией между ними.

Я выделяю примерно три блока. Первый - это люди, которые понимают, что есть модельки, слышали про Chat GPT и могут что-то там вбить. Второй сегмент - люди, которые понимают, что существуют модели по компьютерному зрению, звуку и т.д., и примерно знают, какие бизнес-задачи они решают, но не знают, как они работают. Третий блок - это люди, которые понимают, как работают машины на обучение, но не могут писать код.

Полезные материалы

Для вас важно, чтобы когда ваш разработчик придет и скажет, что на этой модели метрика F1 нормально, а тут упала, и начнет кидаться терминами, вы должны понять, что он до вас доносит, переработать это в бизнес-метрики и объяснить вашему вице-президенту, директору или кому-то еще, что это связано с деньгами, людьми и вашим продуктовым счастьем. Вы должны уметь перерабатывать и коммуницировать эти важные аспекты бизнеса.

Для этого я собрал подборку ресурсов: примерно 60 часов подкастов, где клевые чуваки в живом диалоге хорошо объясняют машинное обучение и задачи, которые оно решает. Также около 250-300 часов различных курсов, которые считаю полезными, если вы хотите понимать, как работает машинное обучение, градиентный бустинг, генеративные модели и т.д. Это поможет вам разобраться и быть успешным в вашей работе и коммуникации с разработчиками и руководством.

Регистрация на ProductCamp открыта

Присоединяйся к чату комьюнити

Будь в курсе всех новостей, обращайся за помощью к коллегам и находи единомышленников!

Заходи в чат

Статьи

Вакансии

Академия

Видео

Инструменты

Афиша

productcamp

devscamp

Карта города

Контакты