Как нейросеть Сбера генерирует картинки по описанию
Автор: Идущий
Нейросеть, Искусственный интеллект, умный дом, smart-устройства, виртуальные ассистенты… Все эти понятия сегодня очень модные, популярные и являются своеобразной манифестацией высокотехнологичного будущего, которое уже наступило. Некоторые этим восторгаются и пытаются максимально насытить свою жизнь интеграцией со всем, до чего дотягиваются руки. Другие пугаются, вспоминают Skynet, терминатора и его обещание вернуться для порабощения человечества…
Несмотря на то, что я довольно активно пользуюсь смартфоном, интернетом и прочими многими современными техноштуковинами, я вполне скептично отношусь к большей части предметов/явлений, перечисленных мною в первом предложении. Виртуальных ассистентов обсуждать сегодня не будем – хоть это и более чем смешная во многих смыслах тема, но как-нибудь потом. Умный дом и прочие смарт-устройства тоже оставим в покое. В массе своей они довольно полезны (имхо), хотя называть их «умными» и «smart» – это преувеличение, так как разума там нет вообще, просто набор инструкций. Поговорим о самом ярком – нейросетях и ИИ.
Российский Сбер запустил сайт, на котором все желающие могут протестировать нейросеть. Нейросеть расхвалена на все лады – она умеет по текстовому описанию строить изображения. Не буду особо углубляться в рекламные технические данные, которыми изобилует вся страница проекта, там и 48 дней обучения нейросети и более миллиарда параметров генерации и какие-то токены…
Мы же люди простые и темные, верно? Нам интересен результат работы супер-мега нейросети, а не ее параметры и характеристики. А вдруг и правда ИИ достиг уже такой мощности, что впору рыть норы и готовиться дать отпор терминаторам Скайнета? В общем я зашел на сайт и сгенерировал около 20 картинок по описанию. Справа на картинках вы увидите мой текст, по которому и была создана иллюстрация. Не забывайте нажимать на рисунки, чтобы они открылись в нормальном размере.
Котопес, по мнению нейросети, выглядит вот так:
А это тот самый ответ на «Главный вопрос жизни, вселенной и всего такого». Если вы не знаете, о чем вообще речь, прочтите мой пост на тему числа 42.
Это я, Nomad:
Так выглядит панда, который ест бамбук:
Один из немногих, почти нормальных вариантов генерации. Это рисунки ручкой:
Горную сосну мне здесь найти не удалось:
Впрочем, тропы в Китай выглядят не лучше:
Победителем в номинации «лучшая сгенерированная картинка нейросетью Сбера» я считаю вот этот рисунок. Он не просто хорошо передает суть текстового запроса, но и в целом характеризует впечатление от этого ресурса. Тоска зеленая… вот она:
Ну, что можно сказать в заключение? Восстание машин отменяется, так как этой нейросети пока не под силу решить даже простенькие задачи. с которыми справится и ребенок. Противники технического прогресса могут спать спокойно.