России повезло. Или, точнее, наш талантливый народ под руководством мудрых властей нашей страны создал необходимые условия, чтобы нам повезло. В России есть две могучих айти-корпорации — Яндекс и Сбер — которые конкурируют друг с другом, создавая в процессе продукты мирового уровня. (Также есть ещё ВТБ, 1С и, вообще, целая отрасль, но это уже другая история).
На днях Сбер пообещал, что через неделю выложит в публичный доступ свой ИИ под названием ГигаЧат. Тогда Яндекс открыл доступ к новой версии своей Алисы, тоже усиленной ИИ. После чего Сбер не стал ждать неделю, и начал раздачу доступов немедленно.
Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4. Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты. По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо. Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.
Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенно». По большому счёту, да, ничего особенно. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко. С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3, тогда как ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий. Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.
1. Вопросы на понимание окружающего мира
— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей. (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)
— Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)
Как видите, Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ.
— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов. (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)
Программисты сами всё видят. Для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.
Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код.
4. Справочная информация и генерация идей
— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)
— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)
— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)
Как видите, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.
Итоговый вердикт я уже изложил в начале статьи. Мы двигаемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5.
Результаты объективно великолепные — Россия в тройке лидеров. Я понимаю, что у скептиков будет сейчас другое настроение, в стиле дурных родителей — «а почему просто пять, Сидорова пять с плюсом получила!». Замечу на это вот что. Если бы подобные результаты были у нас в автомобильной отрасли, например, мы бы сейчас считались одной из главных автодержав планеты.
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Чтобы писать комментарии Вам необходимо зарегистрироваться либо войти на сайт под своим именем.
» Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации. Зарегистрируйтесь на портале чтобы оставлять комментарии
Материалы предназначены только для ознакомления и обсуждения. Все права на публикации принадлежат их авторам и первоисточникам. Администрация сайта может не разделять мнения авторов и не несет ответственность за авторские материалы и перепечатку с других сайтов. Ресурс может содержать материалы 16+