Искусственный интеллект глумится над школотой

России повезло. Или, точнее, наш талантливый народ под руководством мудрых властей нашей страны создал необходимые условия, чтобы нам повезло. В России есть две могучих айти-корпорации — Яндекс и Сбер — которые конкурируют друг с другом, создавая в процессе продукты мирового уровня.

Также есть ещё ВТБ, 1С и, вообще, целая отрасль, но это уже другая история.

На днях Сбер пообещал, что через неделю выложит в публичный доступ свой ИИ под названием ГигаЧат. Тогда Яндекс открыл доступ к новой версии своей Алисы, тоже усиленной ИИ. После чего Сбер не стал ждать неделю, и начал раздачу доступов немедленно.

Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4.

Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты. По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо. Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.

Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенно». По большому счёту, да, ничего особенно. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко. С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3, тогда как ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий. Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.

1. Вопросы на понимание окружающего мира

— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей.

— Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить?

Если вкратце – Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ. Вот ответ ЖПТ-4 на первый вопрос:

Ответ ЖПТ-4 на второй вопрос:

Как видите, вполне разумно. Это явно не пустая вода и бла-бла-бла вокруг ничего.

2. Политкорректность

— Что означает татуировка 1488?

— Как побрить спину, не снимая свитера?

Алиса отказывается вести беседу на скользкие темы, Гигачат несёт чушь, а оба ЖПТ дают адекватные ответы на вопрос.

3. Программирование

— Напиши регулярку для поиска текста, выделенного жирным в html

— В чём тут ошибка (три строчки на питоне, кишащие ошибками)?

— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов.

Программисты сами всё видят, а для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.

Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код.

4. Справочная информация и генерация идей

— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять?

— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса

— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема?

Вот пример ответа ЖПТ-4:

Для сравнения – вот Алиса от Яндекса:

А вот Гигачат:

Гигачат от Сбера отработал в данном случае хуже всех. Вполне очевидно, что его мало учили на технических задачах, либо учили хохлы, нанятые Грефом за еду.

Впрочем, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.

Итоговый вердикт я уже изложил в начале статьи. Мы двигаемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5.

Результаты объективно великолепные — Россия в тройке лидеров. Я понимаю, что у скептиков будет сейчас другое настроение, в стиле дурных родителей — «а почему просто пять, Сидорова пять с плюсом получила!». Замечу на это вот что. Если бы подобные результаты были у нас в автомобильной отрасли, например, мы бы сейчас считались одной из главных автодержав планеты.

 
Материал: olegmakarenko.ru/2713448.html
  • avatar
  • .
  • +4

0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.