
Нейросети и искусственный интеллект: что нам действительно нужно знать?
Привет, меня зовут Сергей Мазур, и это ежедневный обзор использования нейросетей для улучшения бизнеса от сервиса Иноватсон — платформы поддержки отдела продаж на основе контроля качества звонков. Сегодня мы поговорим о том, как работают большие языковые модели (LLM) и почему их нельзя назвать настоящим искусственным интеллектом. 💼
Как работают большие языковые модели?
Для тех, кто знаком с принципами работы LLM, можно пропустить следующие строки, но я считаю важным объяснить это, чтобы закрепить свои мысли.
Большие языковые модели функционируют за счет встраивания токенов в векторы, где каждое измерение представляет собой отдельный аспект потенциального значения. Например, одно измерение может указывать на съедобность: свинина может получить оценку 5, трава — 2, а сталь — 0. Каждый вектор преобразуется в ключ, запрос и значение с помощью весовых матриц, которые изменяют оригинальный вектор различными способами, чтобы акцентировать различные характеристики (например, для запроса — характеристики, определяющие релевантность). Запрос каждого токена в подсказке умножается на ключ каждого токена, включая себя, что помогает определить релевантность каждого токена к другим токенам в подсказке.
Каждый из полученных скалярных произведений, называемых векторами оценок внимания, нормализуется с помощью функции softmax, что дает нам распределение вероятностей внимания для каждого запроса. Эти вероятности затем умножаются на значения каждого токена в подсказке, и их результирующие векторы суммируются, чтобы предоставить контекстуально обогащенный вектор для каждого токена, называемый выходным вектором. Этот выходной вектор затем проходит через несколько слоев нейронов, пока не достигает предсказания следующего токена. Это предсказание сравнивается с фактическим следующим токеном, и с помощью обратного распространения (по сути, используя цепное правило) определяется градиент функции потерь выходных данных модели, после чего алгоритмы оптимизации корректируют веса трансформеров, чтобы они более точно отражали фактический следующий токен. 🔍
Почему LLM не являются искусственным интеллектом?
Так почему же я утверждаю, что LLM не являются искусственным интеллектом? Потому что они не соответствуют никакому определению интеллекта, с которым я сталкивался. Интеллект — это способность разума решать определенные задачи или достигать целей. То, что делают LLM, — это не интеллект, а восприятие. Мы разработали искусственное восприятие (не путайте с сознанием), но не интеллект. Если бы у LLM были цели, к которым они использовали бы свое восприятие для достижения, тогда я бы считал их ИИ, но на данный момент они просто предсказывают следующий токен. Не то чтобы это было не впечатляюще; восприятие необходимо для наличия интеллекта, но одно только восприятие не является интеллектом, хотя интеллект и основывается на нем. 🤖
Как люди обрабатывают информацию?
Люди тоже занимаются тем, что я представляю как предсказание следующего кадра. Установлено, что наши мозги не используют цепное правило для определения градиента потерь в трансформациях нейронных данных, но известно, что мозг использует трансформеры (нейроны, выполняющие математические операции над данными других нейронов). Вероятно, существует какой-то другой способ делать это, который мы еще не открыли. Однако человеческое поведение не является продуктом восприятия, которое формируется в задних частях нашего мозга (PTO- junction); оно происходит из познания, формируемого в лимбических и фронтальных частях нашего мозга (базальные ганглии и префронтальная кора), где наши мотивации направляют нашу волю, которая контролирует наше внимание, а внимание — наши мысли и поведение.
Что нам нужно для создания ИИ?
Я не думаю, что мы получим искусственный интеллект, пока кто-то не решит построить модель, которая имеет цели и способность направлять внимание для влияния на мысли и поведение на основе восприятия. У нас есть восприятие, нам просто нужно внимание (видите, что я сделал?). 🎯
Итак, если вы хотите узнать больше о том, как нейросети могут улучшить ваш бизнес, не упустите возможность ознакомиться с нашими решениями на сайте Иноватсон. Мы поможем вам увеличить конверсию и избежать ошибок менеджеров в процессе холодных звонков.
Хотите увеличить прибыль с помощью ИИ? Переходите на наш сайт: https://inovatson.ru/