Сбербанк представил конкурента ChatGPT — GigaChat
Как стало известно из блога СберБанка на «Хабре», новая нейросеть GigaChat работает на совокупности моделей, названных NeONKA. В нее входит модель ruGPT-3.5, обученная на 13 миллиардах параметров. Ее пообещали в будущем выложить в открытый доступ, чтобы ускорить развитие проектов в области искусственного интеллекта. Генерация изображений происходит с помощью еще одной модели — Kandinsky 2.1.
GigaChat умеет писать деловые письма, создавать изображения, генерировать статьи и тексты. В планах на развитие нейросети у СберБанка — ее обучение при помощи PPO. Это финальный компонент в выравнивании ответов модели. Также разработчики хотят повысить этичность ответов и выложить модель в общий доступ. Запланирован релиз моделей ruGPT-3.5 и mGPT 13B.
Почитать еще о нейросетях: