Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B, сообщает пресс-служба банка.
Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B – самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT от английского MIT License – лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом).
ruGPT-3.5
Внутри GigaChat находится целый ансамбль моделей – NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 миллиардов параметров (ruGPT-3.5 13B) – новая версия нейросети ruGPT-3 13B.
Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели – это базовый претрейн для дальнейших экспериментов.
Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.
mGPT
Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.
Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.
Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.
– Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому, мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами, – говорит старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка Андрей Белевцев.
Громкая история о том, как певица Лариса Долина потеряла элитную квартиру из-за аферистов, получила неожиданное продолжение. Но на этот раз мошенники выбрали другую тактику.
О планах РПЦ застроить Поросенков Лог, где наши останки царской семьи, заявил благотворительный фонд «Мемориал Романовых». В ролике, размещенном в группе ВКонтакте фонда, говорится, что памятник истории находится под высокой угрозой уничтожения через застройку.
Жители Екатеринбурга проголосовали за запрет электросамокатов, моноколес, гироскутеров и других средств индивидуальной мобильности (СИМ) в опросе на «Госуслугах», который запустила администрация города.
Во времена СССР квартиры людям доставались бесплатно. Отстояв очередь, можно было получить вожделенные метры. А получится ли так сейчас? Ответ дал народный избранник из Госдумы Олег Савченко. Депутат считает, что сейчас такое вряд ли получится, это будет достаточно сложно.
Мыть посуду – занятие не из приятных. Но делать это необходимо. Причем процесс надо выполнять как следует. Иначе на неправильно вымытой посуде будут копиться бактерии и неприятные запахи. Самый негативный сценарий – можно и отравиться.
В марте прошлого года в «Крокус Сити Холле» произошел крупный теракт. Четверо вооруженных людей ворвались в здание, стали стрелять и подожгли «Крокус». В результате атаки преступников погибли не меньше 145 человек и больше 500 получили ранения. И нашелся человек, который оправдал такое злодеяние.
Католический священник стал экзорцистом почти два десятка лет назад. И с той поры отец Карлос Мартинос перемещается по миру и помогает людям, одержимым демонами. По словам религиозного деятеля, один из случаев экзорцизма убедил его в существовании дьявола.
В школах дети не только учатся, но и отдыхают на переменах. И не секрет, что ребятня иногда во время таких передышек не прочь пробежаться. Именно бегая, в одной из школ Петербурга один младшеклассник столкнулся лбом с другим учеником. И результат этого столкновения оказался плачевным.
Льгота в 50% на проезд в поездах дальнего следования действует для детей от 10 до 18 лет теперь круглый год. Справку со школы при посадке больше предъявлять не надо.
Некоторым союзам людей суждено длиться очень долго. В США, например, супруги прожили вместе аж целых 69 лет. И это прекрасное событие муж с женой отпраздновали шампанским и бальными танцами. И еще пара раскрыла свой секрет долгого брака.
Не секрет, что многие актёры соперничают друг с другом ради популярности. В Голливуде немало подобных «противостояний». Многие наверняка сразу вспомнят Брэда Питта и Тома Круза, которые уже 30 лет выясняют, кто из них круче.
Если на карту пришли деньги от неизвестного отправителя, бежать тратить свалившиеся на голову средства не надо и пытаться вернуть самостоятельно тоже. Об этом напомнили в МВД.
В 2025 году россияне смогут вернуть до 19,5 тысячи рублей за лечение в качестве налогового вычета. Об этом рассказал глава комитета Госдумы по охране здоровья Сергей Леонов.
Певец SHAMAN (Ярослав Дронов) назвал главу Лиги безопасного интернета (ЛБИ) Екатерину Мизулину своей девушкой. Об этом сообщает телеканал «360.ru» в Telegram-канале.