Компания «Норникель» представила первую в мире доменную языковую модель MetalGPT-1, созданную специально для металлургии и горнодобывающей промышленности. Модель с открытым исходным кодом содержит 32 миллиарда параметров и обучена на профильных данных, что позволяет ей точно работать с профессиональной терминологией, технологическими протоколами и производственными задачами.
Ключевое преимущество MetalGPT-1 — высокое качество данных для обучения: модель использовала более миллиона внутренних документов «Норникеля», включая технологические инструкции, патенты, отчёты НИОКР и научную литературу, недоступные в открытом доступе. Все данные прошли многоступенчатую анонимизацию для сохранения коммерческой тайны. Дополнительно было создано около 500 тысяч вопросно-ответных пар на основе реальных производственных задач для повышения точности модели.
«Металлургия — один из самых сложных отраслевых доменов со своим языком процессов. Универсальные модели теряют точность на таком специализированном языке, а крупномасштабные модели требуют колоссальных ресурсов. MetalGPT-1 меняет правила игры: это первая в мире доменная модель, оптимизированная под металлургию», — отметил руководитель направления по развитию ИИ «Норникеля» Данил Ивашечкин.
Разработка модели заняла около года, включая шесть месяцев на сбор и подготовку данных. Для оценки её эффективности был создан специальный промышленный бенчмарк, на котором MetalGPT-1 стабильно превосходит открытые универсальные модели.
«Норникель» опубликовал модель и бенчмарк на платформе Hugging Face, предоставив отрасли инструмент для разработки специализированных ИИ-решений и создания персональных ассистентов для оптимизации производственных процессов.

