Skip to content

На основании сырых данных с параметрами добычи и очистки золотоносной руды построить прототип модели для предсказания коэффициента восстановления золота из золотоносной руды с лучшей метрикой sMAPE.

Notifications You must be signed in to change notification settings

ejay34/06_recovery_of_gold

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

Восстановление золота из руды

Компании "Цифры", разрабатывающей решения для эффективной работы промышленных предприятий, требуется подготовить прототип модели машинного обучения.

Модель должна предсказать коэффициент восстановления золота из золотосодержащей руды и оптимизировать производство, чтобы не запускать предприятие с убыточными характеристиками.

Цель исследования:

Построить прототип модели машинного обучения, которая сможет предсказывать коэффициент обогащения и поможет оптимизировать производство.

Этапы исследования:

  1. Подготовка данных
  2. Исследовательский анализ данных
  3. Построение и обучение различных моделей
  4. Проверка лучшей модели на тестовой выборке
  5. Итоговый вывод

Итоговый вывод:

В ходе проведенного исследования нам были предоставлены обучающий, тестовый и полный датасеты от условной золотодобывающей компании для подготовки прототипа модели машинного обучения.

По окончании работы наша модель должна предсказывать коэффициент восстановления золота из золотодобывающей руды. В дальнейшем, модель должна оптимизировать производство.

  1. На первом этапе мы загрузили необходимые для работы библиотеки, а также сохранили в переменные данные, предоставленные компанией-заказчиком. Проверили правильность формулы расчета эффективности обогащения руды. Оптимизировали признаки в обучающей и тестовой выборках и произвели предобработку данных
  2. На втором этапе работы, мы исследовали изменение концентрации металлов на различных этапах очистки, выявили аномальные значения в данных и удалили их. Сравнили распределения размеров гранул, чтобы оценить будет ли модель правильно предсказывать.
  3. На третьем этапе определили функцию для подсчета метрики sMAPE (симметричное среднее абсолютное процентное отклонение). Обучили три разные модели на обучающей выборке с перебором гиперпараметров. Для каждой модели определили лучший результат. Затем, лучшую модель проверили на тестовой выборке и сопоставили с результатами на обучающей. А также проверили адекватность нашей модели с помощью сравнения с константной модели

Итог: Таким образом, мы выявили наиболее качественной модель Lasso для машинного обучения. Она дала нам результат метрики sMAPE, равный 8,66 на обучающей выборке, и 8,54 на тестовой. При этом константная модель показала результат 9,56

About

На основании сырых данных с параметрами добычи и очистки золотоносной руды построить прототип модели для предсказания коэффициента восстановления золота из золотоносной руды с лучшей метрикой sMAPE.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published