Особенности применения машинного обучения в промышленности, индустрии моды и банковских услугах

Видео с конференции Data & Science, на котором эксперты рассказывают о своём опыте работы с большими данными, машинном обучении и их применении в науке, экономике и других сферах жизни.

Очень интересно первое выступление — Эмели Драль из Yandex Data Factory, рассказывает о подводных камнях, которые возникают при использовании машинного обучения в промышленности (выбор нефтяных скважин для гидроразрыва пласта, контроль разделения газа на фракции, предсказание дефектов в продуктах металлургического производства (слябах)).

Этапы проекта:
1. Постановка задачи
2. Определение метрик и критериев успеха
3. Оценка доступности данных
4. Обучение предсказательной модели
5. Тестирование модели (эксперимент)
6. Интеграция и поддержка

Правильная оценка экономической целесообразности — для этого нужно погружаться в предметную область, привлекая экспертов.
Очень важно правильно выбрать метрику, которую нужно оптимизировать.
Отсутствие данных для обучения (особый момент на который нужно обратить внимание: необходимо использовать только те данные, которые действительно доступны модели во время её работы).
Оценка применимости модели в бизнес-процессе (подходит ли горизонт прогнозирования для оптимизации процесса).
Правильное проведение A/B-тестирования (равномерное разделение данных на тестовую и контрольную выборки).
Адаптация модели для работы на новых данных (деградация модели).

Каждый пункт может привести к ошибке, но очень важно обратить внимание на возможность деградации модели. В этой особенности состоит важное отличие обычного программного обеспечения от использования моделей машинного обучения.
Модель машинного обучения со временем может начать хуже работать. Можно привести аналогию, что «модель — это некая живая сущность, которая питается данными», т.е. нужно держать её в состоянии, согласованном с текущим набором данных. Таким образом, получается, что модели со временем устаревают и поэтому их нужно периодически дообучать или переобучать.
Однако, важно следить за тем, чтобы эффект от перестроения модели на свежих данных был больше, чем затраты на этот процесс.

Среднее время проекта — 6-9 месяцев.
Много времени тратится на изучение предметной области.
Само моделирование занимает всего 30-40% времени.

далее: Как применять искусственный интеллект в бизнесе

По теме
Проблемы применения машинного обучения для решения реальных задач

Преимуществ нет, за исключением читабельности: тип bool обычно имеет размер 1 байт, как и uint8_t. Думаю, компилятор в обоих случаях…

Добрый день! Я недавно начал изучать программирование под STM32 и ваши уроки просто бесценны! Хотел узнать зачем использовать переменную типа…

если у вас черное окно попробуйте так. #include <opencv2/opencv.hpp> #include<iostream> #include <stdlib.h> #include <stdio.h> using namespace cv; using namespace std;…

Для Python 3.4: pip3 install tensorflow-1.1.0-cp34-cp34m-linux_armv7l.whl https://github.com/samjabrahams/tensorflow-on-raspberry-pi

PORTB = (PORTB & 0b11100111) | (i & 0b00000011); А почему Вы обнуляете биты 3 и 4, а заполняете биты…

RoboCraft

Особенности применения машинного обучения в промышленности, индустрии моды и банковских услугах

Добавить комментарий Отменить ответ