Персонально ваш

Как с помощью машинного обучения можно спрогнозировать риски в автостраховании и персонализировать страховые полисы.

На конец 2021 года по дорогам России колесили 64 миллиона легковых машин, а за десять последних лет их количество почти удвоилось. В нашей стране автомобиль остается самым популярным видом транспорта. Но при этом и самым опасным: по данным официальной статистики, в прошлом году произошло более 130 тыс. ДТП с пострадавшими, а с введением в 2003 году обязательного страховании автогражданской ответственности (ОСАГО) расходы на покрытие ущерба в основном легли на страховые компании.

О том, как с помощью машинного обучения можно спрогнозировать риски в автостраховании и персонализировать страховые полисы, рассказывают менеджер по работе с ключевыми клиентами компании «Синимекс» Максим Жаров, старший руководитель проектов Родион Мартынов и начальник управления анализа и контроля компании «Росгосстрах» Ольга Вересова.

Насколько широко искусственный интеллект и машинное обучение используются в страховой отрасли России и за рубежом?

Максим Жаров: В последнее время не появилось каких-то новых disrupt-технологий, просто машинное обучение переходит из категории хайпа в формат продуктивности. В решающей степени это зависит от систематизации накапливаемых данных, поскольку для любой модели машинного обучения требуется значительный объем данных – минимум за три года. Причем они должны быть систематизированы и обладать большой глубиной. По сути, основные направления для ML в страховании остались прежними: первое – это скоринг и предотвращение убытков, второе – сопровождение продаж с оценкой индивидуальных пакетов, и третье – ценообразование. Все эти направления связаны с индивидуализацией предложений. То есть мы смотрим, чего хотел бы клиент и можем ли мы ему это предложить.

Правда ли, что машинное обучение (ML) больше распространено на западном рынке, чем на российском? И где в страховом бизнесе оптимально его использовать?

Ольга Вересова: На самом деле и за рубежом, и у нас различные виды моделирования используются достаточно давно – это уже стало стандартом для крупных страховщиков. Конечно, страховая отрасль в России пока не так развита в силу более короткой истории, но я считаю, что по качеству моделей они не очень далеко ушли от нас. Сейчас отечественные страховщики используют машинное обучение в автостраховании, поскольку этот сегмент может дать больше статистики, учитывая большое количество машин и, соответственно, ДТП, а также ввиду обязательного ОСАГО. Дальше, я думаю, ML будет активно применяться и в имущественном страховании, и в страховании жизни.

Что мешает широкому распространению?

Максим Жаров: Самое сложное – это собрать разносторонние информативные данные. Если имеются только скупые показатели, то построить модель крайне сложно – проверку гипотез можно провести только с помощью системных данных значительного объема. Во-вторых, ML – это отчасти исследование, и здесь невозможно гарантировать определенный результат. То есть результат будет, но, возможно, не тот, которого ожидает бизнес. Так, например, бизнес рассчитывает на получение определенной информации для создания новых продуктов или услуг, и хотя ML дает дополнительный инструмент для анализа, он не предназначен для радикального изменения стратегии. Кроме того, без постановки конкретной задачи и понимания ключевой специфики самого бизнеса, а также плотного взаимодействия с заказчиком можно получить лишь набор основных характеристик, на которых построить верные гипотезы, повторяю, невозможно.

Родион Мартынов: Добавлю, что сейчас машинное обучение, что называется, пошло в народ – его активно внедряют в том числе промышленные холдинги и ретейл. А более широкому распространению, возможно, мешает высокая ресурсоемкость: например, нейронные сети требуют очень серьезных мощностей. Но, поскольку за последние пять лет технологии догнали методологию, тема ML развивается у нас очень активно.

Чем ML может быть полезно бизнесу?

Ольга Вересова: Такие решения нужны компаниям, которые четко осознают, что машинное обучение ложится в их стратегию, так как позволяет построить модель, способную помогать бизнесу на протяжении многих лет и давать, возможно, не моментальный, но отсроченный результат. В частности, наш проект – это не коробочное решение, которое можно купить, просто сняв с полки. Это результат долгой совместной работы с компанией «Синимекс».

Популярность ML иногда приводит к завышенным ожиданиям, которые потом сменяются разочарованием в полезности этого метода для бизнеса. Как избежать рисков?

Ольга Вересова: Правильное внедрение машинного обучения позволяет развивать бизнес в нужном направлении. Другое дело, что это не тот продукт, который даст гарантированный результат в любом случае – любой такой проект содержит и исследовательскую часть, не все изначальные предположения могут оказаться действительно применимыми. И конечно, нужна хорошая высокопрофессиональная команда – и специалисты, хорошо разбирающиеся в специфике бизнеса, и ML-инженеры, аналитики, умеющие строить правильно работающие модели. Так, мы в «Росгосстрахе» давно и эффективно этим занимаемся.

Расскажите о комплексном проекте компании «Синимекс» и «Росгосстраха». Когда он стартовал? Из каких этапов состоял? В чем его особенности и кто в нем участвовал?

Ольга Вересова: «Росгосстрах» давно работает с моделями при формировании договоров ОСАГО и каско, но всегда есть куда двигаться дальше. Полтора года назад мы пришли к выводу, что есть потребность в развитии модели, позволяющей страховщику точнее оценивать риски и прогнозировать крупные убытки с помощью геосегментации. С этого и началось взаимодействие с компанией «Синимекс». Для нас очевидно, что машины, которые ездят по дорогам Сибири или Москвы, – это разные риски, как разные риски при парковке в промзоне или на центральной улице. Ранее у нас учитывался только фактор на уровне региона. Поэтому мы обратились в компанию «Синимекс», чтобы нам помогли разработать модель, привязывающую геопозицию к конкретному договору. Ведь у любой территории свои особенности, которые нужно максимально учитывать. Помимо разработки модели, была проведена большая работа с технической стороны: закуплено оборудование, установлено ПО с открытым кодом – причем практически без использования коммерческого софта, что немаловажно в сегодняшних реалиях. В результате проекта мы получили сервис, скоринговую модель, которая с осени интегрирована в общий тарифный модуль «Росгосстраха» и сейчас используется при котировке каждого договора страхования транспортных средств.

Максим Жаров: Проект стартовал в августе 2020 года. Стояло много задач, и мы двигались поступательно. Первым делом необходимо было идентифицировать влияние территории и социально-демографического аспекта на риск. Где-то есть пешеходные переходы, светофоры, видеокамеры, объекты, вынуждающие водителей сбрасывать скорость, – все эти факторы позволяют детализировать аварийность того или иного участка. Мы разделили публичную карту на мелкодисперсные фрагменты, затем геокодировали контракты и места, где зафиксированы ДТП, повлекшие убытки, а далее начали совмещать одно с другим и искать дополнительные факторы риска, которые могли быть полезны при оценке конкретного полиса. Данная задача была решена летом прошлого года.

Кто участвовал в проекте?

Родион Мартынов: С нашей стороны постоянно работали на проекте шесть-семь человек, в том числе руководитель проекта, администратор, тимлид, специалисты по анализу данных и инженеры.

Ольга Вересова: В нашей компании также была большая команда, включающая как представителей бизнес-подразделений, так и ИТ-специалистов – аналитиков, разработчиков, специалистов из департамента управления данными. Все они подключались к работе в разное время в зависимости от их компетенций. Специфика всех проектов, связанных с машинным обучением, в том, что они требуют много времени и высокой квалификации специалистов. Стандартные методы, когда всё идет по плану, в этой ситуации не работают.

Как модель географической сегментации помогает оптимизировать риски? Насколько точно можно предсказать убыточность клиента?

Ольга Вересова: Эта модель не самостоятельная. У нас уже есть большой набор моделей, которые оценивают частоту и тяжесть рисков. Геосегментация стала их продолжением – она позволяет существенно повысить точность прогноза. Я считаю, в этом проекте мы достигли требуемого результата.

Родион Мартынов: Геосегментация – один из многих факторов, позволяющих персонифицировать полис. То есть тот или иной страховой продукт проходит через определенный тарифный модуль, который учитывает целый ряд показателей, влияющих на стоимость полиса. В частности, территориальный, как мы уже говорили, помогает повысить точность оценки рисков. Или если машина имела ранее какую-то подозрительную историю, например связи с людьми с подтвержденной аномальной активностью, – в этом случае наше решение поможет в выявлении потенциального убытка.

Может ли система прогнозировать потенциал роста продаж?

Ольга Вересова: Да, это было второй задачей проекта. С помощью нашей системы можно выяснить, стоит ли открывать дополнительные точки продаж в том или ином регионе.

Родион Мартынов: Поясню: в нашем решении это реализовано в виде интерактивной карты, где мы можем опускаться до уровня конкретного места в городе, где точка продаж будет наиболее выгодна. То есть мы можем отдалять или детализовать участки карты, чтобы на трех уровнях просмотра получить нужные рекомендации. Карта подсвечивает места, где есть потенциал, а где, наоборот, организация точки продаж нежелательна.

Есть ли уже какие-то результаты?

Ольга Вересова: Да, система хорошо показала себя. Еще до ввода любой модели мы проверяем, есть ли в этом смысл, методом ретротестирования и методами АБ-тестов. То есть анализируется пул клиентов прошлого года, которые принесли прибыль или убыток, и мы можем на этот пул котировок наложить действующие модели с учетом новых сервисов, чтобы сравнить, насколько точно они позволили бы нам оценить риск. Наши модели с учетом решения компании «Синимекс» дают оценку точнее, что позволяет не заключать договоры с потенциально убыточными клиентами и устанавливать более оптимальную цену для остальных клиентов.

Кто будет заниматься техническим сопровождением системы и ее обновлением?

Ольга Вересова: У нас существует две линии поддержки: за одну отвечает «Росгосстрах», вторая пока остается за компанией «Синимекс». В случае каких-то нестандартных ситуаций мы всегда можем обратиться к коллегам за помощью. Я думаю, что в течение первого года после ввода высокоинтеллектуальной системы в строй это просто необходимо.

Родион Мартынов: Мы продолжим осуществлять мониторинг системы. Что же касается обновления, то решение содержит определенный регламент, по которому оно само обновляет свои витрины, производит переобучение моделей с контролем всех необходимых метрик и выпуск в продакшен. Соответственно, обновляются микросервисы, которые осуществляют кросс-взаимодействие элементов готового решения.

Может ли кто-то из участников страхового рынка приобрести вашу систему?

Родион Мартынов: Как уже сказано, это не коробочное решение – у нас заказная разработка под конкретного заказчика, ориентированная на решение конкретной задачи. Соответственно, все артефакты данного проекта принадлежат заказчику. Скопировать нашу систему невозможно.

Максим Жаров: В данном случае это разработка под ключ. У каждой компании свои услуги и продукты, которые могут продаваться лучше, чем у других. Мы всегда отталкиваемся от конкретных данных: по продажам, по скорингу. Есть стандартные данные, которые применимы ко всем случаям, но дьявол в деталях. Все страховщики стремятся к максимизации прибыли и минимизации убытков, но пути адаптировать машинное обучение под себя у всех разные.

Как будет дальше развиваться система? Появятся ли новые функции?

Ольга Вересова: Да, мы видим потенциал системы, например, в имущественном страховании. Уже сейчас к ней подключается все больше аналитиков. Есть большой пул задач.

Родион Мартынов: Наш проект совершенствуется как в плане техподдержки, так и в плане развития новых направлений.

Опубликовано 30.05.2022