Využití strojového učení pro predikci odchodu zákazníků v pojišťovnictví – 2.díl

Využití strojového učení pro predikci odchodu zákazníků v pojišťovnictví – 2.díl

Působíte v pojišťovnictví a zajímá vás, jak lze ve vašem oboru predikovat odchod zákazníků ke konkurenci? Přečtěte si, jak vám ve snižování míry odchodu zákazníků může pomáhat strojové učení (Machine Learning – ML). V prvním díle jsme si představili některé z výhod využití ML v prediktivním modelu, nyní se podíváme na to, jak na to.

Celý tento druhý díl bude věnován implementaci nástrojů strojového učení pro predikci odchodu zákazníků (takzvaného churnu). Proces implementace rozdělíme do pěti kroků.



Definice cíle

Než pojišťovna přistoupí k budování řešení ML, měla by znát svůj stávající problém a definovat hlavní cíl, jehož chce analýzou dosáhnout. Bude nutné mít jasno v tom, jaký typ problému má ML řešit: zda klasifikaci, nebo regresi. Protože to může znít trochu složitě, přikládáme vysvětlení:

  • Klasifikace má definovat, do které třídy nebo kategorie správce zásad patří. V základním porozumění bude algoritmus ML použit tak, aby rozděloval zákazníky na churner/non-churner a odpovídá na otázky typu „opustí zákazník společnost?”, „obnoví si pojistku?“, „obnoví pojistku ve stejném znění?“ Specifický typ klasifikačního problému při detekci anomálií může také pomoci pojistitelům sledovat atypické vzorce chování jejich zákazníků.
  • Regrese se zaměřuje na vyhodnocení vztahu mezi proměnnou a datovými hodnotami, které ji ovlivňují. Jednoduše řečeno, výsledek regrese vždy obsahuje číslo, například období, kdy se předpokládá, že zákazník společnost opustí. V případě klasifikace je to vždy navrhovaná kategorie (churner/non-churner).

Sběr dat

Dalším krokem bude rozhodnutí, jaké zdroje použít pro sběr dat, a skutečně tato data shromáždit. Ve strojovém učení na datech velmi záleží a kvalita a relevance dat pojistitele přímo ovlivní výsledky, které model ML produkuje. Některé ze zdrojů, které by pojišťovny mohly zvážit, zahrnují:

  • Typy pojistných smluv
  • Demografické informace
  • Údaje související s polohami zákazníků
  • Záznamy prodeje a zákaznické podpory a přepisy hovorů
  • Zákaznické recenze na sociálních sítích nebo recenzních platformách
  • Všechny typy zpětné vazby poskytované zákazníky na vyžádání (průzkumy, následné e-maily atd.)

 

Příprava a předzpracování dat

V přípravné fázi bude třeba připravit nezpracovaná data a převést je do formátu vhodného ke zpracování systémem ML. Jinak řečeno, datové body by měly být strukturovány podle stejné logiky a specialisté se musí zbavit všech nesrovnalostí.

 

Co zahrnuje proces předběžného zpracování dat:

  • Jedním z prvních kroků je extrakce funkcí, která eliminuje irelevantní informace a tím zmenšuje počet proměnných, tedy atributů, jež ovlivňují konečné výsledky ve strojovém učení.
  • Následuje stanovení sady funkcí, které popisují vztah mezi zákazníkem a poskytovanou službou. Jinými slovy, tyto funkce musí popisovat pozorování, na kterých budou algoritmy ML založeny, aby dokázaly předpovědět pravděpodobnost odchodu zákazníků. Může to být například rozdělení podle věku (mladší vs. starší) nebo rozdělení nákladů na pojištění vzhledem k průměrnému platu uživatele.
  • Revizí všech extrahovaných funkcí je pak třeba vybrat pouze ty, které nejvíce korelují s odchodem zákazníků. Tímto způsobem specialisté získají datovou sadu s nejdůležitějšími funkcemi.

 

Modelování a testování

V každém takovém projektu jde o vlastní vývoj modelu predikce odchodu. Specialisté obvykle testují několik modelů, než učiní konečné rozhodnutí. Také vytváření modelu ML vždy vyžaduje několik iterací: specialisté musí ladit parametry, vyhodnocovat a monitorovat výkon. Cílem je stav, kdy je patrné, že model vytváří nejpřesnější předpověď odchodu zákazníků na základě testovaných dat.

 

Případové studie ukazují různé výsledky a fungování algoritmů ML, pokud jde o predikci odchodu zákazníků. Výzkum v oblasti pojišťovnictví ale ukazuje, že neuronové sítě a algoritmus „Random Forests” patří mezi nejúčinnější techniky ML s přesností více než 90 %. Existují ještě přesnější modely, kde se přesnost blíží 95 %, jako je například Interval spolehlivosti (IS)

 

Zajímavé výsledky přináší rovněž využití techniky „Logistic Regression”. Případová studie jedné z velkých zdravotních pojišťoven v ČR prokázala, že model „Logistic Regression ” predikoval odchod zákazníků velmi přesně. Studie poskytla také důležité poznatky o korelaci mezi konkrétními proměnnými a odchodem zákazníků. Model odchodu sledoval vztah mezi mírou odchodu a kontaktním momentem, počtem pojištění, slevami, prémiemi atd.

 

Nasazení a monitorování

Posledním krokem je uvedení modelu predikce odchodu zákazníků do vývoje, což znamená otestovat jeho výkon a integrovat jej do současného systému. Specialisté by měli také pravidelně sledovat výkon modelu a v případě potřeby jej upravit, například v případě závažných změn dat.

 

Snižte odchod zákazníků pomocí našeho prediktivního a retenčního modelu

Pokud máte nějaké dotazy nebo potřebujete další vysvětlení, jak mohou techniky ML pomoci vaší pojišťovně snížit odchod zákazníků, napište nám. Rádi vás seznámíme s detailními možnostmi či naší nabídkou, která zahrnuje i zmíněný model Interval spolehlivosti.

 

Vladimír Ira