Název projektu
Aplikace zobecněných lineárních modelů v pojišťovnictví a ve financích
Kód
SP2015/75
Předmět výzkumu
Základními problémy při řízení individuálních rizik ve finančních institucích je jednak identifikace klíčových faktorů ovlivňujících úpadek (default) dlužníka či výskyt pojistné události a posléze měření intenzity těchto vlivů. Tyto činnosti jsou prováděny za účelem identifikace rizikových skupin klientů. Problematický je rovněž odhad a posléze předpověď okamžiku vzniku možného nežádoucího stavu (pojistná událost, default firmy aj.). Jsou-li však nalezeny vhodné individuální faktory, lze na základě vhodných ekonometrických modelů stanovit nejen adekvátní cenu produktu (úvěrového či pojistného), ale rovněž modelovat očekávanou ztrátu a v návaznosti na to kalkulovat kapitálový požadavek ke krytí ztrát vyplývajících z úvěrových či pojistných smluv.
Projekt je sice zaměřen do dvou aplikačních oblastí, avšak obě využívají stejná teoretická východiska a stejnou metodologii. Proto bude v projektu řešeno modelování defaultu firmy a modelování velkých ztrát v rámci pojišťovnictví.
Aplikace v pojišťovnictví
V pojišťovnictví je možné využít koncept zobecněných lineárních modelů (GLM) při modelování pojistných nároků u jednotlivých pojistných smluv, a to na bázi individuálních charakteristik (rating factors), přičemž je zde možné rozdělit takový model na model četnosti pojistných událostí (claim frequency) a na modely výše pojistné události spojené s danou smlouvou (claim severity). A právě druhé části je věnován tento projekt. Pro modelování výše pojistné škody lze použít regresní model z konceptu GLM za předpokladu gamma rozdělení (gamma model). Ovšem na dosavadních studiích již bylo prokázáno, že toto rozdělení není vhodné, neboť nejsou jimi buď v dostatečné míře zohledněny extrémní ztráty, nebo naopak nedostatečně zohledněny ztráty malé. Tento nedostatek byl již částečně vyřešen využitím teorie velkých ztrát, konkrétně přístupem „Peak over the threshold“. Byla určena prahová proměnná, jíž byly ztráty rozděleny na malé (střední) a velké (extrémní). Pro malé ztráty byl na bázi individuálních charakterisik odhadnut gamma model zachycující malé pravděpodobnosti malých ztrát a pro velké ztráty byly na bázi kolektivního rizika odhadnuty parametry Paretovského rozdělení. Jak bylo dosavadní studií prokázáno, jakkoliv je toto řešení lepší než předchozí, toto smíšené rozdělení pravděpodobnosti není zcela vyhovující, a to především z důvodu subjektivně stanovené prahové proměnné a právě kolektivního modelu velkých ztrát společného pro všechny smlouvy bez ohledu na skutečnost, že každá smlouva přispívá k velkým ztrátám rozdílně.
Cílem projektu je tedy odhadnout regresní model pro velké ztráty, jehož parametry by byly určeny právě individuálními charakteristikami jednotlivých pojistných smluv a zjistit, zda takovýto přístup umožňuje přesnější odhady než smíšený model kombinující individuální a kolektivní rozdělení pravděpodobnosti. V rámci příprav projektu se počítá s experimentováním především na regresním modelu na bázi exponenciálního a paretovského rozdělení, přičemž oba přístupy budou porovnány na reálných datech pojistného portfolia havarijního pojištění v České republice.
Aplikace ve financích
Jedním z problémů, na které budou nové přístupy aplikovány, bude predikce úpadku (defaultu). V rámci projektu bychom se rádi zaměřili na dva problémy, které jsou víceméně opomíjeny. Zatímco je ve financích pozornost zaměřena spíše na pravděpodobnost defaultu pomocí diskriminační analýzy a logistické regrese, pohled na odhad okamžiku, ke kterému dojde k defaultu je spíše opomíjen. Čas od uzavření smlouvy či založení podniku není obvykle respektován. V navrhovaném projektu budou použity méně používané přístupy, ve kterých budeme pracovat s časovou proměnnou, což umožňuje modelovat např. dobu do defaultu u úvěru nebo dobu do předčasného splacení úvěru či hypotéky, což lze následně využít při plánování ztrát nebo kapitálových požadavků v čase. Chceme se podívat na default z jiného pohledu, z pohledu časového, a aplikovat tzv. modely doby trvání (duration modely), jež jsou postaveny např. na exponenciálním rozdělení pravděpodobnosti. Jedním z přístupů, které budou na daný problém aplikovány, bude analýza přežití (survival analysis). Jedná se o alternativní přístup k tradičním metodám, jejichž hlavním východiskem je Altmanův Z-score model (1968) a které využívají zejména logistickou regresi, diskriminační analýzu nebo umělé neuronové sítě. Analýza přežití k modelování kreditního rizika je přístupem, který byl poprvé publikován Narainem (1992). Pomocí této analýzy je možné modelovat dobu do defaultu dlužníka, např. od okamžiku poskytnutí úvěru. K odhadu pravděpodobnosti defaultu (PD) lze vyžít parametrické či semiparametrické modely, běžně používanými přístupy jsou Coxův proporcionální hazardní model, zobecněný lineární model a neparametrický regresní model.
Cílem projektu je zaměřit se na aplikaci zobecněných lineárních modelů a pomocí analýzy přežití odhadnout model k predikci defaultu. Při aplikaci analýzy přežití předpokládáme, že se v určitém okamžiku v budoucnosti dostane každý subjekt (klient, firma) do defaultu. Obvykle ovšem o subjektu nemáme k dispozici kompletní informace, a to z toho důvodu, že jej můžeme pozorovat jen během určitého časového okamžiku. Během této doby může nebo nemusí nastat default, popřípadě subjekt dále nebude součástí uvažovaného souboru dat (např. ukončí úvěrovou smlouvu), proto je nutné pracovat s cenzorovanými daty. Při modelování pravděpodobnosti defaultu vycházíme jak z informací o subjektech (endogenní proměnné), tak můžeme použít různé indikátory ekonomického cyklu (exogenní proměnné).
Jsme si vědomi případné heterogenity jednotlivých pozorování, proto má tato být rozšířena na Pareto regresi. U defaultu bude muset dojít nejdříve k identifikaci klíčových faktorů, u pojišťovnictví jsou víceméně známy a tyto budou pouze ověřeny, viz vstupní data.
Postup řešení:
Vzhledem k tomu, že dostupný ekonometrický či matematický software neumožňuje odhad Paretovské regrese, případně exponenciální, bude v první části projektu nutné vyřešit odhad parametrů těchto modelů metodou maximální věrohodnosti, a to pomocí iteračního postupu (pravděpodobně Newton-Raphson algoritmus či EM). Pro tento účel se počítá s napsáním vlastní funkce v prostředí Matlab, a to augmentací již dříve napsaných funkcí použitých na jiných projektech.
V druhé části projektu budou identifikovány faktory ovlivňující default či pojistnou událost. V případě finanční aplikace budou identifikovány ukazatele finanční analýzy statisticky významných pro modelování a predikci defaultu, v rámci pojišťovnictví bude statistická významnost faktorů pouze ověřena, tj. zda mohou být použity i v rámci těchto regresní modelů.
K modelování defaultu bude použita tzv. analýza historie události, která patří mezi metody statistického hodnocení rozdělení časů specifikovaných událostí. Jak uvádí Hendl (2009), jedná se o oblast zabývající se studiem pohybu subjektů v čase mezi určitými stavy. Častěji se tento přístup označuje jako analýza přežití, popř. přežívání (survival analysis), což pramení z původního využití této metody v oboru medicíny. Dnes se tento přístup používá v mnoha oborech včetně ekonomie, přičemž v oblasti financí se tento přístup aplikuje zejména na analýzu defaultu (bankrotu). Významnou roli zde hraje cenzorování, což znamená, že některé události nastanou až po okamžiku skončení sledování jedince (studie skončila nebo jedinec přestal být sledován). K popisu rozdělení náhodného chování časů přežití použijeme funkci přežití (survival function), která udává pro čas t pravděpodobnost přežití jedince. Predikce doby přežití na základě vstupních proměnných je analogické použití logistické regrese, hlavním rozdílem je použití cenzorovaných dat. Dalším rozdílem je, že na rozdíl od logistické regrese budeme analyzovat dobu mezi danými událostmi (Tabachnik, Fidell, 2007).
Dále bude v obou aplikačních oblastech experimentováno s vhodností použití exponenciální regrese, nebo zda je dosahováno lepších výsledků s modelem na bázi Paretova rozdělení. Modely budou především vnitřně validovány pomocí bootstrappingu. V rámci pojišťovnictví bude tedy na reálných datech modelována velikost škody (gamma-exp nebo gamma-pareto modelem), přesnost obou modelů bude porovnána a vyhodnocena vzhledem k výsledkům původních modelů (gamma model a smíšený gamma-pareto model). Rovněž bude vyhodnocen vliv modelů na očekávané rozdělení pravděpodobnosti pojistných nároků u každé smlouvy.
V rámci poslední části projektu budou jednotlivé pojistné škody simulovány v čase za účelem konstrukce rozdělení pravděpodobnosti celkové ztráty (škody) celého pojistného portfolia a propočítány kapitálové požadavky odpovídající jednotlivým modelům. Rozsah simulace pro finanční aplikace bude provedena v dostatečném rozsahu s důrazem na minimalizaci simulační chyby (minimálně 100,000 scénářů), u pojistné aplikace bude nezbytné pro zkrácení strojového času použit techniky na snížení rozptylu simulací (např. latin hypercube sampling). Získané výsledky budou porovnány a vyhodnoceny.
Tvorba vlastní funkce pro odhad parametrů exponenciální a paretovské regrese bude provedena v programu Matlab. Dále budeme využívat program Stata, popř. PASW Statistics (Survival Analysis).
Základní literatura:
ALTMAN, E. I. Financial Ratios, discriminant analysis and the prediction of corporate bankruptcy. In Journal of Finance, 1968. Vol. XXIII, No. 4. P. 589-609.
CLEVES, M., GUITIERREZ, R. G., GOULD, W. and Y. V. MARCHENKO. An Introduction to Survival Analysis Using Stata. College Station: Stata Press, 2010. ISBN 978-1-59718-074-0.
FREES, E.W. Regression Modeling with Actuarial and Financial Applications. New York: Cambridge University Press, 2010. ISBN 978-0-521-13596-2.
NARAIN, B. Survival Analysis and the Credit Granting Decision. In: Thomas, L. C. – Crook, J. N. – Edelman, D. B. (eds): Credit Scoring and Credit Control. Oxford, Oxford University Press, 1992, pp. 109-122.
HENDL, J. Přehled statistických metod. Analýza a metaanalýza dat. Praha: Portál, 2009. ISBN 978-80-7367-482-3.
JONG, P. de and HELLER, G.Z. Generalized Linear Models for Insurance Data. Cambridge: Cambridge University Press, 2008. ISBN 978-0-521-87914-9.
OHLSSON, E. and JOHANSSON, B. Non-Life Insurance Pricing with Generalized Linear Models, EAA Series. Springer, Berlin, 2010. ISBN 978-3-642-10790-0.
TABACHNIK, B. G. And FIDELL, L. S. Using Multivariate Statistics. Boston: Pearson Education, 2009. ISBN 0-205-45938-2.
Vstupní data:
Pro odhad vybraných modelů byla v oblasti neživotního pojištění vybrána oblast havarijního pojištění, u něhož byly vybrány faktory, které lze rozdělit do následujících skupin, a to (1) charakteristiky pojištěného vozu; (2) charakteristiky řidiče (pojistníka); (3) charakteristiky prostředí provozování vozidla. Dále je známa četnost havárií u jednotlivých smluv a velikost jednotlivých škod. Datový vzorek zahrnuje informace o jednotlivých pojistných smlouvách a pojistných událostech a obsahuje asi 220.000 smluv z let 2005-2010.
Pro odhad defaultu společnosti bude použita databáze firem, které během vybraného pozorovaného období vyhlásily úpadek a firem, které v daném období neměly existenční potíže do té míry, aby na ně byl podán návrh na konkurz či zahájení insolvenčního řízení. Při vytvoření databáze budeme vycházet z již dostupných dat z minulých let, z databáze Magnusweb a dalších zdrojů.
Úloha studentů v projektu:
Úloha studentů magisterského programu je zde především podpůrná. Jejich hlavním úkolem je příprava a zpracování poskytnutých dat a řešení diplomového tématu na dílčí problematiku, jde zejména o odhad využitím vytvořených funkcí a o následnou aplikaci odhadnutých modelů na různé datové vzorky a napomoci tak k jejich validaci.
Časový harmonogram:
Leden – březen: Tvorba vlastní funkce v prostředí Matlab pro odhad parametrů exponenciální a paretovské regrese. Testování vytvořené funkce na malém vzorku. Sběr a příprava dat k modelování kreditního rizika.
Duben – červen: Identifikace/ověření faktorů pro model (publikace), ověření modelů na reálných datech (publikace). Odhad modelu pomocí analýzy přežití (publikace). Aktivní účast na konferenci Evropské finanční systémy.
Červenec – září: Odhad mixed modelu gam-exp a gam-par, ověření a simulace (publikace). Validace modelů. V září aktivní účast na konferenci Matematické metody v ekonomii a Finanční řízení podniků a finančních institucí.
Říjen – prosinec: Aktivní účast na konferenci Aktuárska veda v teórii a praxi, Conference on Finance and Banking. Ukončení projektu.
Rok zahájení
2015
Rok ukončení
2015
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Kategorie
SGS
Typ
Specifický výzkum VŠB-TUO
Řešitel