Statistik 2

Emnet statistik har med den nye reform i gymnasiet fået en mere fremhævet position end hidtil, og har derfor fortjent at blive præsenteret. Jeg takker flere virksomheder fordi jeg måtte besøge dem, og de ville fortælle mig, hvordan statistik anvendes hos dem. Det har været meget lærerigt! Stoffet strækker sig over flere sider, så jeg har lavet et lille navigationspanel nedenfor. Der er ikke nogen systematisk rækkefølge i de matematiske emner. I stedet er de præsenteret i den rækkefølge de naturligt optrådte.


Virksomheder og institutioner

  1. Danmarks Statistik
  2. TNS Gallup
  3. Novo Nordisk
  4. Tryg Forsikring

Matematiske temaer og personer

  1. Stikprøver
  2. Variansanalyse
  3. Poisson fordelingen
  4. Poisson Processer
  5. Den sammensatte Poisson-fordeling og ruin modeller


Tryg Forsikring

En af de matematikanvendelser, som længe har vakt min nysgerrighed, er  forsikrings-matematik. Det var derfor med glæde, at jeg i sommeren 2006 kunne lave en aftale om at besøge forsikringsselskabet Tryg i deres hovedsæde i Ballerup i Københavnsområdet. Hovedsædet ligger på et stort grønt område med bygninger i pæne rødbrune mursten. Historisk set er Tryg Forsikring et resultat af diverse opkøb og fusioner af forskellige forsikringsselskaber. Det hele startede i 1728, hvor en fjerdedel af København gik op i flammer. Det resulterede i, at der voksede et ønske frem om at man kunne spare op i fællesskab for at sikre sig mod fremtidige ulykker. Herved stiftedes i 1731 Kjøbenhavns Brand, som altså senere blev til Tryg Forsikring. Navnet Tryg dukkede for første gang op i 1911. Tryg i Danmark er i øvrigt en del af et større foretagende kaldet TrygVesta, som opererer i Skandinavien. TrygVesta beskæftiger i skrivende stund ca. 3700 medarbejdere, heraf knap halvdelen i Danmark.

Tilbage til mit møde. Tryg havde endda sørget for, at der var to personer tilstede under interviewet, Willie Høger og Ulrik Andersson, begge aktuarer i Tryg, og de var godt inde i stoffet. I et møde, som varede i over to timer, kom vi ind på mange aspekter af forsikringsbranchen og uddannelsen til aktuar. Willie Høger og Ulrik Andersson gjorde det fra starten klart, at man i forsikringsbranchen skelner mellem skadesforsikring og livsforsikring/pension. Tryg er en del af TrygVesta koncernen og er et skadesforsikringsselskab, men sælger som følge af et strategisk partnerskab med Nordea Liv&Pension også livsforsikringer og pensionsprodukter. Nordea Liv&Pension har også til huse i Ballerup sammen med Tryg. Som det fremgår af figuren nedenfor, så har både liv/pension og skadesdelen en financiel komponent, hvormed menes, at forsikringsselskabet har en afdeling, som tager sig af at optimere afkastet af kundernes indbetalte præmier, der kan opfattes som et slags "forskud" til en eventuel senere udbetaling af livsforsikring/pension eller en skade. Hvordan kapitalen anbringes i aktier og obligationer er af stor vigtighed, og fordelingen af investeringerne skal give firmaet den nødvendige sikkerhed, ligesom den skal tilfredsstille kontrollen i Finanstilsynet. Genforsikring er her også et tema. Udover forvaltningen af kapitalen, så skal man analysere befolkningens levealder statistisk med henblik på at kunne fastsætte en fornuftig præmie. Endelig har skadesdelen af virksomheden behov for at analysere og estimere omfanget af skader.
 


Man kan bygge en del matematik op på den financielle del - fx har man begrebet tidsserier i forbindelse med udviklingen af aktiekurser - men det er især skadesanalysen, som involverer den mest varierede matematik. Det kommende vedrører skadesanalysen, og det er da også her Willie og Ulrik hører til.
 

Uddannelsen til og arbejdet som aktuar

Jeg fik bekræftet min forestilling om, at uddannelsen til aktuar er en af de mere hardcore matematiske, samt at stillingen som aktuar er overordentlig velbetalt. Men der er ikke blot én uddannelse, som kan føre til ansættelse som aktuar. Der er godt nok et decideret aktuar-studium på Københavns Universitet, men også matematikere, statistikere og matematik-økoner fra universiteterne arbejder som aktuarer i det private. Men også andre kan gøre sig kvalificerede til at blive aktuarer, fx civilingeniører, var Willie og Ulrik ivrige efter at fortælle. Der er i forsikringsbranchen stor rift om at få fat i de rigtige folk - området kan aftage flere end der bliver færdiguddannet. Det er helt almindeligt, at studerende på et tidspunkt kommer i praktik i et forsikringsselskab inden studiet er færdiggjort. Udover en kærkommen indtjening giver det også et godt indtryk af det kommende arbejde. For personer med de rigtige evner kan stillingen som aktuar også undertiden benyttes som et springbræt til en lederuddannelse, hvis det er det man måtte ønske. Som vi skal se små smagsprøver på senere, så er der i uddannelsen en del abstrakt matematik, særligt statistik og sandsynlighedsregning. Med den teoretiske - herunder matematiske - ballast bliver man i stand til at gennemskue de ret komplekse problemstillinger, man kommer ud for i det praktiske arbejde med at analysere og udarbejde forsikringer. Og man forstår bedre de mekanismer, som virker.
 

Nogle udvalgte begreber og problemstillinger

Hvordan man strikker en forsikring sammen med betingelser etc. er væsentlig for forsikringsselskabet. På figuren nedenfor er vist et tænkt eksempel, hvor to forskellige forsikringsselskaber afgiver et forsikringstilbud på en boligforsikring. I den ene (A) betaler man en fast præmie uanset boligens størrelse, mens præmien hos det andet selskab (B) er proportional med boligens areal. Sidstnævnte er mest fornuftig, for det vil højst sandsynlig ende med, at familer med store boliger vil vælge selskab A, hvilket vil medføre, at dette selskab kommer til at hænge på udbetalinger af store erstatninger.


En anden vigtig problemstilling er overvejelser over, hvor store hensættelser forsikringsselskabet skal foretage, for at kunne betale erstatninger for udeståender. Herunder kommer de pådragede skader, som allerede er forekommet, men som endnu ikke er anmeldt (Incurred But Not Reported - IBNR) eller de skader, der er anmeldt, men som endnu ikke er afsat med korrekt beløb (Incurred But Not Enough Reported - IBNER). Hvad angår sidstnævnte, så kan der både være skader, som er afsat med et for højt eller et for lavt beløb. I den forbindelse betragtes den såkaldte afløbstrekant (Run-off Triangle eller Triangle of Claims). Der er flere variationer af den. På figuren nedenfor betragter vi udviklingen af de akkumulerede skadesanmeldelser i et antal år efter skadeåret. For nemheds skyld betegner vi skadeårene med 1, 2, 3, ... Det kunne for eksempel svare til årene 2001, 2002, 2003, ... Herudover er der udviklingsår, som angiver antallet af år efter skaden skete. I første række på figuren angiver X10 altså det beløb, som er udbetalt i skadeåret 1. X11 angiver det samlede beløb, som er blevet udbetalt i skadeåret 1 og året efter. X34 angiver det samlede beløb, som er blevet udbetalt i skadeåret 3 frem til og med 4 år efter skadeåret. Normalt vil beløbene i række 1 konvergere mod et fast tal, da skaderne fra skadeår 1 efterhånden vil være anmeldt og fuldt ud behandlet.  Ideelt set bør "grænseværdien" være mindre end det indbetalte beløb (præmien), så forsikringsselskabet har tjent på kunderne. Der kan være stor forskel på, hvor hurtigt tallene i en række konvergerer. I tilfældet med bygningsbrande akkumulerer erstatningerne hurtigt, mens ansvarsskader i autoforsikringer akkumulerer over en lang årrække. Derfor må man også foretage afløb for hver branche for sig.

Tilbage til afløbstrekanten nedenfor. Værdierne i den gule trekant er kendte, da udbetalingerne er foretaget. Værdierne i den røde diagonal angiver de beløb, som indtil dette år er udbetalt for skader sket i de respektive skadeår. Men hvordan vil det udvikle sig i fremtiden? Hvor store hensættelser skal man foretage? Skal præmien reguleres for at kunne dække erstatningerne? Et sådant spørgsmål kræver, at man forsøger at estimere de øvrige felter i skemaet. Hvis alt udviklede sig ideelt og ensartet, kunne man forestille sig, at den fremskrivningsfaktor, der beskriver fremskrivningen af den akkumulerede skadeserstatning fra udviklingsår 0 til udviklingsår 1, er den samme for alle skadeår! Og at det samme kunne siges om udviklingen fra udviklingsår 1 til udviklingsår 2, blot med en ny fremskrivningsfaktor. etc. etc. Det kunne for eksempel tænkes, at den akkumulerede skadeserstatning voksede med 23% fra udviklingsår 0 til udviklingsår 1, uanset hvilket skadeår, der er tale om. Når man går et skridt mod højre fra søjle 0 til søjle 1, skal man altså gange værdierne med fremskrivningsfaktoren 1,23. I udviklingen fra udviklingsår 1 til udviklingsår 2 kunne det være, at man skulle gange med fremskrivningsfaktoren 1,16, svarende til en vækst på 16%, etc. Det er denne idé, som ligger bag metoden Chain Ladder. Hvis der ikke indtræffer væsentlige regelændringer eller ikke sker nogen ændringer i folks adfærd, så er dette en rimelig grovmodel. Imidlertid er virkeligheden ikke helt så systematisk: Rene tilfældigheder betyder, at fremskrivningen fra et udviklingsår til et andet kan være særlig stor eller lille i et givet skadeår. Når man forsøger at forudsige, dvs. estimere, de kumulerede erstatninger i den nederste ukendte trekant, så kan man dog mindske usikkerheden ved at inddrage alle de skadeår, hvor udviklingerne er kendte. Lad os se på et eksempel: Lad os sige, at vi ønsker at estimere den stadig ukendte kumulerede erstatning X43. Estimatet angives med en "hat" over! Her vil vi gøre brug af, at vi kender udviklingen i den kumulerede erstatning fra udviklingsår 2 til udviklingsår 3 for alle de tre første skadeår. En god "gennemsnitlig" værdi for fremskrivningsfaktoren fra udviklingsår 2 til udviklingsår 3 fås ved udtrykket f3 (med hat over) angivet nedenfor. Estimatet for X43 fås nu nemt: Man ganger den netop udregnede fremskrivningsfaktor på den kendte værdi X42. Nedenfor kan du også se, hvordan man estimerer den næste værdi i samme række, dvs. X44.

   

Inflation bør naturligvis også indregnes. Vi vil ikke komme ind på detaljer her. For at få et mål for, hvor meget en fremtidig kumuleret skadeserstatning kan tænkes at afvige fra den ved Chain Ladder metoden estimerede værdi, benytter man mean square error analyse. Det vil også føre for vidt at komme ind på det her. Til slut skal det lige nævnes, at især store skader er noget, der kan gøre det svært at forudsige skemaets fremtidige udvikling. Man kan i øvrigt sige, at man interesserer sig for udviklingsår frem til den situation, hvor den akkumulerede erstatning har nået den endelige erstatning. Chain Ladder metoden er en nyttig metode og kombineret med forskellige statistiske metoder, dygtighed og sund dømmekraft kan en aktuar finde ud af, hvor meget der skal hensættes ...



I det følgende skal vi se nogle smagsprøver på noget forsikringsmatematik: Et af de matematiske hovedområder indenfor forsikringsbranchen er naturligvis sandsynlighedsregning og statistik, og særligt det underområde, som har at gøre med stokastiske processer kommer i sving. Her indtager den såkaldte Poisson proces en vigtig rolle. Derfor vil vi nedenfor se på dens oprindelse og de helt specielle egenskaber, der gør, at den naturligt dukker op i forsikringsbranchen. Poisson processen er et slags teoretisk fikspunkt her. Poisson processen er imidlertid ikke fuldstændig velegnet til at beskrive den måde, hvorpå realistiske dagligdags skadesanmeldelser ankommer på. Derfor foretager man modifikationer af Poisson processen, som gør modellen mere fleksibel og i overensstemmelse med virkeligheden. En generalisation af den homogene Poisson proces er den såkaldte renewal proces. Den tillader, at man har at gøre med flere forskellige typer ventetidsfordelinger - altså fordelinger over ventetiden mellem skadesanmeldelser (se senere).

Før vi går over til det mere matematiske, vil jeg til slut rette en stor tak til Willie Høger og Ulrik Andersson for at byde mig velkommen hos Tryg og tage sig tid til at fortælle mig om deres arbejde. Desuden en tak for, at de læste mit indlæg ovenfor om Tryg igennem for fejl. For læsere, som er interesseret i at vide mere om en aktuars arbejde, vil jeg henlede opmærksomheden på en hjemmeside, som der er link til nederst på siden under punktet Links. Se øverste link her. På hjemmesiden kan man studere interviews af forskellige aktuarer.
 

Simeon Denis Poisson

Simeon Denis Poisson (1781-1840) er en blandt mange af de store franske matematikere, som levede i tiden omkring den franske revolution. Hans fader arbejdede i den franske hær - en institution, hvor der var god mulighed for at avancere og nyde privilegier. Imidlertid blev faderen modarbejdet af folk med højere rang. Efter at have trukket sig tilbage fra aktiv tjeneste, fik faderen en mindre agtværdig administrativ stilling, som han besad på tidspunktet, hvor hans søn Denis blev født. Flere af Denis' ældre brødre og søstre overlevede ikke den tidlige barndom. Måske derfor sørgede moderen for, at en sygeplejerske tog sig godt af lille Denis. Faderen havde en stor indflydelse på sin søn og afsatte tid til at undervise ham i at læse og skrive. I det hele taget brugte familien megen tid og energi på at hjælpe sønnen godt i gang med livet. Faderen mente, at den medicinske profession ville kunne give sønnen en sikker fremtid. Efter at have været i praktik hos en onkel, som var kirurg, måtte han dog opgive denne livsvej, da det viste sig, at hans motorik var alt for ukoordineret. En mangel, som også senere skulle hæmme ham, når han skulle tegne matematiske diagrammer etc. Man må dog formode, at det ikke har været noget stort tab for Denis at måtte opgive lægegerningen, for han havde ikke nogen interesser heri! I 1796 blev Denis sendt til École Centrale i Fontainebleau. Her viste han, at han besad store akademiske evner, især i matematik. Hans lærere var ekstremt imponerede og opfordrede ham til at deltage i optagelsesprøven til Ecole Polytechnique i Paris - en institution, som utallige af den tids store videnskabsmænd var blevet uddannet på. Han opnåede topscore, på trods af, at han ikke havde været igennem den samme skoling, som de fleste unge mænd. Han begyndte at studere matematik på Ecole Polytechnique i 1798 og det foregik med stor entusiasme og flid. Alligevel fandt han dog også tid til at gå i teater og nyde andre sociale aktiviteter i Paris. Hans lærere, som var ingen mindre end Lagrange og Laplace, opdagede hurtigt Denis' talent for matematik. De skulle senere blive venner for livet med deres unge elev, og de støttede ham på forskellig vis. I sit sidste studieår udfærdigede han en artikel af så høj kvalitet, at han blev tilladt at dimittere, uden at deltage i den endelige eksamen. Poisson avancerede hurtigt i systemet og i 1806 blev han udnævnt til professor på Ecole Polytechnique efter Fourier. I 1808 blev han tillige udnævnt til astronom ved Bureau des Longitudes, og han fik i 1809 endda en position i mekanik i det nyligt oprettede Faculté des Sciences. I 1817 giftede han sig med Nancy de Bardi. Ved siden af ægteskabet bestred han et imponerende antal hverv.

Han startede ikke nye teorier selv, men havde en slags forkærlighed for at kaste sig over uløste problemer, først behandlet af andre. Han publicerede mellem 300 og 400 artikler indenfor matematik, matematisk fysik og astronomi. Af fysik-emner han studerede fra en matematisk synsvinkel kan nævnes, elasticitet, potentialteori, mekanik, himmelmekanik (Celestial Mechanics), elektromagnetisme, elektrostatik, lydens hastighed i gasser og varmeudbredelse. Han har lagt navn til adskillige begreber, herunder Poisson's equation i potentialteori, Poisson's brackets i differentialligningsteori, Poisson's ratio i læren om elasticitet, Poisson's constant i elektromagnetisme, og det han nok er mest kendt for: Poisson-fordelingen i sandsynlighedsregningen. Han var kendt som en eminent lærer og instruktor. Det hævdes, at han skal have udtalt følgende: "Livet er kun godt for to ting, at opdage matematik og undervise i matematik".

 

Poisson fordelingen

Normalfordelingen er ubestridt den fordeling, som benyttes mest i statistikken, men på en af de næste pladser finder vi den såkaldte Poisson fordeling. Til grund for begge fordelinger ligger i princippet den fundamentale fordeling, der går under navnet binomialfordelingen. Dens fundamentale natur består i, at dens udgangspunkt er så generel: Man har at gøre med et basiseksperiment, som har to mulige udfald: Enten får man succes eller også fiasko. Sandsynligheden for succes er p og sandsynligheden for fiasko dermed (1-p). Man udfører nu basiseksperimentet n gange og er interesseret i, hvor mange gange man får succes. Under forudsætning af, at udfaldene af de enkelte basisekspeimenter er uafhængige, kan man nemt vise, at sandsynligheden for, at basiseksperimentet lykkes i alt r gange er lig med:

Et godt eksempel på en anvendelse er i terningekast. Sandsynligheden for at få netop 7 femmere ved 20 kast med en terning er:

Et andet eksempel kunne være følgende: Et hospital ligger i et område, hvor der bor 14000 ældre. Undersøgelser har vist, at chancen for at en given ældre person får et hjertetilfælde på en given dag er lig med 1:8000. Hvad er sandsynligheden for, at hospitalet på en given dag får mindst 3 ældre til behandling for hjertetilfælde? For det første ser vi, at betingelserne i binomialfordelingen er opfyldt. Basiseksperimentet er, at en ældre person observeres for hjertetilfælde. Basissandsynligheden er p = 1/8000 og basiseksperimentet udføres i alt n = 14000 gange. Bemærk, at sandsynligheden for mindst 3 hjertetilfælde kan beregnes ved at finde sandsynlighederne for netop 0 hjertetilfælde, netop 1 hjertetilfælde og netop 2 hjertetilfælde og trække dem fra 1:

Dette er udregnet ved hjælp af lommeregner! For omkring 200 år siden havde man ikke elektroniske apparater til rådighed, man måtte benytte hånden i kombination med tabeller. Ovenstående ville da kræve et stort regnearbejde. Det førte til, at man ledte efter approksimationer til binomialfordelingen.  Det lykkedes ikke at finde tilnærmelser i det generelle tilfælde, men i specialtilfældet, hvor  p er lille og n er stor, så viste den eminente franske matematiker og fysiker Simeon Denis Poisson (1781-1840) følgende:

eller sagt på en anden måde:

Udnyttes approksimationen i opgaven ovenfor fås, idet np = 14000/8000 = 1,75:

og dermed følgende værdi for sandsynligheden:

Ved at sammenligne med det rigtige resultat ovenfor ser vi, at der er tale om en ekstrem god approksimation!

 

I lang tid blev Poissons grænseværdi formel udelukkende benyttet til at approksimere binomial-sandsynligheder når n er stor og p lille - indtil den tyske professor Ladislaus von Bortkiewicz i 1898 i en artikel, Das Gesetz der Kleinen Zahlen, påpegede, at Poissons formel giver anledning til en sandsynlighedsfordeling i sig selv. Rækken af tal:

ligger nemlig alle mellem 0 og 1, og summen af dem er 1:

Poissonfordelingen er en såkaldt diskret fordeling, fordi udfaldsrummet er tælleligt: X kun kan antage værdier i mængden af ikke-negative tal: r = 0, 1, 2, 3, ... l er en parameter og den benævnes ofte intensiteten. Vigtigheden af denne nye fordeling hang naturligvis nøje sammen med mulige anvendelser af den. Her opdagede Bortkiewicz, hvis far var indenfor militæret, at antallet af soldater, som blev dræbt ved hestespark pr. år pr. preussisk hærkorps kunne beskrives bemærkelsesværdigt godt ved hjælp af Poisson-fordelingen. Men ikke bare i dette meget specielle tilfælde kom den nye fordeling til sin ret: Han kunne meget mere generelt sammenfatte, at begivenheder, der forekommer med lav frekvens i en population, følger Poisson-fordelingen, selv hvis sandsynlighederne for begivenhederne varierer. Bortkiewicz arbejdede i øvrigt med matematisk statistik med anvendelser i aktuar-videnskaben og politisk økonomi.  

På figuren nedenfor har jeg afbildet Poissonfordelingen for for tre forskellige værdier af l, nemlig 1, 5 og 10. Bemærk, at fordelingen kun er defineret for alle hele tal større end eller lig med 0. Af visuelle grunde er punkterne forbundet med rette linjer!
 

 

Poisson processer

I dette afsnit skal vi forsøge at forstå, hvorfor poisson-fordelingen er så succesfuld til at beskrive mange situationer fra den virkelige verden. Hidtil har vi blot set, at den i en ret speciel situation, hvor p er lille og n er stor, kan benyttes til at tilnærme binomialfordelingen. Før vi går i gang, vil det være hensigtsmæssigt at have et eksempel at tænke på. Et klassisk eksempel er at måle antallet X(t) af a-partikler udsendt fra en radioaktiv kilde i løbet af tidsrummet fra 0 til t. Kilden antages at have en lang halveringstid, så kildens aktivitet kan antages konstant under forsøget. Man vælger et fast tidsrum fra 0 til t og foretager så gentagne målinger af tælletal i dette tidsrum. Man vil ikke få det samme hver gang, da radioaktive henfald er styret af sandsynligheder: Der er en bestemt sandsynlighed pr. tidsenhed for at en radioaktiv kerne henfalder. Nogle gange vil der i tidsrummet af længde t måske være 10 tællinger, andre gange 12, 23 eller måske 6. Spørgsmålet er, hvordan antallet af tællinger fordeler sig? Med hvilke frekvenser kan vi forvente at få 0, 1, 2, 3, ... osv. tællinger i det faste tidsrum af længde t? Vi kan gøre os et teoretisk tankeeksperiment: Inddel tidsrummet i n lige store dele. Vi antager, at vi kan vælge n så stor, at hvert lille tidsinterval af længde t/n højst kommer til at indeholde én tælling!

På figuren ovenfor skal den røde prik i et tidsinterval symbolisere, at der forekom netop 1 tælling i dette tidsinterval, mens der ingen tælling forekommer i de intervaller, der er tomme. Vi er nu i en situation, hvor vi kan gøre brug af binomialfordelingen: I hvert af n intervaller spørger man, om der er en tælling (succes) eller ingen tælling (fiasko). Eksperimentet udføres n gange og sandsynligheden for succes er den samme i hvert interval, og hændelserne er uafhængige. Basissandsynligheden pn angiver sandsynligheden for, at der i et givet interval er en tælling. Idet intensiteten l angiver det gennemsnitlige antal tællinger pr. tidsenhed må vi have lt = npn (overvej!). Dermed er pn = lt/n. Lader vi antallet n af delintervaller gå mod uendelig og dermed basissandsynlighederne mod 0, kan vi benytte Poissons grænseformel for binomialsandsynlighederne:

hvilket giver følgende udtryk for den homogene Poisson proces, som angiver sandsynligheden for r hændelser i tidsrummet fra 0 til t:

hvor vi har indikeret, at vi har at gøre med en stokastisk variabel, som afhænger af tiden t. Størrelsen X(t) angiver således antallet af hændelser i tidsrummet fra 0 til t. Vi ser, at vi faktisk får det samme, som man får ved at udskifte l med lt i Poisson-fordelingen ovenfor. l'erne betyder naturligvis noget forskelligt der! Udtrykket for den homogene Poisson proces kan også udledes differentielt udfra følgende fundamentale principper:

   Den homogene Poisson proces

  1. Sandsynligheden for, at en hændelse indtræffer i et givet interval, afhænger kun af intervallets længde og ikke af dets placering.

  2. Sandsynligheden for, at der i et tidsinterval af længde h indtræffer mindst én hændelse er lig med lh + o(h), hvor l er en positiv konstant.

  3. Sandsynligheden for, at der i et tidsinterval af længde h indtræffer mere end én hændelse, er lig med o(h). 
     

Her er o(h) en funktion, som går hurtigere mod 0 end h. Principperne ovenfor medfører nogle vigtige egenskaber for den homogene Poisson proces. Blandt andet er hændelser i disjunkte tidsintervaller uafhængige (Memorylessness), så fordelingen kan altså ikke "huske". En typisk udfaldsfunktion (realisation) for Poisson processen kan se ud som på figuren nedenfor.   

Som indikeret på den aktuelle udfaldsfunktion for Poisson processen ovenfor, så kan man også betragte tidsrummet imellem to hændelser.Ventetiden T er en stokastisk variabel, som kan vises at have en såkaldt eksponential fordeling med tæthedsfunktion:

En anden stokastisk variabel, man kan se på, er ankomsttidspunktet for den r'te hændelse, som vi vil betegne med Yr. Man kan vise, at tæthedsfunktionen for denne stokastiske variabel er givet ved

opkaldt efter danskeren Agner Krarup Erlang (1878 - 1929). Mens han arbejdede på Københavns Telefon A/S gjorde han nogle vigtige matematiske opdagelser indenfor teletrafikken, og de var med til at slå hans navn fast også internationalt. Ellers er han kendt for sine logaritmetabeller, som blev anvendt i stor stil indtil midten af 70'erne, hvor lommeregnere efterhånden tog over.

Poisson processer forekommer særdeles ofte. X(t) kan som nævnt være antal radioaktive partikler udsendt af et radioaktivt stof fra 0 til t. Det kan også være antallet af biler, som passerer et bestemt sted på en vejstrækning fra tiden 0 til t, eller antallet af ulykker indtruffet fra 0 til t. Eller antallet af telefonopkald til en central fra 0 til t. I forsikringsbranchen kunne det være antallet af skadesanmeldelser (claims) fra 0 til t. I flere af ovenstående eksempler må man dog ty til den såkaldte inhomogene Poisson proces (Engelsk: Non-homogeneous Poisson Process - NHPP), for at modellen bliver realistisk. I den inhomogene Poisson proces behøver intensiteten ikke være konstant over tid - i stedet for en konstant l, har man en tæthedsfunktion l(t), som varierer med tiden.

   Den inhomogene Poisson proces

  1. Processen har uafhængige tilvækster, hvormed menes, at tilvækster i disjunkte tidsintervaller er uafhængige.

  2. Sandsynligheden for, at der i tidsintervallet fra t til t+h indtræffer netop én hændelse er lig med l(t)h + o(h), hvor l(t) er en intensitetsfunktion.

  3. Sandsynligheden for, at der i tidsintervallet fra t til t+h indtræffer mere end én hændelse er lig med o(h).
     

Man kan udlede, at disse egenskaber giver følgende udtryk for sandsynligheden for, at der forekommer r hændelser i tidsrummet fra t1 til t2:

Hvis l(t) er en konstant, så ser vi, at sandsynligheden for, at netop r hændelser indtræffer i tidsrummet fra fra t1 til t2 kun afhænger af tidsrummets længde t2-t1, og så har vi at gøre med en homogen Poisson proces, idet den bliver stationær. Men normalt vil intensiteten altså variere med tiden!

Andre variationer over en Poisson proces til at beskrive antallet af skadesanmeldelser fra tiden 0 til tiden t er den såkaldte mixed Poisson Process, hvor man endvidere tildeler parametrene i Poisson-processen en stokastisk struktur. Det vil føre for videt at komme nærmere ind på dette her.

 

Den sammensatte Poisson proces og ruin modeller

Det er klart, at det ikke blot er antallet af skadesanmeldelser, som interesserer et forsikringsselskab. Også størrelserne af de enkelte udbetalinger er vigtige. Hvis vi lader Bk betegne beløbet, der udbetales for den k'te skadesanmeldelse, så vil

angive det totale beløb, som er udbetalt i tidsrummet fra 0 til tiden t. Beløbene Bk kan endvidere opfattes som uafhængige stokastiske variable med den samme fordeling (severity distribution) og de er også uafhængige af den stokastiske variable X(t), som er en Poisson proces. Det resulterer alt i alt i en sammensat Poisson proces (compound Poisson Distribution). I det næste skridt kunne man være interesseret i at undersøge forsikringsselskabets samlede kapital K(t) som funktion af tiden:

hvor u angiver forsikringsselskabets kapital til tiden 0 og c angiver præmieindbetalingen pr. tidsenhed. I modellen tages der altså højde for startkapitalen og det antages, at præmierne indløber lineært med tiden. Disse to komponenter tæller positivt i regnskabet, hvorimod skadesudbetalingerne bidrager negativt. I forlængelse af grafen for Poisson-processen ovenfor, kunne en udfaldsfunktion for den stokastiske variabel K(t) komme til at se således ud:

Dette er naturligvis en simplificeret model af virkeligheden. Modellen tillader ikke at præmierne undervejs ændrer sig, ej heller tillades det, at risiko betingelserne såsom ændringer i lovgivningen eller i den generelle økonomi. Sidstnævnte kunne influere på antallet af rapporterede skader og størrelsen af erstatningerne. Det tillades heller ikke, at firmaet iværksætter foranstaltninger, hvis en konkurs truer. I modellen er heller ikke taget højde for, at forsikringsselskabet har andre driftsudgifter eller har en indtjening fra investeringer. Modellen giver altså kun anvendes til at give et mål for den rene forsikringsrisiko i det lange løb! På figuren ser vi, at selskabet oplever en ruin til tiden Y5, idet der her indløber en meget stor skadesanmeldelse, som gør kapitalen negativ. Erstatningens størrelse er her repræsenteret ved B5. At finde realistiske fordelinger for erstatningerne (severity distribution) er ingenlunde simpelt og vil føre alt for vidt at kommentere nærmere her. Blot skal det nævnes, at man må anvende en fordeling, som har en større "hale" end fx en Poissonfordeling. Der forekommer altså relativt flere store erstatningssager end Poisson fordelingen forudsiger.

   

Tilbage til opgaven med at bestemme en sandsynlighed for, at forsikringsselskabet - i den idealiserede model - oplever ruin. Naturligt nok kan tidspunktet T for ruin udtrykkes ved:

Sandsynligheden for, at ruin indtræffer, givet en startkapital på u, kan udtrykkes som

I 1903 publicerede svenskeren Filip Lundberg (1876-1965) en artikel, hvor han viste, at hvis X(t) er en homogen Poisson proces, og under visse forudsætninger, som det vil føre for vidt at komme ind på her, så kan man angive en øvre grænse for sandsynligheden for ruin:

hvor r er den såkaldte adjustment coefficient. Formlen går under navnet Lundbergs ulighed og er et forholdsvist centralt resultat indenfor forsikringsmatematikken. Selv om uligheden er udledt med udgangspunkt i nogle forudsætninger, som normalt ikke vil være opfyldt i en realistisk situation, så fortæller resultatet noget grundlæggende om dynamikken i de stokastiske processer i forsikringsbranchen og om muligheden for ruin. Udledningen af uligheden er ganske kompliceret og vil derfor ikke blive kommeneteret yderligere her. Sætningen blev senere udvidet af Lundbergs landsmand Harald Cramer (1893-1985). Danskeren E. Sparre Andersen viste i 1957, at man kan udvidde uligheden til også at omfatte tilfældet med renewal processer. Sidstnævnte defineres således: Lad {Ti} være en følge af identiske, uafhængige og (almost surely) positive stokastiske variable. Da siges

   

at repræsentere en renewal sequence {Yi} og tælleprocessen

er den tilhørende renewal process. Vi ser, at den homogene Poisson proces er en speciel renewal proces, idet ventetiderne (interarrival times) {Ti} her er eksponentialfordelte stokastiske variable. For en renewal proces tillader man altså også tilfælde, hvor ventetiderne ikke er eksponential fordelte! Den inhomogene Poisson proces er ikke er en renewal proces, da ventetiderne viser sig hverken at være identisk fordelte eller uafhængige. Hovedidéen med at introducere begrebet renewal proces er, at den homogene Poisson proces ikke altid beskriver ankomsten af skadesanmeldelser tilstrækkeligt godt. Praksis viser, at der kan registreres store gap mellem ankomsten af anmeldelser. Ankomsten af storme er et eksempel. For bedre at modellere disse store ventetider kan man ty til log-normal eller Pareto fordelinger, da de har meget tungere "haler" end eksponential fordelingen. Når man forlader den homogene Poisson proces, så må man samtidigt opgive dens mange smukke egenskaber. I teorien for renewal processer, kan man dog vise, at renewal processer har flere asymptotiske egenskaber fælles med den homogene Poisson proces.    

Udover selve ankomsten af skadesanmeldelser, så er som nævnt også fordelingen af størrelserne af erstatningerne (severity distributions også kaldet claim size distributions) interessante. Realistiske fordelinger er her ofte karaktereiseret ved en tung "hale". Blandt de fordelinger, som man interesserer sig for er for eksempel Pareto fordelinger, Burr-fordelinger, log-normal fordelinger, Weibull fordelingen og subeksponentielle fordelinger. Det vil føre for vidt at komme med flere detaljer her.

 

 

Links

Om studiet og arbejdet som Forsikringsmatematiker.
Interview med studerende i Forsikringsmatematik.

Aktuarforeningen  

www.actuaries.org  (IAA - the International Actuarial Association)

www.tryg.dk

http://en.wikipedia.org/wiki/Agner_Krarup_Erlang  (Om Erlang og hans fordelinger)