Sinds 2005

Betere ICT, betere bedrijfsprocessen

Analyses in de loonaangifteketen

Ik heb in mijn artikel Domweg datamining beschreven tegen welke beperkingen we kunnen oplopen bij het toepassen van datamining. Ik heb daarbij enkele voorbeelden uit de praktijk van de loonaangifteketen gebruikt om de beperkingen te laten zien.

Hierdoor kan de indruk ontstaan dat er binnen de loonaangifteketen bijna helemaal geen mogelijkheden zijn voor datamining en analyse. Dat is natuurlijk niet waar.

What? Where? Who? When? Why? How?

Ik wil in dit artikel laten zien wat er binnen de loonaangifteketen wel kan. Veel van wat er kan wordt ook inderdaad toegepast.

Fraudeopsporing

Een toepassing van datamining die al binnen de loonaangifteketen wordt toegepast is fraudeopsporing. Voor het achterhalen van diverse vormen van fraude word er informatie verzameld over bekende fraudegevallen. Aan de hand van deze gegevens wordt dan gezocht naar gemeenschappelijke kenmerken op grond waarvan vervolgens profielen worden opgesteld. Uit de totale populatie van gegevens worden daarna de gevallen geselecteerd die ook aan de opgestelde profielen voldoen. Dit zijn mogelijke fraudegevallen en deze worden normaal gesproken verder uitgezocht.

Fraudeopsporing op grond van gegevens uit de loonaangifteketen vindt bij diverse organisaties plaats (in ieder geval bij de belastingdienst en bij UWV) en er wordt gezocht naar diverse mogelijke vormen van fraude.

Datamining

Het zoeken naar gemeenschappelijke kenmerken bij fraudeopsporing kan gebeuren met datamining technieken, maar ook met statistische analyse. Het zoeken naar gemeenschappelijke kenmerken voor andere onwaarschijnlijke situaties (bijvoorbeeld dienstverband (on)bepaalde tijd of fase-indeling in de uitzendbranche) kan ook met beide technieken gebeuren. Neurale netwerken bespreek ik hier niet apart, maar ik schaar ze onder datamining technieken.

Mining honderd jaar geleden.

Binnen de loonaangifte is de betekenis van de gegevens erg belangrijk. Daarom moet ook een goede keuze worden gemaakt uit de variabelen die moeten worden gebruikt in de analyses. Hierdoor hebben datamining technieken niet per definitie meerwaarde boven statistische analyses.

In ieder geval heb ik zelf bij UWV beide technieken toegepast op loonaangiftegegevens. Bij UWV en de belastingdienst wordt minimaal 1 van deze technieken gebruikt, maar zeer waarschijnlijk worden ze beiden gebruikt en wordt per situatie beoordeeld welke het handigst of de best passende is.

Statistische analyse

Voor het maken en uitvoeren van beleid is een veelheid aan gegevens nodig, maar het is natuurlijk ondoenlijk om voor bijvoorbeeld het zichtbaar maken van koopkrachteffecten van beleidsvoornemens voor iedere afzonderlijke burger het inkomen te nemen.

Om hier toch iets over te kunnen zeggen worden burgers bijvoorbeeld in inkomenssegmenten ingedeeld (gesegmenteerd), wordt bepaald hoeveel burgers er in ieder segment zitten, wat het gemiddelde inkomen van het segment is en wordt eventueel de standaarddeviatie nog bepaald. Met de zo gevonden gegevens kunnen voor hele groepen de koopkrachteffecten worden bepaald. Deze vorm van analyse is de statistische analyse.

Statistische analyses van de loonaangiftegegevens worden natuurlijk toegepast door het CBS, maar op dit moment ook door het UWV.

Trendanalyse

Voor het maken van plannen, dus beleid, is het niet voldoende om de huidige situatie te kennen maar moet ook de situatie in de (nabije) toekomst min of meer bekend zijn. Natuurlijk is deze toekomstige situatie niet bekend, maar er kan vaak wel een verantwoord beeld worden geschetst door bepaalde gegevens door te trekken naar de toekomst (te extrapoleren).

Het beeld dat op grond hiervan kan worden geschetst kan vervolgens worden gebruikt om plannen (beleid) op te stellen.

Deze vorm van analyse heet trendanalyse en wordt in ieder geval uitgevoerd door het CBS en het UWV, maar naar ik aanneem ook door de belastingdienst.

Simulaties

Als we de huidige situatie kennen en op grond van trendanalyses de verwachtte toekomstige situatie ook, dan willen we natuurlijk weten of de plannen of het beleid dat we hebben opgesteld het beoogde doel bereikt.

Om te bepalen of het beoogde doel wordt bereikt moet worden bepaald hoe de in de trendanalyse gebruikte parameters en variabelen door het beleid worden beïnvloed. Vervolgens worden de gebruikte parameters en variabelen hiervoor gecorrigeerd en wordt een nieuwe verwachtte toekomstige situatie bepaald.

Voldoet de nieuw bepaalde toekomstige situatie aan het beoogde doel dan zijn we klaar. Voldoet het echter niet aan het beoogde doel dan moet het beleid (het plan) worden aangepast om vervolgens weer het effect op de in de trendanalyse gebruikte parameters en variabelen vast te stellen, daarna opnieuw de verwachtte toekomstige situatie te bepalen, enzovoort.

Het gehele proces dat hier beschreven is wordt simuleren (het uitvoeren van simulaties) genoemd.

Dit soort simulaties worden in ieder geval door het CPB (Centraal Plan Bureau) uitgevoerd. Ik neem aan dat het CPB voor sommige simulaties direct of indirect gebruikt maakt van de loonaangiftegegevens. Van de zijlijn kan ik echter niet beoordelen of andere (loonaangifteketen) organisaties ook dit soort simulaties uitvoeren. Ik heb echter de indruk van niet. Het zou voor de administratieve en vooral voor de uitvoeringskosten wel eens van belang kunnen zijn om simulaties uit te voeren bij iets complexere wijziging in wet- en regelgeving.

Process mining

Als je je procesgegevens onderwerp maakt van analyse om je bedrijfsprocessen te verbeteren dan komen we op het gebied dat tegenwoordig de naam process mining heeft gekregen.

Met process mining kan worden bepaald hoe de daadwerkelijk toegepaste bedrijfsprocessen lopen. De daadwerkelijk toegepaste bedrijfsprocessen lopen vaak anders dan de officiële procesontwerpen, maar hoe ze echt lopen is over het algemeen bij (vrijwel) niemand bekend.

Met process mining kan ook betrekkelijk eenvoudig worden vastgesteld waar eventueel knelpunten zitten, welke stappen het meeste tijd kosten (en dus het best aangepakt kunnen worden om de doorlooptijd te verkorten).

Ik weet dat er binnen de loonaangifteketen een bak met procesgegevens is die in principe geschikt is voor process mining. De gegevens bestrijken (bijna) de gehele loonaangifteketen. In hoeverre deze gegevens worden gebruikt voor de daadwerkelijke toepassing van process mining weet ik niet. De gegevens worden in ieder geval actueel gehouden en ze worden gebruikt voor het opstellen van management rapportages.

Overige informatica technieken

Er zijn nog een aantal andere informatica analysetechnieken die op dit moment erg in de mode zijn. Om redenen die ik heb besproken in Domweg datamining en in de discussie in LinkedIn-groep Loonaangifteketen vindt ik die in deze situatie nauwelijks van toepassing.

Hoewel dingen als neurale netwerken en dergelijke nog een rol kunnen hebben in de profilering van fraudegevallen, zoals ik daar al aangegeven had. Toch heeft het in mijn ogen in deze situatie nauwelijks meerwaarde boven statistische analyse.

Exotische analyses

Verder zijn er nog diverse analysetechnieken die voortkomen uit de wiskunde en veel worden toegepast in de natuurkunde, de sterrenkunde en sommige andere exacte vakgebieden. Dingen als Fast Fourier Transformaties, Wavelet Transformaties en (de)convoluties zijn erg boeiend.

Ze zouden mogelijk nog een rol kunnen spelen bij het opschonen van de "signalen" waarop we de hierboven genoemde trendanalyses loslaten. Gezien de veel grotere mate van onzekerheid en variabiliteit in de loonaangiftegegevens verwacht ik hier geen meerwaarde terwijl er veel moeite voor moet worden gedaan.

Oproep

Van veel analyses die in de loonaangifteketen worden uitgevoerd weet ik welke organisatie en welke afdeling ze uitvoert of ik heb ervan gehoord. Ook weet ik van de nodige gevallen welk soort analyses worden uitgevoerd.

Ik weet echter zeker dat er ook analyses worden uitgevoerd die ik nog niet ken. Werk je voor een organisatie die ik hier nog niet heb genoemd of voer je een analyse uit die hier niet (of met het nodige voorbehoud) wordt genoemd, laat me dat dan weten op web@abits-it.eu. Het lijkt mij namelijk wel leuk om het plaatje compleet te maken. Ik ben ook bereid tot bronvermelding. Laat wat van je horen!

Waardering: 1 van 5.

Stemmen: 0

Gemaakt: 2015-07-19

Gepubliceerd:

Gewijzigd: 2015-11-26

Gepubliceerd door: Abits B.V.

Deel dit artikel!