AI - Project

AI - Project

DigiPost is in april 2025 begonnen met een AI-project om de interne werking te optimaliseren, snellere doorlooptijden te realiseren en een betere sortering te garanderen. Op deze en de onderliggende pagina’s kom je alles te weten over het project zoals de verschillende tracks, de achterliggende componenten en uiteraard welke beveiligingsmaatregelen er worden genomen om de data te beschermen.

Op welke tracks wordt er gewerkt?

Verminderen doorlooptijden

De huidige achterliggende componenten binnen het DigiPost-platform zijn niet altijd even gebruiksvriendelijk of snel om mee te werken. Gemiddeld neemt het verwerken van een ‘batch’ gescande post 10 minuten per 100 pagina’s in. Door over te schakelen op de Azure AI Read component om de tekstherkenning uit te voeren kan deze doorlooptijd met een factor 5 versneld worden.

Classificatie posttype & splitsen brieven

Brieven worden in het huidige proces manueel geclassificeerd in de 4 types (poststuk/retour en aangetekend/niet-aangetekend) en gesplitst aan de hand van QR-codes en QR-stickers. Op elke brief moet een QR-sticker komen die het platform zegt dat er een brief eindigt en de batch gesplitst moet worden. Door hier gebruik te maken van Azure Custom Vision kunnen deze stappen volautomatisch in het verwerkingsproces gebeuren waardoor er dagelijks geen ca. 1000 stickers geplakt moeten worden.

Automatisch bepalen bestemmeling

De ca. 1200 brieven die DigiPost dagelijks verwerkt, worden uitgesorteerd over meer dan 150 verschillende postbussen en 60 verschillende entiteiten. Door de vele regels, slecht geadresseerde brieven en uitzonderingen is dit echter een relatief traag en bovenal foutgevoelig proces.

Om dit proces te optimaliseren zal de omslag en de eerste pagina van een brief verzameld worden door de Azure AI Read component die het zal doorgeven aan een Large Language Model dat al de info zal bundelen en interpreteren om de bestemmeling te bepalen. Wanneer de LLM een bestemmeling heeft bepaald zal dit gevalideerd worden tegen een lijst masterdata met alle bestaande postbussen van de Vlaamse Overheid. Wanneer de confidence rate dan hoog genoeg ligt (>95%), wordt de brief automatisch toegekend aan die postbus.

Deze component laat daarnaast toe om brieven die niet gescand mogen worden, tegen te houden voordat deze aan iemand wordt bezorgd wanneer de brief per vergissing toch werd gescand.

 

Tijdslijn

Het projectplan voorzien verschillende tussenstappen, alvorens de AI-componenten zelfstandig mogen draaien. Tussen elke nieuwe fase is er een formeel beslissingsmoment voorzien waarin de resultaten worden besproken. Hoe accuraat is de AI? Zijn er geen vals-positieven? …? Enkel wanneer de beslissing positief is, wordt het project verder gezet.

We werken momenteel onze planning en tijdslijn bij. Die wordt zo snel mogelijk ter beschikking gesteld op deze pagina.

 

Integratie AI read

De integratie van de AI read vindt plaats in april 2025. Deze zal eerst op de testomgeving worden geïntegreerd om de werking ervan te valideren en te bekijken wat de winst is op de doorlooptijden. Hiervan is het de bedoeling om live te gaan in mei 2025.

Separatie, classificatie en determinatie bestemmeling

De andere 2 tracks worden samen ontwikkeld, getest en opgeleverd gezien ze allen gebruik maken van dezelfde componenten. Dit laat toe om de integratie in zijn geheel bij te sturen waar nodig tijdens de test- en validatiemomenten.

Ontwikkelingsfase

Tijdens de ontwikkelingsfase worden de modellen getraind op basis van reële data uit de productieomgeving. Dit wordt gedaan door een nauwe samenwerking tussen de ontwikkelaars en het team van DigiPost om zo veel mogelijk representatief materiaal te gebruiken alsook alle ‘speciale’ poststukken die niet eenvoudig te verwerken vallen

Schaduwdraaien

Tijdens het schaduwdraaien worden alle poststukken op de productieomgeving nog volgens de bestaande werking van DigiPost verwerkt. Een kopie van deze scans wordt echter ook naar de testomgeving verzonden waar de AI-componenten de batch ook zullen verwerken. Alle beslissingen van de AI-componenten worden hierna gevalideerd door een scanoperator om het model waar nodig bij te kunnen trainen.

Gemonitord draaien

Tijdens het gemonitord draaien is zijn de AI-componenten live op de productieomgeving en werkt team DigiPost ook volgens de nieuwere en efficiëntere werkwijze waarbij veel taken worden overgelaten aan de AI-componenten. Voor de brieven echter worden afgeleverd aan de bestemmeling wordt elke beslissing van de AI nog gevalideerd samen met de confidence-rate van de AI. Zo kunnen ook poststukken waarbij de AI zeker is, maar toch fout nog worden tegengehouden waarna de AI verder wordt getraind.

Live

Na de go-live draaien alle componenten op de productieomgeving zonder menselijke interventie op elke brief. Wanneer de AI zeker genoeg is, wordt deze automatisch geclassificeerd, gesepareerd en toegekend aan de juiste bestemmeling. Indien de AI echter niet zeker genoeg is, komt de brief in een verwerkingslijst terecht voor manuele verwerking door een scanoperator. Alle niet-automatisch verwerkte brieven worden daarna verder gebruikt om het model verder te trainen.

 

 

Toekomstige procesflow

AI Flow.png