/
Probleemoplossing: .zip en UTF-8 encoding

Probleemoplossing: .zip en UTF-8 encoding

Om een SIP in te voeren, sla je het importsjabloon + de digitale dossiers op als een .zip-bestand (zie ook: Submission information package (SIP) | Importeren van dossiers via SIP ). Hiervoor kan je gebruik maken van beschikbare programma’s op je pc, dan wel online.

Het blijkt dat niet alle programma’s altijd alle speciale karakters in bestandsnamen hetzelfde coderen. Recentelijk (januari 2025) is dit onder meer het geval gebleken voor: ï en ö. (Een ë wordt dan weer juist omgezet.)

Het E-depot verwacht de informatie in UTF-8 codering. Echter, wanneer een zip-programma - om welke reden dan ook - een andere codering gebruikt, kan de informatie bij invoer in het E-depot niet correct worden uitgelezen. De foutmelding die je dan krijgt is:

Foutmelding_vreemd_teken.JPG

Visueel lijkt er niets aan de hand: de naam van het stuk stemt overeen met de bestandsnaam en de inhoud van het importsjabloon:

Foutmelding_vreemd_teken03.JPG

Maar op de achtergrond is dit stuk dus anders gecodeerd.

De codering van speciale karakters is niet noodzakelijk het onderliggende probleem. Controleer ook steeds of de in het importsjabloon beschreven stuk ook effectief onderdeel is van de SIP!

 

Het issue van het coderen van speciale karakters dient buiten het E-depot te worden opgelost. Hiervoor heb je als gebruiker de volgende opties:

  1. Maak gebruik van de SIP-Creator:

    1. SIP-Creator - Gebruikersomgeving Digitaal Archief Vlaanderen - Confluence

    2. Deze tool is ontwikkeld door Digitaal Archief Vlaanderen en wordt kosteloos ter beschikking gesteld.

    3. De SIP-creator zorgt ervoor dat alles naar de juiste codering wordt omgezet.

  2. Maak je gebruik van 7-zip?

    1. Het meegeven van de waarde ‘-mcu’ in het veld ‘Parameters’ forceert eveneens de codering naar UTF-8:

Related content