Skip to end of metadata
Go to start of metadata

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 3 Next »

Hoe kan ik de dossiernamen in het veld ‘Path in SIP’ invullen in het importsjabloon dat ik heb gedownload? Welke hulpmiddelen kan ik gebruiken? Welke stappen zet ik?

Uitlezen van mappenstructuur via Windows Verkenner

In Windows Verkenner zit een functionaliteit die van pas komt.

Selecteer de mappen (dossiers) waarvan je de padnamen wil kopiëren en plakken in het importsjabloon. Kies vervolgens voor Pad kopiëren in de menubalk.

Windows Verkenner > Start > Pad kopiëren

PadKopierenWindVerk2.png

Open een lege werkmap in Excel. Je neemt bij voorkeur een leeg werkblad en niet het importsjabloon dat je hebt gedownload, omdat je nog enkele bewerkingen moet uitvoeren.

Plak de gekopieerde padnamen in het nieuwe Excel-werkblad:

PlakExcel1.PNG

Ga in cel A1 staan en plak de gekopieerde dossiernamen. Excel toont nu een lijst.

De dossiernamen zijn achteraan in de padnamen zichtbaar. Nu is het zaak de prefix van de padnamen te verwijderen, aangezien we enkel deze dossiermappen 2015_001, 2016_001, … in de rootfolder gaan opnemen.

Ga naar cel A1. Je kunt deze prefix bekomen door in cel A1 te gaan staan en in de ‘Formulebalk’ de volledige prefix te kopiëren die de dossiernaam voorafgaat, dus tot en met de laatste backslash ‘\’. In ons voorbeeld is dat
‘C:\Users\bovyst\OneDrive - Vlaamse overheid - Office 365\Digitaal Archief Vlaanderen\Opleidingsdata\SIP Doss Gn Ext1\’

VervangenDoor1.png

Selecteer vervolgens het volledige werkblad of de ingevulde cellen A1 t.e.m. A12:

Ga in cel A1 staan en klik op CTRL-A of
klik in het werkblad op dit symbool

WerkbladSelect1.png

Nu de selectie is uitgevoerd, klik op CTRL-H of
klik in de menubalk van Excel: Start > Bewerken > Zoeken en selecteren > Vervangen.

ZoekenVervangen.png

Ga in het tabblad ‘Vervangen’ met je cursor in het veld ‘Zoeken naar’ staan.

Noteer of plak de prefix die je net hebt gekopieerd en wil verwijderen in het veld ‘Zoeken naar’ > ‘Alles vervangen’ > OK.

ZoekenNaar1.png

Excel toont nu mijn dossiernamen. Selecteer de mapnamen en kopieer ze:

SelectMapN1.PNG

Plak de gekopieerde padnamen van de selecteerde mappen (dossiers) in het importsjabloon dat je hebt gedownload:

MapNaamInSjabl1.PNG

Vul de dossiernamen aan. Je zou de waarden van cel A2 t.e.m. A13 kunnen hernemen (dus kopiëren) in kolom E, ‘Naam’ of een eigen waarde meegeven.

Vergeet de ‘Openingsdatum’ en ‘Sluitingsdatum’ niet te toe te voegen. Meer info over formattering vind je hier.

Uitlezen van mappenstructuur via Finder (Mac OS X)

Open Finder en selecteer de mappen (dossiers) waarvan je de padnamen wil kopiëren en plakken in het importsjabloon (command + A).

Houdt de option-toets ingedrukt, klik met een secundaire klik (rechtermuisknop) op de bestanden en selecteer ‘Copy Items as Pathnames’.

Open een lege werkmap in Excel. Je neemt bij voorkeur een leeg werkblad en niet het importsjabloon dat je hebt gedownload, omdat je nog enkele bewerkingen moet uitvoeren.

Plak de gekopieerde padnamen in het nieuwe Excel-werkblad: ga in cel A1 staan en plak de gekopieerde dossiernamen via Paste Special > Paste as Text. Excel toont nu een lijst.

Uitlezen van mappen- en bestandsstructuur via Power Query in Excel

Open Excel >Open een lege werkmap.

Klik in de menubalk op Gegevens > Gegevens ophalen.

Uit bestand > Uit map (dossiers op lokale schijf, fileshare) of
Uit bestand > SharePoint-map (dossiers op SharePoint).

PowerQuery1.png

In het voorbeeld dat we uitwerken, kiezen we voor Gegevens ophalen > Uit bestand > Uit map.

Navigeer in het selectie-menu dat verschijnt naar de locatie waar de dossiers zijn bewaard. Dit is de rootfolder.

PowerQuery2.png

Selecteer de rootfolder > Openen > Gegevens transformeren.

PowerQuery3.png

De Power Query-editor wordt geopend > Sluiten en laden.

PowerQuery4.pngPowerQuery5b.png

Nu is het zaak de overbodige informatie te verwijderen en de data te transformeren.

In ons voorbeeld hebben we een werkblad met 636 rijen (635 + kolomtitels) en 6 kolommen.

Om de informatie om te zetten naar een werkbaar formaat dat overeenstemt met de informatie die we nodig hebben om het importsjabloon in te vullen, voeren we bijkomende acties uit.

  • We wensen de dossiers uit deze 635 rijen te halen, aangezien dossiers verplicht moeten worden beschreven in het importsjabloon.

  • We wensen alle bestanden of stukken uit deze dossiers te beschrijven. Bestanden beschrijven in het importsjabloon is echter optioneel en geen verplichting.

In de laatste kolom van onze Excel vinden we Folder Path. Dit is de lijst van dossiers, voorafgegaan door het volledige path (prefix).

We raden aan om deze kolom in zijn geheel te kopiëren en te plakken in een nieuw werkblad.

PowerQuery6.png

In ons voorbeeld moeten we het prefix ‘C:\Users\bovyst\OneDrive - Vlaamse overheid - Office 365\Digitaal Archief Vlaanderen\Opleidingsdata\SIP Doss Gn Ext1\’ verwijderen.

Eerder hadden we al beschreven hoe we het prefix konden verwijderen via Zoeken en Vervangen.

De nieuwe lijst bevat de dossiernamen.

We hebben deze lijst nodig in twee versies

Versie één, waarbij een dossier één keer wordt vermeld en geen '\' bevat aan het eind.

Versie twee, waarbij en een '\' bevat aan het eind.

De lijst dossiers die overblijft bevat nog een ‘\' na de dossiernaam. Ook deze kunnen we weghalen via de functie Zoeken en Vervangen zoals eerder beschrijven. Zoeken naar ‘\' en Vervangen door: leeg. Alternatieve functie: de cel splitsen op basis van de '\’. op Gegevens > Tekst naar kolommen > Gescheiden > Volgende > Overige: '\’ > Volgende> Voltooien.

Verwijder nu de dubbele waarden.

Gegevens > Dubbele waarden verwijderen.

PowerQuery7.png

De bekomen lijst dossiers kunnen we kopiëren en plakken in ons importsjabloon.

Rest ons nog de beschrijving van de bestanden correct te formatteren.

We hebben het volledige pad nodig van het dossier (onder de rootfolder) t.e.m. de bestandslocatie plus de bestandsextensie: dossiernaam/submap/subsubmap/bestand.ext.

Engels?

  • No labels