Het Historisch Centrum Limburg (HCL) beheert net als alle andere archiefinstellingen in het land vele handgeschreven archieven. Maar wie kan die nog lezen? En zou je niet makkelijker willen zoeken in de scans van deze archieven?
Dit kan met artificial intelligence (AI). Zo wordt software getraind om handschriften automatisch te transcriberen en om te zetten naar tekst die computers kunnen lezen. Hiervoor moet software echter wel eerst een bulk aan handgemaakte transcripties worden gevoed om deze te trainen. Een voorbeeld van een programma waarmee dit kan is Transkribus.
Het Nationaal Archief is hiervoor het automatische handschriftherkenningsproject 'De ijsberg zichtbaar maken' gestart. Binnen dit project worden archieven van de VOC uit de 17e en 18e eeuw en archieven van notarissen uit de 19e eeuw (automatisch) getranscribeerd. Het HCL heeft hiervoor - net als andere RHC's - scans van één van onze notariële archieven aangeleverd (te weten archief 09.009).
De afgelopen periode waren er al anderhalf miljoen van deze transcripties en de trainingsdata beschikbaar op Zenodo. Vanaf donderdag 15 april komen daar nog eens 600.000 transcripties bij van de verschillende RHC's, waaronder die van het HCL. Dat is nu nog een beetje omslachtig, maar voor het doorzoeken van al die transcripties wordt een projectwebsite gerealiseerd.
Op maandag 17 mei 2021 organiseert het Nationaal Archief een symposium over dit project. Hierbij zal deze projectwebsite worden gepresenteerd. Ook worden tijdens dat symposium de belangrijkste projectresultaten gedeeld.
dóórzoeken
Die transcripties worden beschikbaar gesteld als tekstbestand (met txt-extensie). Dat kan iedere reguliere computer dus gewoon doorzoeken. Maar dat neemt niet weg dat het evengoed nog een hele hoop (lees: ijsberg) blijft waar je doorheen moet. Gelukkig laat de techniek ons wat dat betreft niet in de steek. Alle transcripties zijn namelijk doorzoekbaar via OpenArch. Ook kun je bijvoorbeeld een bulk van dit soort tekstbestanden doorzoeken met het programma Astrogrep. In deze video wordt uitgelegd hoe je met Astrogrep in deze transcipties kan zoeken.
bijvoorbeeld
De scans die het HCL heeft aangeleverd zijn afkomstig uit een archief uit de periode 1895-1906. Dat was een periode waarin Nederland nog een koloniale macht was. Sterker nog, de Atjehoorlog overspande deze hele periode. Dat archief kan dus interessant zijn voor onderzoek naar die geschiedenis. Als we dit bijvoorbeeld als invalshoek nemen levert de zoekterm "indisch" bij de transcripties van het HCL 39 resultaten op.
Eén van die resultaten is scan 0471 van inventarisnummer 9274B. Dit betreft een akte van de hand van Jan Leopold Palmen, notaris te Valkenburg. Op 5 september 1905 verscheen voor hem de heer Petrus van Vlodrop, gepensioneerd Oost-Indisch ambtenaar, wonende te Oud-Valkenburg. Volgens de geautomatiseerde transciptie verklaart Petrus van Vlodrop in de akte:
"zich ten behoeve van den staat
der Nederlanden te verbinden tot de terug„
betaling, op de eerste aanvrage, van de som„
men, voor welke, overeenkomstig de arti
Kelen 33 en 34 van het, zedert gewyzingde
Reglement voor de Koninklijke Militaire
Academié, vastgesteld bij het koninklijk Beeling
van zes April achttienhonderd vijf en neventig
Staatsblad nummer 40, ten behoeve van zynen
zoon Parl Robert August van Vlodrop
vrtelling is verleend, en wel voor het geval
laatstgenoemde als Cadef mocht worden
ontelagen, hetzy op verzoek, hetzy wegens
gemis dan aanleg of ijver, dan wel om
andere redenen, afhankelyk van eigen wil
of van eigen soldoen zyne bestemmingmet mocht volgen"
Als we de scan zelf (zie afbeelding hierboven) erbij pakken levert dat de volgende verbeterde transcriptie op:
"zich ten behoeve van den staat der Nederlanden te verbinden tot de terugbetaling, op de eerste aanvrage, van de sommen, voor welke, overeenkomstig de artikelen 33 en 34 van het, sedert gewijzigde Reglement voor de Koninklijke Militaire Academié, vastgesteld bij het koninklijk Besluit van zes April achttienhonderd vijf en negentig (Staatsblad nummer 40), ten behoeve van zijnen zoon Paul Robert August van Vlodrop vrijstelling is verleend, en wel voor het geval laatstgenoemde als Cadet mocht worden ontslagen, hetzij op verzoek, hetzij wegens gemis dan aanleg of ijver, dan wel om andere redenen, afhankelijk van eigen wil of van eigen toedoen zijne bestemming niet mocht volgen."
Petrus van Vlodrop beroept zich dus op artikelen 33 en 34 van Reglement voor Koninklijke Militaire Academie, dat op 6 april 1895 werd vastgesteld en is gepubliceerd in Staatsblad nr. 40 van dat jaar. Dit is gedigitaliseerd en eenvoudig terug te vinden via Delpher. Artikel 33 betreft de regels over gehele of gedeeltelijke vrijstelling van de dienstplicht, met name voor zonen van oud-officieren. In artikel 34 staat dat deze vrijstellingen jaarlijks bij koninklijk besluit worden vastgesteld. In artikel 33 wordt daarbij ook verwezen naar “het betalen der bijdrage bedoeld bij art. 10 der wet”. Hiernaar wordt in bovenstaande akte ook verwezen: “…terugbetaling, op de eerste aanvrage, van de sommen…”.
Het gaat hierbij om de Wet tot regeling van het Militair Onderwijs van 21 juli 1890. Deze is gepubliceerd in Staatsblad nr. 126 van dat jaar en ook te vinden via Delpher. Uit artikel 10 blijkt dat het bedrag dat Petrus van Vlodrop aan de staat verschuldigd is 400 gulden bedraagt. Volgens de inflatiecalculator van het CBS staat 400 gulden in 1905 gelijk aan €5132,98 nu.
conclusie
Zo wordt er digitaal steeds meer mogelijk, ook binnen de oude, handgeschreven archieven. Bovenstaande is het resultaat van een vrij korte zoektocht. Daarnaast is een koppeling met eerder ontsloten bronnen (binnen bijvoorbeeld Delpher) snel gemaakt. En het mooie is: dit kan allemaal thuis, vanuit je luie stoel.