Namen, echte varianten en fouten variatie! typen variatie belang

9‐10‐2014
variatie!
Guljelmus
Wllhelmus
Wlhelmus
WIllem
(Willem)
Wiellem
Wlllem
Gujlelnius
Wllem
WiIllem
Wijllem
Wihelmus
Willemj
Wikllem
Wwillem
Willlem
Guilleam
Willeam
Willem
Wil.lem
Wilem
Guileam
Willelmini
willem
Wiilem
Guillem
Weillem
Guilelmis
Wil;helmus
Wilhlem
Welhelmus
Namen, echte varianten en fouten
Gerrit Bloothooft, UiL‐OTS, Universiteit Utrecht Marijn Schraagen, LIACS, Universiteit Leiden
[email protected]
[email protected]
Famillement 2014 Leiden
Utrecht Leiden
Links
Wiillem
Wiehelmus
Wulhelmus
Willem)
Wilehelmus
Woillem
Wihhelmus
Weijlem
Willelmus
Wi;;em
Wilehlmus
Wuhelm
Guilelmus
Wilhlelmus
Willem(se)
Wilalem
Wullem
Willem.
W#ilhelmus
Guillelmus
Wliiem
Wlihelmus
Wilelmus
Willemm
Wileem
Wìllem
Willemem
Wolhelmus
Wechelmus
Guilllelmus
Wilemm
Utrecht Leiden
typen variatie
– spelling
– naameinde
– afkorting
– vertaling
Dirk
Willem Willem Willem Willem
– typefouten
Willem – … (en combinaties hiervan)
‐ Bloothooft
‐ Bloodhoofd ‐ Bloodhooft
‐ Blootshoofd
‐ Bloodhooft
‐ Bloodhoofd Links
3
Bloodshoofd ‐ Blootshoofd
Bloodshoofd ‐ Bloodshoofs
Bloodshoofd ‐ Bloodshooft
Bloodshoofd ‐ Blooshoofd Bloodshooft ‐ Blootshoofd
Blootshoofd ‐ Blootshooft
Blootshoofd ‐ Blooshoofd
Blooshoofd ‐ Booshoofd
Famillement 2014 Leiden
Wilhelus
Willaim
Willemerman
Wilhelmus)
Guillieaume
Wilhelmuss
Wilhwlmus
WilhelmusStephanus Wilhwelmus
WIlhelmus
Willum
Willkem
Guillum
Wilkhelmus
William
Wilhelmiem
Wilhlemus
Wilhelmigs
Wilielmus
Willme
Willielmus
Wilme
Güilielmus
WilhelmusHenricus Guililmus
WilhelmusTheodorus Guileilmus
Wilhelmushenricus Guïllielmus
Wilhelmusn
Guilielmus
Wilhelmuszn
Guillijaam
Eilhelmus
Willemus
ilhelmus
Wiiliam
Ilhelmus
Guilemus
Willemcus
Guillemus
WilhelmusJohannes Willemmus
Wilhelmushubertus Wilehmus
Guiljame
Wilhelmuw
Wilemus
Wilhelmus?
Wwilhwlmus
Willliam
WilhelmusHubertus Guilliaam
Wieliam
Wilheelmus
Guiliam
Guillielmus
Wilhelmmus
Guiliaam
Wilhlmus
Wielhelmus
Guillieam
Guillmus
Wilhhelmus
Guilliam
Wiliaam
Wiilhelmus
Wiliam
Wilhmus
WEilhelmus
Wilnelmus
Guiilmus
wilhelmus
Willwm
Wilmus
Guillaim
wilhemus
Wilhelnmus
Woalter
Willhem
Guillhem
Wilheem
Wilhem
Wölhelm
Wilhelimus
Famillement 2014 Leiden
Guilmus
Aillem
JohannesWilhelmus
Johanneswilhelmus
CornelisWilhelmus
Gulliëlmus
Guliëlmus
Gijlliaume
Güliëlmus
Guli?lmus
Guijelmus
Gulielmus
Guiëlmus
Giliaume
Gilliaume
Gilliaumme
Guihelmus
Guikelmus
Gullielmus
Guielmus
Jannwillem
Janwillem
JanWillem
JanWilhelmus
MartinusWilhelmus
Qwillem
Links
1. 2
Utrecht Leiden
Famillement 2014 Leiden
Links
4
LINKS project
• automatische koppeling van persoonsgegevens (akten) in Wie‐Was‐Wie
• NWO project van IISG, Meertensinstituut, Universiteit Leiden, Universiteit Utrecht, Wie‐Was‐Wie/Genlias
– Demonstratie Marijn Schraagen
– Lezingen Nies Huijsmans en Kees Mandemakers
Afzonderlijke families Bloothoof(d,t) en Bloo(d,t)shoofd
Utrecht Leiden
Guillermo
Guillerlmus
Guijlleaume
Wilheminus
Wiechem
Wilhelmus
Wilhelhmus
Wiloem
Guillaum
Wilhelmius
Willem
guillaum
Wilhelmijs
Gueillaum
Guilhelmis
Guillaume
Wilhemus
Wilhelmjs
William
Guilhemus
Wilhelmis
Wielhemus
Willemhelmus
Gulielmus
Wilhehmus
Willoem
Wilhelminus
Wilhelnus
Wihhelmus
Wilhelmienus
Weilhelmus
Wilherlmus
Wwilhelmus
Guikelmus
Wilhermus
Wylhelmus
Weilhim
wWilhelmus
ilhelmus
Wilhiem
(Wilhelmus)
Wilheim
(Wilhelmus
Willwm
Wilhein
Wilhelmüs
Willaum
Wilhelmus\
Wilme
• kunnen twee verschillende namen variant van elkaar zijn?
• zodat ze mogelijk voor dezelfde persoon zijn gebruikt
een persoonlijk noot
Bloothoofd Bloothoofd Bloothoofd Bloothooft
Bloothooft
Bloodhooft
Guilliaume
Willenis
Guiliermo
Wilempjen
Willempjen
Willepjen
Guilliermo
Wittem
Willen!
Wilhlenn
Wijlen
Wielen
Willen
wilhem
Willempke
Guilleaume
Wilhellemus
Wilhekmus
Guiileaume
Willeaume
Wilhelmuus
Guylleaume
Guileaumme
Guileaume
Wilhelemus
Guilleauma
Willewm
Guillesmus
Guïllermo
Guilermo
Guiilermo
belang voor genealogie
‐ Dirck
‐ Willempje
‐ Wim
‐ Guillaume
‐ Wilhelmus
‐ Aillem
Famillement 2014 Leiden
Utrecht Leiden
W.ilhelmus
Willem]
Willemh
\Willem
Wïllem
w8illem
Wilhellmus
Wilhelm.
Wilmhelmus
Wilhelmuns
Wilhelmua
Wilhelmos
wilhelmnus
Wilhelmnus
Wilhelmues
Guilleaumme
Wilhelmum
Guilhelmus
Willeml
Wilhelmanus
Wilhelmjus
Wilhelmes
Guilliaumme
Wilhelmas
Willemn
Wilhelmus
Wilhelmns
Willhelmus
Guiliaume
Willlen
Guiilleaume
Links
5
Utrecht Leiden
Famillement 2014 Leiden
Links
6
1
9‐10‐2014
deelonderzoek in LINKS
voorwaarde
• kunnen we naamvarianten automatisch
afleiden uit het feitelijk gebruik ervan
• groot gegevensbestand (Wie‐Was‐Wie)
• als basis voor een repertorium van naamvarianten
• kunnen bewijzen dat verschillende gegevens dezelfde persoon betreffen
– met meerdere voorkomens van dezelfde personen
– niet zo eenvoudig
Utrecht Leiden
Famillement 2014 Leiden
Links
7
Wie‐Was‐Wie
8
111.900 voornamen van vrouwen (enkel, Maria)
82.700 voornamen van mannen (enkel, Jan)
(~30%)
(~90%)
(~65%)
681.000 achternamen inclusief voorvoegsel
Bakker, de Vries
600.000 achternamen exclusief voorvoegsel
Vries
Famillement 2014 Leiden
Links
9
Utrecht Leiden
informatie per hoofdpersoon in akte Famillement 2014 Leiden
Links
10
persoonsidentificatie
(te gebruiken voor identificatie)
• voornaam en geslacht persoon • aanname: deze gegevens beschrijven een individu op een unieke manier (indien exact overeenkomend in verschillende akten)
(als kind, bruid of bruidegom, overledene)
•
•
•
•
•
Links
1.052.000 volledige voornamen
Jan, Johanna Maria Cornelia
55 miljoen persoonsvermeldingen (gegevens november 2011)
Utrecht Leiden
Famillement 2014 Leiden
aantallen verschillende namen
• akten burgerlijke stand 1811‐ eerste helft 20ste eeuw
– 4.1 miljoen geboorteakten
– 3.1 miljoen huwelijksakten
– 7.6 miljoen overlijdensakten
Utrecht Leiden
geboortejaar persoon
voornaam vader
achternaam vader
voornaam moeder
achternaam moeder (meisjesnaam)
• versoepeling: één van de namen van de vader of de moeder is niet nodig voor unieke identificatie
(geboorteplaats niet gebruikt > lezing Huijsmans)
Utrecht Leiden
Famillement 2014 Leiden
Links
11
Utrecht Leiden
Famillement 2014 Leiden
Links
12
2
9‐10‐2014
voorbeeld
procedure
Johanna Endt
• vergelijk persoonsvermeldingen uit een aktepaar
(geb + huw of geb + ov of huw + ov)
• trouwt in 1858 als 29 jaar oude dochter van
Gerrit Endt en Dorothea Kerbert
• overlijdt in 1882 als 54 jaar oude dochter van
Gerrit Endt en Doortje Kerbert
• als alleen één naam van de ouders verschilt in de twee akten, dan vormen die een variantpaar
Christiena – Christina
Bloothooft ‐ Bloothoofd
~1829, Johanna, Gerrit, Endt, Kerbert, Dorothea
~1828, Johanna, Gerrit, Endt, Kerbert, Doortje
Famillement 2014 Leiden
Utrecht Leiden
Links
13
Utrecht Leiden
oogst aan variantparen
Famillement 2014 Leiden
Links
14
dat gaat goed, maar
• de bronnen zijn niet foutloos
vrouwelijke voornamen
mannelijke voornamen
achternamen
48.600 paren
31.900 paren
177.000 paren
varianten kunnen het resultaat zijn van fouten die gemaakt zijn bij:
‐ de oorspronkelijke registratie
‐ de transcriptie ‐ het typen
gemiddeld
voornamen: 5 tot 6 voorkomens per variantpaar
achternamen: 2 voorkomens per variantpaar
of als gevolg van naamsverandering
Utrecht Leiden
Famillement 2014 Leiden
Links
15
Utrecht Leiden
voorbeeld
Famillement 2014 Leiden
Links
16
varianten en fouten
onderscheid is moeilijk automatisch te maken
Pieter
bij huwelijk zoon van Jacob Houtlosser en Aafje Spruit
overleden als zoon van Jacob Houtlosser en Grietje Spruit
geboren in 1808 variant Aafje – Grietje ?
Utrecht Leiden
Famillement 2014 Leiden
• varianten hebben hetzelfde lemma (grondvorm)
en fouten niet
dat onderscheid vereist taalkundige/naamkundige kennis
Links
17
Utrecht Leiden
Famillement 2014 Leiden
Links
18
3
9‐10‐2014
voorbeelden
opknappen
• gebruik namenboeken met lemma’s
• varianten
Willem
Willem
Willem
‐ Wilhelm
‐ Guillaume
‐ W8llem (geen indicatie voor verschillend lemma)
• gebruik regels • druk verschil tussen namen in getal uit
• om varianten te accepteren en te verwijderen
• fouten
Grietje
Fijtje
• expertkennis
• om varianten te accepteren
• voornamen: slechts 8% beschreven
‐ Aafje
‐ Sijtje
Famillement 2014 Leiden
Utrecht Leiden
handmatige correctie onvermijdelijk (< 2%)
(begrijpelijke leesfout, maar verschillend lemma)
• 30% mogelijke fouten
Links
19
Utrecht Leiden
heel veel variantparen (Willemina)
WILMINA ‐ WILMIJNA WILLEMJE WELLEMTJE WILMTJE WILLEMTJE WILHELMINA WILLEPMJE WILLEMPIE WELLEMTJE WELLEMTJE WILLEMIJNTJE WILLEMIJNTJE WLLEMIJNTJE
WILLEMIJN WILHELMINA WILLEMTIEN WILLEMTIEN WILEHELMINA WILLEMKE WILLEMKEN
WILLEMINA WILLEMINA WILLEMIENA WILLEMINA
WIHELMINA WILLEMKE WILLEMIJNTJE WILHEMINA WILLEMKEN WILLEMPJE WILLEMIJNTE WILLEMIJNTJE
WILLEMPTJE WILLEMIJNTJE WILLEMIJNTJE WILLEMYNA
WILLEMPJE WILEMPJE WILLEMIJNTJE WILLEMIINTJE WILLEMINA WILLEMINA WILHELMINA WILLEMIJN WILLEMIJN WILLEMINA ‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
WILLEMPJE WILLEMTJE WILLEMPJE WILEMTJE WILLEMPJE WILLEMTJE WILLEMPJE WELLIMTJE WOLLEMTJE WILLEMPJE WLLEMIJNTJE WILLEMPJE WILLEMIJNA WILLEMINA WILMTIEN WILLEMTJE WILHELMINE WILLEMKEN WILLEKEN WILLEMINE WILLIMINA WILLEMINA WILLEMPJE WILHELMINA WILLENKE WILEMIJNTJE WILLEMINA WILMKEN WILLEMTJE WILLEMIJNTJE WILLEMYNTJE WILLEMTJE WILLEMTJE WILLEMYNA WILLEMIJNA WILSJE WILLEMPJE WILLEMEINTJE WILLEMIJNTJE WILLEMINTJE WILELMINA WILHELMINE WILLEMPJE WILLEMTJE WILLEMIJN WILLEMIJNTJE ‐
WILLEMIJNTJE ‐
WILLEMIJN ‐
WILHELMINA ‐
WILHELMIMA ‐
WILHELMINA
‐
WILHELMIJNA ‐
WILLEMKE ‐
WILLEPMJE ‐
WILLEPMJE ‐
WILLEMIJNTJE ‐
WILHELMA ‐
WILLEMINA ‐
WILLEINTJE ‐
WILHELMIJNA ‐
WILHELMINA ‐
WILLEMINA ‐
WILHELMIA ‐
WILLEMTIEN ‐
WILLEKE ‐
WILHELMINA ‐
WILHELMINA ‐
WILLEMPTJE ‐
WILLEMIEN ‐
WILLEM ‐
WILLEMINA ‐
WILTIEN ‐
WILMKE ‐
WELHELMINA ‐
GUILLIELMINE ‐
WILLEMTIEN ‐
WILHELMIENA ‐
WILMINA ‐
WILLEMKE ‐
WELLEMTJE ‐
WILLEMIN ‐
WILMTJE ‐
WILLEMINA ‐
WILLELMIN ‐
GUILLIELMINE ‐
WILLEMINA ‐
WILEMIJNA ‐
WILLEMTIJN ‐
WILLEMINA ‐
WILLEMIJNE ‐
WILLEMS ‐
WILLEMINE ‐
WILLEMKE ‐
WILLEMIJNTJE ‐
WILLEMINA ‐
Utrecht Leiden
WILLEMINTJE WILLEMEIJNTJE WILLEMIJNTJE
WILLEMIJNA WILHELMINA WILHLEMINA WILHELMINA WILLEMPJE WILLEMKE WILLEMPJE WILLEMINA WILLEMIJNA WILLLEMINA WILLEMPJE WILLEMIJNA WILHELMUS WILHELMUS WILHELMINA WILTIEN WILLEMKE WILHLMINA WILHEMINA WILLEMTJEN WILLEMTIEN WILLEMPJE WILLEMIJNE WILMTIEN WILLEMKEN WILHELMINA GUILLELMINE WILLEMPIEN WILHELMINA WILMIENA WILLEMTIEN WELMTJE WILHELMINA WILLEMTJE WILMINA WILHELMINA WILHELMINA WILLEMKE WILLEMIJNA WILLEMTJE WILLEMMINA WILLEMIJNA WILLEMINA WILLELMINA WILMKE WILLEMIENTJE WILLEMIMA Voorbeeld: Wilhelmina –
Guilaumine
Guilielmina
Guillemina
Welhelmina
Wiilemijna
Wilehlmina
Wilhelma
Wilhelmijntje
Silhelmijna
Willemke
Wilmijn
Wimpke
Wulmina
WILLEMA WILLEMINA
WILHELINA WILLEMKEN WILLEMINA WILLEMIJNTJE WILHELMINA WULLEMPJE WILLEMINA WILHELMINE WILLEMIJN WILLEMIJNE WILLEMPTJE WILHELM WILLEMIEN WILLEMINA WILHELMA WILHELMINE WILLEMIN GUILLEMINE WILLEMIENTJE WILLMINA WILLEMIJNA WILLEMINA GUILLELMINE WILLEMIJNTJE WILLEM WILHELMINA WILMPJE WILLEMINA WILLEMKE WILLEMKE WILLEMIJNTJE WILLEMIJNTJE WILLEMPJE WILLEMINA WILLEINTJE WILLEMTJEN WILLEMTJE WILLEMINA GUILLIELMINE WILLEMPIEN WILHELMINA WILLEMINA WILLEMIEN WILLEMINA WILMINE WILKENS WILLEMINE WILLEMTJEN ‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
WILLEMINA WILLEMEIJNTJE WILHELMINA WILLENKE WILLEMTJE WILLIMPJE WILLEMIJNTJE WILLEMPJE WELLEMINA WILLEMINE WILHELMINA WILHELMINA WILMPTJE WILHELMI WILHELMINA WILLEMKEN WILHELMINA WILLEMINA WILLEMINA WILHELMINE WILLEMEINTJE WILHELMINA WILEMINA WILLMINA WILHELMINE WILMIENA WILLEMS WILMINA WILLEMTJE WILLEMIENTJE WILLEMTJE WILLEMPKE WILLEMKEN WILLEMIJNTIE WILEMTJE WILMIJNTJE WILLEMTJE WILLEMPJE WILLMEPJE WILHELMIMA GUILIELMINE WILLEMPJE WILLEMTJE WILLEMEINTJE WILLEMIN WILMPJE WILLEMINE WILKES WILMINA WILLMEPJE WIILEMINA WILEHELMINA WILHELMINA
WILLEMKEN WILLEMIENTJE WILLEMA WILLEMPJEN WILLEMPIEN WILHELHERMINA GUILLEMINE WILLEMIJNTJE WILLEMPJE WILLEMINE WILLEMINA WILLEMPKE GUILLELMINE WILLEMIENA WILLEMIJNTIE WILLELMINA GUILLEMINE WILLEMIENA WILLEMINA WILELMINA GUILLEMINA WILLEMKE WILLEMKE WILLEMTJEN WILLEMPIEN WILLEMJE WILLEMKEN WILEMIJNA WILHELMINA WILLEMTJE WILLEMTIEN WILLEMTIEN GUILHELMINE WILLEMKE WILHELMINA WILHELLEMINA WILEMINA WILLEMJEN WILMINE WILHELMIN WILLEMPJ ‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
‐
WILLEMINA WILHELMINA WILLEMDINA WILHELMINA WILLEMIJNA WILLEMS WILLEMTJEN WILLEMTJE WILHELMINA WILHELMINA WILMIJNTJE WILMPJE WILLEMIENE WILLEMSEN WILLEMPJE GUILLELMINA WILLEMPJE WILLEMPJE WILLEMINA GUILLELMINA WILHELMIENA WILHELMIENA WILHELMINA GUILLELMINE WILEMKE WILLEM WILLEMTIJN WILLEMPJEN WILLEMTJE WILLEM WILMIJNA WILLEMIENA WILLEMTJEN WILLEMS WILLEMPJE GUILLELMINE WIMPKE WILKELINA WILHELMINA WILLEMINA WILLEMKEN WILLEMINA WILHELMINA WILLEMPJE • variantparen (zijn verbonden)
Jan ‐ Johannes
Jan ‐ Joannes
Jan ‐ Johan
Johannes – Johan, etc
• maken groep Jan {Jan, Johannes, Joannes, Johan}
Links
21
Utrecht Leiden
1.221 (16.487 namen)
1.530 (23.816 namen)
11.686 (93.839 namen)
in de buurt van het aantal namen in Nederlandsche geslachtsnamen van Winkler 1885 (bevat weinig varianten)
Famillement 2014 Leiden
Links
Famillement 2014 Leiden
Links
22
conclusies
in de buurt van het aantal lemma’s in het woordenboek van voornamen van vd Schaar 1964
Utrecht Leiden
20
naamgroepen
naamgroepen / standaarden
• achternamen
Links
en nog veel meer
Famillement 2014 Leiden
• mannelijke voornamen
• vrouwelijke voornamen
Famillement 2014 Leiden
23
• naamvarianten behoeven een bewijs
• automatische analyse is succesvol, maar
• fouten bij registratie, transcriptie en typen geven een probleem
• taalkundige/naamkundige kennis is nodig om onderscheid te maken tussen varianten en fouten (maar < 2% van de gevallen)
• resultaten zijn een veelbelovende start van een nationaal repertorium van naamvarianten (en standaarden)
Utrecht Leiden
Famillement 2014 Leiden
Links
24
4
9‐10‐2014
vragen en discussie
Utrecht Leiden
Famillement 2014 Leiden
Links
25
5