Jeg begynte for flere år siden å registre slektsinformasjon på data. Det første fundamentale problemet jeg støtte på var skrivemåten for navn. Det første og enkle problemet er kvinner som skifter navn ved giftermål. Verre er det at inntil for omlag hundre år siden var det ingen stabile regler for skriving av navn. Folk skrev etter lydskrift, som varierte med lokal uttale og individuelt skjønn. Og prestene skrev et slags dansk. I nyere tid har vi fått navnelover som er svært liberale mht. navneskifte. Alt dette gjør at en og samme person vil eksistere under flere ulike navn i løpet av livet og ofte samtidig, avhengig av kilde.
Det omvendte problemet oppstår ved navnesammenfall, flere personer har samme navn. Når f.eks. fem personer i en familie alle heter Ola med samme etternavn og patronymikon, blir det problemer.
Jeg har lest flere bøker og artikler om slektsgransking uten å finne noen som diskuterer dette problemet og foreslår løsninger. Jeg ser at slektsgranskere og bygdebokforfattere forsøker å løse dette ved ulike former for normalisering for å tilordne en person ett navn. F.eks. kan navnet skrives som i kirkeboka, det kan legges opp til lokal uttale/dialekt, eller normaliseres til dagens nynorsk eller bokmål. Problemet da er at det valgte navnet avviker fra skrivemåten i kildene.
Så lenge teksten bare skal leses av mennesker, er det ikke så kritisk. En menneskelig leser vil normalt kunne tolke ulike skriveformer til samme person. I vår nye digitale verden. derimot, fungerer det ikke. En av de viktigste fordelene vi vil oppnå med digital tekst, er å gjøre teksten maskinelt søkbar. Da må det være mulig å søke på alle ulike skrivemåter og finne rett person. Bruk av soundexkode hjelper noe, men ikke nok. Eneste fullverdige løsning er å registrere alle navnevariantene for en person.
For å handtere dette problemet er det nødvendig å ha et slektsprogram med stor fleksibilitet for registering av navn. Fornavn, mellomnavn, patronymikon og etternavn må kunne registreres i separate felt. I tillegg må det være mulig å legge til prefiks og suffiks. Videre må en person kunne tilordnes et ubegrenset antall navnevarianter. Alle navnevariantene må kunne søkes på.
Men slik fleksibilitet gir også opphav til nye behov. F.eks ved generering av rapporter må en kunne velge hvilken navnevariant som skal brukes. I mange program er dette ikke mulig uten å endre primærnavnet, evt. visningen av primærnavnet, da det alltid er primærnavnet som inngår i en rapport. Dette er en uheldig sammenblanding av funksjoner. Det må skilles mellom hvordan en person registreres og vises i på skjermen, og hvordan personen skal navngis i en rapport.
Det er dessuten nødvendig med visse kjøreregler for å utnytte en så stor fleksibilitet på en strukturert måte slik at kaos unngås. Dette er et tema som hoppes lett over. Jeg har etter en del prøving og feiling kommet fram til følgende regler:
1. Probanden registreres med sitt fulle fødsels- eller døpenavn som primærnavn. Dette navnet må ligge fast.
2. Om nødvendig gjøres navnet entydig vha. patronymikon, suffiks eller prefiks.
Om det er valg mellom to, brukes suffiks 'd.e.' hhv. 'd.y.' eller 'sr.'/'jr.'. Er det flere, brukes romertall.
3. Legg til alle navnevariantene probanden er kjent under. F.eks. navneendring ved ekteskap, ulike skrivemåter eller kallenavn.
4. Angi hvilken variant skal brukes som rapportnavn.
Jeg mottar gjerne synspunkter på dette og vil vite hvordan andre har løst dette problemet.
mvh
Kristen Rekdal
Digitale navn
Moderatorer: MOD_Kildereg, MOD_Generellt
Re: Digitale navn
Som produsent av GEDtreff, har jeg også støtt mye på problemet du nevner.
Det som er første problem er at Gedcom gir dårlig støtte til ikke-amerikanske navneformer, dvs. annet enn fornavn og et fast slektsnavn, dvs. et etternavn som arves fra generasjon til generasjon. Eksempel kan være at en Ola Olsen utvandret i 1825 til USA. Der vil altså alle mannlige etterkommere ha slektsnavnet Olson, mens søskenbarna i Norge med svært stor sannsynlighet ikke heter Olson, men har et patronym etter sin far.
Så skal man innføre flere felter i slektsprogrammer så må Gedcom oppdateres med henblikk på dette, og også åpne for andre navnetradisjoner enn våre i Norge. Man har land hvor fornavn nevnes sist og flere andre varianter, spesielt i Østen så vidt jeg har forstått. En Gedcom-standard må gjelde alle nasjonaliteter om det skal ha noe for seg og plukke opp alle variantene
Når det gjelder maskinell gjenkjenning er det opp til programmet å foreta normering, og ikke nødvendigvis registrator.
Med neste versjon av DIStreff på nett vil vi samtidig sette i gang normalisering av fornavn og har allerede en base med tilhørende normaliseringseditor på ca. 25000 fornavnn som har vært brukt av norske slektsforskere ! (Mange utenlandske navn dog, men registrert i norske databaser). Jeg har invitert i DIStreff-konferansen flere ganger til en dugnad med å kontrollere om grupperingene (basert på Lars Nygaards navnenormaliseringsmetode Foneq) hvor alle navn normalisert til samme normalnavn er samgruppert i utgagspunktet, men hvor en del normalnavn er overflødige så disse må fjernes og tilhørende navn skal overføres til et annen normalnavn.
Ad det du skriver om å registrere patronym og navn ved dåp og bruke det fast som primærnavn tror jeg de fleste gjør.
En del slektsprogram har også støtte for å registrere senere navnevarianter og evt, navnebytte, f.eks. etter navnebevilling som jeg en gang fant at min bestefar hadde fått, lenge før den første navneloven ble vedtatt i 1921 (har det eksistert en tidligere tro siden dette var før 1900??)
Men jeg tror samtidig at å diskutere slike regler er et opplegg til polsk riksdag hvor det vil være mange meninger, spesielt fordi mange har store baser hvor det vil medføre store mengder arbeide om alle skal omregistrere alle sine registreringer for å få dem unisone med et bestemt sett å registrere navn på.
Derfor mener jeg det er programskapernes problem å finne algoritmer for å normalisere slik at navn kan sammenlignes, ikke registratorene.
Når det gjelder programmet NavnNormering (som jeg også lager, men ikke har publisert, og ant. ikke kommer til å publisere), så brukes en flertallsregel for hva som brukes som navnnorm. Den navneformen som folk har registrert for et felles Foneqnavn, velges da automatisk til å være navnnormen som er meningen å være søkeordet i DIStreff. Så hvis Per er valgt som norm og Peder, Peter, Petter og Pjotr er registrert som varianter av Per, så er det meningen at søk på Peter også vil vise alle som er registrert som Per, Peter, Petter og Pjotr.
Når du skriver om bruk av d.e. og d.y. eller junior eller senior, så husk at dette er kun gyldig en gang i livet. I det øyeblikk d.e. dør og blir oppkalt blir d.y. plutselig d.e. og den nyfødte d.y. Altså er man like langt.
Alternativt kan man gjøre som amerikanere og bruke I, II, III, IV osv. men det er det ikke tradisjoner for her i Norge, og derfor lite heldig å innføre. Derimot kan det jo være aktuelt å registrere som navnevariant om man i tilknytning til navnevarianter også kan tidfeste bruken, f.eks, om den første Ole var han ikke d.y. da ha ble født, men ble d.e. da sønnen ble født i f.eks. 1720. Da burde man kunne registrere som tillegg dette, at han var d,e, fra 1820 til sin død. For barnet var han d.y, fra fødsel til faren døde i 1835, deretter ikke noe, helt til han døpte sin Ole i 1845, hvor han så ble den d.e. helt til barnebarnet døpte sin Ole i 1865, hvorpå Ole d.e. ble Ole d.m.e eller noe slikt og Ole d.y. så ble Ole d.e.
De fleste programmer bruker primærnavn som rapportnavn, Noen bruker f.eks. * for å markere tiltalsnavn, f.eks. Disgen om tiltalsnavnet ikke er første fornavn.
Håper dette interesserer.
Det som er første problem er at Gedcom gir dårlig støtte til ikke-amerikanske navneformer, dvs. annet enn fornavn og et fast slektsnavn, dvs. et etternavn som arves fra generasjon til generasjon. Eksempel kan være at en Ola Olsen utvandret i 1825 til USA. Der vil altså alle mannlige etterkommere ha slektsnavnet Olson, mens søskenbarna i Norge med svært stor sannsynlighet ikke heter Olson, men har et patronym etter sin far.
Så skal man innføre flere felter i slektsprogrammer så må Gedcom oppdateres med henblikk på dette, og også åpne for andre navnetradisjoner enn våre i Norge. Man har land hvor fornavn nevnes sist og flere andre varianter, spesielt i Østen så vidt jeg har forstått. En Gedcom-standard må gjelde alle nasjonaliteter om det skal ha noe for seg og plukke opp alle variantene
Når det gjelder maskinell gjenkjenning er det opp til programmet å foreta normering, og ikke nødvendigvis registrator.
Med neste versjon av DIStreff på nett vil vi samtidig sette i gang normalisering av fornavn og har allerede en base med tilhørende normaliseringseditor på ca. 25000 fornavnn som har vært brukt av norske slektsforskere ! (Mange utenlandske navn dog, men registrert i norske databaser). Jeg har invitert i DIStreff-konferansen flere ganger til en dugnad med å kontrollere om grupperingene (basert på Lars Nygaards navnenormaliseringsmetode Foneq) hvor alle navn normalisert til samme normalnavn er samgruppert i utgagspunktet, men hvor en del normalnavn er overflødige så disse må fjernes og tilhørende navn skal overføres til et annen normalnavn.
Ad det du skriver om å registrere patronym og navn ved dåp og bruke det fast som primærnavn tror jeg de fleste gjør.
En del slektsprogram har også støtte for å registrere senere navnevarianter og evt, navnebytte, f.eks. etter navnebevilling som jeg en gang fant at min bestefar hadde fått, lenge før den første navneloven ble vedtatt i 1921 (har det eksistert en tidligere tro siden dette var før 1900??)
Men jeg tror samtidig at å diskutere slike regler er et opplegg til polsk riksdag hvor det vil være mange meninger, spesielt fordi mange har store baser hvor det vil medføre store mengder arbeide om alle skal omregistrere alle sine registreringer for å få dem unisone med et bestemt sett å registrere navn på.
Derfor mener jeg det er programskapernes problem å finne algoritmer for å normalisere slik at navn kan sammenlignes, ikke registratorene.
Når det gjelder programmet NavnNormering (som jeg også lager, men ikke har publisert, og ant. ikke kommer til å publisere), så brukes en flertallsregel for hva som brukes som navnnorm. Den navneformen som folk har registrert for et felles Foneqnavn, velges da automatisk til å være navnnormen som er meningen å være søkeordet i DIStreff. Så hvis Per er valgt som norm og Peder, Peter, Petter og Pjotr er registrert som varianter av Per, så er det meningen at søk på Peter også vil vise alle som er registrert som Per, Peter, Petter og Pjotr.

Når du skriver om bruk av d.e. og d.y. eller junior eller senior, så husk at dette er kun gyldig en gang i livet. I det øyeblikk d.e. dør og blir oppkalt blir d.y. plutselig d.e. og den nyfødte d.y. Altså er man like langt.
Alternativt kan man gjøre som amerikanere og bruke I, II, III, IV osv. men det er det ikke tradisjoner for her i Norge, og derfor lite heldig å innføre. Derimot kan det jo være aktuelt å registrere som navnevariant om man i tilknytning til navnevarianter også kan tidfeste bruken, f.eks, om den første Ole var han ikke d.y. da ha ble født, men ble d.e. da sønnen ble født i f.eks. 1720. Da burde man kunne registrere som tillegg dette, at han var d,e, fra 1820 til sin død. For barnet var han d.y, fra fødsel til faren døde i 1835, deretter ikke noe, helt til han døpte sin Ole i 1845, hvor han så ble den d.e. helt til barnebarnet døpte sin Ole i 1865, hvorpå Ole d.e. ble Ole d.m.e eller noe slikt og Ole d.y. så ble Ole d.e.

De fleste programmer bruker primærnavn som rapportnavn, Noen bruker f.eks. * for å markere tiltalsnavn, f.eks. Disgen om tiltalsnavnet ikke er første fornavn.
Håper dette interesserer.
Re: Digitale navn
PS. GEDtreff bruker en spesiell algoritme for å identifisere patronymer som baserer seg på at stammen i patronymet er et mannsfornavn.
Dessverre viser det seg at algoritmen har hatt noen svakheter som senest i går kveld ble forsøkt å rette opp i.
Dessutem baserer den seg på at fornavnet er kjent for programmet. Derfor er det viktig å få registrert flest mulig fornavnsvarianter, og med rett kjønn.
Normalisering i DIStreff vil derimot ant. bli kjønnsnøytral med de bieffekter det har slik det i dag gjøres i DISBYT.
Men dette er ikke helt fastspikret. (Skal man normailsere kjønnsbestemt der hvo et fornavn har vært brukt både som manns- og kvinnenavn, f.eks. Helge (dvs. Helje eller Helga) så må man i DIStreff inn med et felt til for kjønn ved søk. Noe som vil komplisere bruken. Derfor vil ikke kjønnspesifikk normalisering bli tatt i bruk uten svært gode argumenter som taler for dette, selv om ulempene for brukere er store.
Dessverre viser det seg at algoritmen har hatt noen svakheter som senest i går kveld ble forsøkt å rette opp i.
Dessutem baserer den seg på at fornavnet er kjent for programmet. Derfor er det viktig å få registrert flest mulig fornavnsvarianter, og med rett kjønn.
Normalisering i DIStreff vil derimot ant. bli kjønnsnøytral med de bieffekter det har slik det i dag gjøres i DISBYT.
Men dette er ikke helt fastspikret. (Skal man normailsere kjønnsbestemt der hvo et fornavn har vært brukt både som manns- og kvinnenavn, f.eks. Helge (dvs. Helje eller Helga) så må man i DIStreff inn med et felt til for kjønn ved søk. Noe som vil komplisere bruken. Derfor vil ikke kjønnspesifikk normalisering bli tatt i bruk uten svært gode argumenter som taler for dette, selv om ulempene for brukere er store.

Re: Digitale navn
Vi har nedsatt en gruppe for å se på blant annet dette spørsmålet du tar opp knyttet til skriving av navn. Problemet gjelder i minst like stor grad stedsnavn som personnavn.
Jeg har informert gruppa om denne debatten
Jeg har informert gruppa om denne debatten
Re: Digitale navn
Professor Gunnar Thorvaldsen drøftet dette emnet inngående i sin doktorgradsavhandling (om maskinell lenking av persondata).
hilsen Tore H Vigerust, Moderator: Slekter