Aantal Nederlandse profielen / Number of Dutch profiles

+12 votes
292 views

Aleš Trtnik heeft een voortreffelijke, uitgebreide analyse gemaakt van de Wikitree database. Daaruit blijkt dat er zo'n 180.000 Nederlandse profielen zijn! Bij zo'n 15% van de ruim 10,5 miljoen profielen is geen land vastgelegd, dus het totaal aantal Nederlandse profielen zal ruim 200.000 zijn.

Aleš heeft daarbij ook alle profielen gecontroleerd op fouten. Er zijn 215.000 fouten geconstateerd. Aannemende dat Nederlandse profielen gemiddeld van kwaliteit zijn betekent dat 3000 fouten in Nederlandse profielen!

Aleš stelt voor een project te starten om de fouten op te lossen. Steun dat initiatief Dutch Rooters!


Aleš Trtnik has performed an excellent, comprehensive analysis of the Wiki Tree database. This shows that there are about 180,000 Dutch profiles! In about 15% of the more than 10.5 million profiles no country is recorded, so the total number of Dutch profiles will be more than 200,000.

Aleš also checked profiles for errors. There are 215,000 diagnosed faults. Assuming Dutch profiles are of average quality this means 3000 errors in Dutch profiles!

Aleš proposes to launch a project to fix the errors. Support this initiative Dutch Rooters!

 

in The Tree House by Jan Terink G2G6 Pilot (202k points)
retagged by Jan Terink
Ik denk dat Unnamed het beste is. Begrijpt iedereen direct.
Levenloos komt inderdaad vaker voor, maar Unnamed, of misschien beter nog, Naamloos of Sine Nomine, is beter.

Om het geslacht toch nog vast te kunnen leggen kijk ik in de betreffende overlijdensakte, waar meestal wel het geslacht vermeld staat.

Wikitree lijdt ernstig aan een gebrek aan controles (vandaar dat wij nu met de kraan open aan het dweilen zijn) en zeer weinig menskracht om wijzigingen in de software door te voeren. Jouw 'leeg laten' wens heeft dus helaas nauwelijks kans van slagen...
Dweilen met de kraan open.... dat gevoel kreeg ik ook zo langzamerhand. Aan de andere kant activeert het mensen. Bijvoorbeeld door een opmerking van mij en een beetje hulp hebben we weer een Dutch Roots lid bij (Amy) die nu druk aan het zoeken is naar bronnen voor haar Nederlandse voorouders.

Het valt mij verder op dat er zeer veel profielen zonder fatsoenlijke bronnen zijn. Er wordt ook veel verwezen naar anderen stambomen.
Standaard is Unknown, ook voor kinderen ...dus als er toevallig iemand langs komt om toch te controleren :P Zal Unnamed of Levenloos , Baby (ook al tegen gekomen) ws. verandert worden in Unknown weer...
Er is een enorme hoeveelheid aan mega (duplicaat) Gedcoms geimporteerd en vandaar ook de Projecten, alles wordt zo meer en meer verdeeld in kleinere stukjes en hopelijk zo dus ook overzichtelijker .

Het werkt wel, want ik weet nog goed hoe bijvoorbeeld de NNS families er eerst uitzagen, nu 3 jaar later is er al een heleboel verbeterd dus er is hoop, al denk ik wel dat er net als voor de Pre-1500 profielen snel iets geregeld of gedaan moet worden aan de mogelijkheid om Pre-1700 en misschien voor de Nederlandse profielen zelfs ook Pre-1811 Gedcoms te blijven importeren zonder duplicaten te skippen of ze weer te unskippen om zo toch de hele Gedcom compleet en inclusief soms weer heel veel duplicaten te importeren ....want dat is een van de grootste problemen nog steeds ...

Bij doodgeboren kinderen zou in de prefix kunnen worden ingevuld: Levenloos of  Stillborn.

Wat wel eens gedaan wordt is als er meerdere kinderen met dezelfde naam in een gezin voorkomen is bij het suffix veld infant invullen . 

Dan zou er , in combinatie met Unknown dus komen te staan Unknown achternaam infant zoals hier Jacob Barentsz Cool .

Can someone with a pré-1500 badge change the year he died from this stillborn child from 0189 to 1899 from http://www.wikitree.com/wiki/Jongeneel-288

Geregeld

Rob stuurde mij de suggestie om in het geval van een onbekende voornaam van jonge kinderen, Unnamed Infant te gebruiken. Ben toen nog eens op zoek gegaan of er duidelijke regels voor zijn bij WikiTree en zoals ik had kunnen verwachten kende  Rob de regel: 

   http://www.wikitree.com/wiki/Name_Fields#Proper_First_Name 

  • If an infant died before he or she could be named, use Unnamed Infant. Do not use Infant BoyBaby Girl, etc. There is a gender field for this.

 

5 Answers

+4 votes
 
Best answer
Seriously???? Based on that I am a profile manager for roughly 0.5 to 1% of all the Dutch profiles on Wikitree....
by Rob Ton G2G6 Pilot (274k points)
selected by Astrid Spaargaren
Rob,

I would not be surprised at all if indeed you manage that many profiles. Or are you saying the statistics are in error?
+2 votes
Bedankt voor de tip Jan, erg handig!
by Joop van Belzen G2G6 Mach 9 (95.4k points)
Okay Rob just said he will on the Gelderland profiles. JOKING!!!!!!!!!!!!! LOL!!!!!!! <3  (Rob if you will be an add on this I m sure you will like to be at Gelderland, if you don t like, please post that here. None will judge on that) You re a very great helper at any at the Dutch Roots!!

 

Joop on the Zeeland ones. Jan on the Noord-Holland ones. I hate the South-Holland National Archief (although I got better in there cause of BWJ s help), so hope/pray BWJ will jump in............ Bea is good at Drenthe (well at anything but think best at Drenthe and mabey Friesland)........

 

Leaves me Friesland, Groningen, Utrecht, Noord-Brabant, Limburg, Overijssel and.............. lol Flevoland................

Okay let me start at Groningen.......... As I m kind of into that region because of adopting the Aalfs :D Anyone needs Groningen more than me? Just tell me.....................

Can someone introduce us to Aleš Trtnik? His name is N O T looking dutch anyway. :D AND how to find errors easily or do we have to check every profile?

 

And you all! We can be very proud on the amount of Dutch profiles! MG that is a big bunch!!!! It is JUST 3k errors! That s just very good. Let's find them! 

 

Is there anyway to find them easily. Faults at? Info, dates, total profiles. What we re searching for. Just be clear. Thank  you! 

 

A. 

@Astrid

There is a free space page with the error statistics: http://www.wikitree.com/wiki/Space:Database_dump_errors

To view a selection of the errors by location: http://www.sdms.si:92/wikitree/ShowErrors.htm

Entering groningen in the location field results in a list of 322 errors, each with a link to the profile(s) involved and a description of the error.

The list is sorted ascending on birth date, so it starts with the profiles hardest to fix! For quick wins you could start at the bottom (newest birth dates), like I did.

In case a protected profile needs fixing I post a comment, hoping the profile manager takes action.

Have fun fixing!

@ Astrid ... Hahaha I was already working on trying to sort out the Fries , Drents and Groningen families, they are very popular, so will check those and whatever else I come across of course ..Overijssel (Twente) . We now have these great error check lists, so we can work our way down ...if we don't get too distracted by searching for and adding sources and so on as well that is of course , sometimes to correct things we really need sources first of course ..
@ Jan  You re a star! Thank you! That is loud and clear. I think I can find that out! Great! :)

@ Bea. :) I know you, just a little. And Jan told me to work the list up instead of down :P

That is a "Kek dingetje!"/Great Tool!!!! :D 

Anyone has a clue if it updates and if in ??? how many hours??? (48 hours with the WikiTree database??).

 

 

Deep bow for Aleš Trtnik!!! Thank you thousend times! 

A. 

it takes a month now , so abt June 10 you will see the result , see the other G2G ;) 

Enne Astridjeee moet er nog iemand een badge voor de Challenge ?? 

Ik loop zwaar achter, helemaal niet handig 2 weken vakantie :P 

Ja challenge verloren in weer en dit "kekke dingetje" :D

Ik weet wie de dikke winnaar is. Maar hou t nog ff geheim tot WikiTree geupdate is. Dus Jan moet nog ff geduldig zijn (ahahahaa) maar dan kunnen we m an m uitreiken! :D :P
Hahaha jaaa heerlijk weertje he en geweldig ''dingetje ''Zal morgen ff kijken !
In my ID-tree for Goolaerts-1, 6 errors were reported, but the same error can effect several profiles.
So I did edit 2 errors and that solved all 6.
A few hours later I again searched for errors on the same tree and the screen reported no errors in my tree. So the results already were updated in just a few hours.

By the way: the number of errors for the Netherlands has gone up.
Yesterday there were 3.072 errors, now there are 3.110.

@ALL

Aleš does the checking and reporting based on a dump of the Wikitree database that is refreshed once a month. In between he may fine tune the error checking (based on feedback from users), resulting in more (or less) errors.

So when you search for errors  it's not done on the live tree, but on a copy of the tree that is at the most one month old, so don't expect to see the result of your error fixing immediately!

Have a look at these threads for more info:

Results of Aleš's analysis can be found on free space pages:

@ Jan and @ Pierre. Thank you both. :)
@Pierre,

I really have no idea why the query now results in another number of errors. As the query is not performed on the live tree but on a (unchanged) copy, numbers should be constant, unless the error checking software is modified in between.

Ik kijk wat ik kan doen met Zuid-Holland, maar met de pré-1700 profielen zal ik waarschijnlijk niet veel doen.

+1 vote

YES!!!

A project for fixing database errors has been launched

http://www.wikitree.com/wiki/Project:Database_Errors

GET INVOLVED!

by Jan Terink G2G6 Pilot (202k points)
+2 votes

I have made an EXCEL error-list for all the profiles with the location Netherlands without any of the 12 provinces,
It is a list with 955 error records,
If anyone is interested I will gladly send it to him or her.
Just let me know your e-mail adres in a personal e-mail.

by Pierre Goolaerts G2G6 Mach 1 (18.3k points)
Pierre,

Thanks for the offer!

I would say send it only to the first volunteer that will actually start processing it (and that won't be me as I am still busy processing Noord-Holland). When multiple people start processing the same list they should coordinate, otherwise one risks trying to fix errors already fixed.
+2 votes

Yes! I tried to do this with searches via Google (Born 1000 etc), but this is more comprehensive. Now I need more time... and someone to correct the Pre-1500 date on the profile Van_Werkhoven-10 to 1849. I'll chip in with the Noord- and Zuid-Holland profiles when I'm done with my own list.

by B. W. J. Molier G2G6 Mach 4 (49.9k points)
@BWJ

Be aware that multiple people working on the same list will lead to cases where you try to fix an error already fixed by somebody else. Pretty clear in simple cases like missing gender, wrong gender, century eroors in dates, but complex cases where parts of a tree needed to be corrected can be quite confusing for the second fixer. I had a case where a father was born later than his son, but turned out to be not his father but his 'achterachterkleinzoon'.

I am already working with the errors in Zuid-Holland records. And have checked the record #552 down to #351 and will go down further. At the moment I see a lot of records that are already checked by Rob Ton. I wonder if he perhaps started also on Zuid-Holland but from record #1 up. 
Jan Terink is working on the Noord-Holland records so that's no option too.
I can send you an Ecxel file with, let's say, 200 records with location Netherlands without provinces.. If you like that, just let me know. 

Good idea, thanks for the warning. I'm just finding my feet with the error tool, but it looks quite complete.

In de nieuwe versie van 11 mei is het aantal error-records enorm gestegen van iets meer dan 3.000 tot meer dan 9.000 voor 'Netherlands".
Dit komt doordat een nieuwe error #511 is toegevoegd die vraagt om de spelling van een zgn. unieke naam te controleren. Omdat in Nederland alle voornamen in het PFN veld worden geschreven, worden er bij ons erg veel unieke combinaties gevormd, die veelal een False error opleveren. 

Error #511 is weer uit de lijst gehaald, het totale aantal records is meer dan gehalveerd.
Dit soort wijzigingen kan je natuurlijk verwachten aan het begin van een nieuw project. :)
Mij staat ook bij dat ik gisteravond laat voor noord-holland 1600+ fouten kreeg. Vanochtend waren dat er maar 500+. Kan zijn dat eerst gecheckt werd op "Paul Jean" en nu afzonderlijk op "Pierre" en op "Jean". Dat laatste leidt natuurlijk tot veel minder fouten.

En inderdaad, symptomen als deze zijn te verwachten zolang er nog fijnafstemming van de software plaats vindt.
@Pierre

Bedankt voor je set van 200. Ik loop nu tegen de maximum aantal Comments aan die ik mag posten. Veel profiles zijn Groen, bij de regel 72 heb ik 34 comments, 30 fixes, 4 no errors, 2 proposed merges en een paar die al door iemand anders is aangepast.

Arme Ludwig...

@Pierre,

Error #511 is weer terug. Zojuist noord-holland weer opgevraagd en nu 1146 errors...

't is alleen nog wat erger geworden. :)
Netherlands geeft nu 10.000 errors.

Ik laat het nog wel even zonder #511.

Related questions

+5 votes
1 answer
+9 votes
1 answer

WikiTree  ~  About  ~  Help Help  ~  Search Person Search  ~  Surname:

disclaimer - terms - copyright

...