Alteryx is een extreem snelle data preparatie en onderzoek/analyse tool. Workflows kunnen enorme datasets analyseren in luttele seconden. Uitgebreide modules kunnen echter soms enige vertraging tonen…hier zijn een paar trucjes voor het optimaliseren van module performance en snelheid.

Gebruik de Select  tool na een input geeft u de mogelijkheid alleen de benodigde velden te selecteren. Deselecteer unknown (new-appearing fields), en als u hier niet zeker van bent kunt u dit altijd nog deselecteren nadat de module is gebouwd.

 

Door ook de Auto Field tool na een input te gebruiken zal de snelheid toenemen omdat het automatisch de grootte van de string fields zal inkorten tot de kortst mogelijke optie.

 

Alternatief is om handmatig deze optie aan te passen in de Formula en Join tools. Alle wijzigingen kunnen weer worden gereset in het Options menu in de tool configuration window, waar tevens duplicate fields kunnen worden verwijderd.

Tool Configuration Menu

Tool Configuration Menu

 

Tot slot, bedenk dat bij het werken met grote data sets u het aantal rijen in de workflow kunt beperken. Ga naar Workflow configuration > Runtime > Limit for All Inputs.

Workflow Configuration Menu

Workflow Configuration Menu


Deze blog werd origineel gepost op The Information Lab UK door Alexandra Hanna op 13 nov 2015.
If you like to read the original blog in English, click here.