Het komt regelmatig voor dat als je werkt met #BigData, je zowel extreem grote als extreem kleine waarden tegenkomt, vooral bij financiële data. Het kan lastig zijn om zulke waarden te labellen, of het nu in de view of via de tooltip is; je publiek kan het misschien lastig hebben om het verschil tussen 0,1M en 0,2M waarden te odnerscheiden en je kunt ze ook verwarren als ze moeten kijken naar een view met 26.901K en 32.301K waarden die ze moeten verwerken. Maar, in typische Tableay stijl, is er een best eenvoudig workaround om die issue te verhelpen en je te helpen om duidelijker inzicht en gebruikersvriendelijkere visualisatie te realiseren.

In dit korte voorbeeld zal ik de voorbeeld dataset Sample World Indicators  gebruiken, die standaard wordt meegeleverd met Tableau. Wanneer je kijkt naar de total population data, zul je zien dat er diverse landen zijn met een populatie van meer dan 100M mensen, veel kleinere landen met een populatie van minder dan 1M mensen en een groot aantal wat daar ergens tussenin zit. Wanneer je werkt met dergelijke gevarieerde dataset, wil je je publiek in staat stellen om landen eenvoudig met elkaar te vergelijken waarbij gebruik gemaakt kan worden van een geschikt niveau van precisie.

 

Untitled
Klik om de afbeelding te vergroten

In dit geval zal het tonen van de kleinere landen in ronde duizendtallen geschikt zijn, omdat je eenvoudig de variatie tussen de landen kunt zien zonder de noodzaak voor extra precisie. De dichtbevolkte landen kunnen eenvoudig worden geidentificeerd in afgeronde miljoenentallen – tenslotte, wat gaat een extra 0,4m je vertellen wanneer je kijkt naar bijvoorbeeld China of India! De overgebleven landen tonen echter een grote verscheidenheid, dus misschien is het hier wel slim om deze te laten zien in miljoenen afgerond op 1 decimaal om extra te verduidelijken tijdens het vergelijken.

Collega Information Lab consultant Phil Lowe toonde me deze handige tip die slechts een aantal nieuwe calculaties vereist en je kunt los! We willen Tableau laten herkennen wanneer een waarde een bepaalde grens (treshold) bereikt en anders een null value teruggeeft, wat vervolgens kan worden gerepliceerd voor zo vaak als nodig. Als de calculaties eenmaal zijn gemaakt, kun je simpelweg het default formaat van elke nieuwe calculatie aanpassen naar het gewenste formaat en deze in de view opnemen.

Om te starten, beginnen we met het maken van onze calculaties om de aantallen van minder van een miljoen te herkennen, daarbij inachtnemend dat we zowel positieve als negatieve waarden moeten afvangen (hoewel dit natuurlijk geen issue zal zijn in dit voorbeeld):

 

K

Vervolgens willen we alle waarden afvangen tussen 1M en 100M:

Less than 100M

Tenslotten vangen we alle waarden boven 100M af:

Gtr than 100M

Als dit eenmaal gedaan is, is het simpelweg een zaak om door elk van de nieuwe calculated fields te gaan en het juiste default number format toe te wijzen:

NF K

NFLT 100

NFGT 100

Als je de formattering aan de nieuwe calculated fields correct hebt ingesteld, moeten ze worden toegevoegd aan de view. Omdat we ze zo hebben gemaakt dat ze een null value teruggeven wanneer de specifieke grenswaarde niet is bereikt, kunnen we eenvoudigweg alle drie de velden toevoegen aan het label (of tooltip) en alleen de relevante waarde zal worden getoond.

Label

Tooltip

En hier is het eindresultaat. Zoals je kunt zien, wanneer je door de view heen scrollt, zal elke rij een waarde in de label/tooltip tonen die varieert afhankelijk van de grootte van de waarde.

Deze simpele tip werkt erg goed wanneer je te maken hebt met vergelijkbare data, maar het werkt minder goed als je de mogelijkheid moet hebben om te kunnen switchen tussen meerdere number types, zoals percentages, valuta en absolute waarden. Als je hiermee worstelt, check dan eens deze handige blog van Andrew Pick.


Originele blogpost van Rob Suddaby, geplaatst op 4 aug 2016 op TIL UK.
Prefer the original blog from Rob Suddaby, TIL UK in English? Click here