• Hadas Shezaf

שאלת מיליון הדולר: באיזה גרף להשתמש?

בכל פעם שאני נשאלת מה אני עושה, אני לוקחת כמה שניות כדי לסקור את מי שנמצא סביבי, כדי לנחש איך הם יגיבו לצמד המילים "דאטה ויז". יש מגוון רחב של תגובות וכל פעם מתפתח שיח קצר ושונה על הנושא. אבל תמיד, ממש תמיד, באיזה שהוא שלב מישהו אומר: "תגידי הדס, באיזה גרף אני צריך להשתמש?".


אני חייבת להודות שבתחילת הדרך שלי, כשעלתה השאלה הזאת אצלי בראש, פעלתי די אינטואטיבית, בחרתי את הגרף בצורה די רנדומלית - מה שעובד, עובד. ככה, בלי שיטה מסודרת. לפעמים זה הצליח ולפעמים פחות, ולפעמים גיליתי רק בדיעבד שאולי היה עדיף להשתמש בגרף אחר. (אופסי).


כשביקשו ממני ללמד את העקרונות לויזואליזציה טובה בפעם הראשונה, ניסיתי להבין אם יש שיטת עבודה מסודרת, הרי בטוח שמישהו כבר חשב על הבעיה הזאת קודם. וכך התחלתי לחקור, אספתי מידע וגיליתי מגוון רחב של שיטות, ניסיתי לרכז אותן עבור משהו פשוט ופרקטי שיעבוד טוב בשבילי.

אז איך בוחרים את הגרף המתאים? התשובה: תלוי בסוג הקשר בין הנתונים.

קיימים כמה סוגי של קשרים בין נתונים:

  1. השוואה

  2. לאורך זמן

  3. חלק מהשלם

  4. קורלציה

  5. מיקום

*קיימים הרבה סוגים של קשרים בין נתונים ושפע של סוגי גרפים, אני בחרתי לציין כאן את המרכזיים והשימושייים ביותר.


השוואה


כאשר רוצים להשוות בין קטגוריות מסוימות, לראות מי גדול ומי קטן יותר.

דוגמאות:

  • איזה קטגוריית מוצרים נמכרה הכי הרבה באמזון

  • איזה חודש היה הכי חם ב2019

  • איזה ערוץ פרסום הכניס הכי הרבה כסף לחברה


תחת הקטגוריה הזאת לרוב נראה גרף עמודות, גרף ברים או ואריציות שלהם, שניהם יכולים לשמש להשוואה אך לכל אחד מהם יש שימושיות קצת שונה.

גרף עמודות הוא השכיח ביותר, בדוגמא מימין אפשר לראות השוואה בין סכום המכירות בקטגוריות פרי שונות (תפוחים, בננות, ענבים, תפוזים ואגסים).

בגרף ברים נשתמש כאשר אנחנו רוצים להשוות בין קטגוריות שונות ובמקביל גם לדרג אותן. לדוגמא אם נרצה לראות לאיזה טלפון יש את המצלמה הכי טובה (הדוגמא משמאל). נשים את המצלמה הכי טובה למעלה ואת זה שהכי פחות טובה למטה. הבחירה כאן דווקא בברים ולא בעמודות היא כפולה. 1. למוח האנושי קל יותר לסרוק את הנתונים מלמעלה למטה במקרה של השוואה. 2. אין לנו הגבלה של מקום ונוכל להכניס כמות גדולה של קטגוריות (כשמדובר בתצוגה דיגיטלית עם גלילה).


שיקול נוסף לגרף ברים על פני עמודות הינו כאשר שמות הקטגוריה הינם ארוכים, לדוגמא Samsung Galaxy S6, אם נשתמש בעמודות, השמות יחתכו או יופיעו בזוויות קשות לקריאה. בגרף ברים אנחנו פחות מוגבלים מבחינת מקום בהקשר הזה.


גרפים נוספים להשוואה: Proportional Area Chart , Multi-set Bar Chart




לאורך זמן


בקטגוריית גרפים זאת נשתמש כשנרצה להראות נתונים למשך תקופה מסוימת, חודש, שנה וכו'.

דוגמאות:

  • הטמפורטורה בעולם ב100 השנים האחרונות

  • מצב מניית גוגל בשנה האחרונה

  • מכירות של אופניים בחודשים לפני יום כיפור


הגרפים הכי נפוצים לקטגוריה הזאת הינם גרף עמודות וגרף קו, שניהם יכולים להציג נתונים לאורך זמן.


גרף קו מציג בצורה טובה את הטרנד / המגמה של הנתונים לאורך זמן. חשוב לציין שניתן לראות את הטרנד גם בגרף עמודות אך זה פחות אינטואטיבי ודורש מאמץ (נצטרך לשרטט בראשנו קו דמיוני המחבר בין כל הקצוות העליונים של כל העמודות). בנוסף גרף קו משמש להצגת מידע רציף כמו טמפרטורה או מנייה שמשתנה כל דקה ופחות מתאים לנתון שמסכם תקופה מסוימת (חודש, שנה וכו').

גרף עמודות יעיל כאשר יש נתון שמסכם תקופה מסוימת (חודש, שנה וכו'), כמו בדוגמא מצד ימין שמציגה את אחוזי האינפלציה בארגנטינה כל חודש במהלך שנה אחת. זה לא מידע שהוא רציף אלא סיכום של נתוני חודש שלם.


גרפים נוספים שמציגים נתונים לאורך זמן: Area Graph, Stacked Area Graph, Stream Graph



חלק מהשלם


בקטגוריית גרפים זאת נשתמש כשנרצה להציג חלק יחסית לשלם או איך השלם כולו מתחלק.

דוגמאות:

  • כמה סרטים מסוג קומדיה נצפו מסך כל הסרטים בנטפליקס

  • איך מתחלק תקציב הבטחון של ממשלת אנגליה

  • כמה מתוך המנהלים במשק הישראלי הן נשים


הגרפים המרכזיים לקטגוריה זאת הם: פאי, דונאט, גרף מוערם וTree Map.

גרף פאי הוא הנפוץ ביותר, הוא מאוד מרשים ויפה. הדוגמא למעלה משמאל מראה את החלוקה של הסדרות לדרמה, רומנטי ופנטזיה, קל להבחין שהחלק האפור כהה הוא החלק הכי גדול משמע יש הכי הרבה סדרות דרמה, לאחר מכן רומנטי והכי מעט פנטזיה.


ובמקביל, הפשטות וה"חמידות" של גרף הפאי מביאה לשימוש נרחב בו שלא תמיד מתאים לנתונים שרוצים להציג ולכן הוא לא אהוד כל כך על עולם הדאטה ויז. גרף פאי נראה חמודי אבל הוא לא כל כך קל להבנה כמו שזה נראה. כדי להבין פאי אנחנו צריכים להשוות בין הגדלים של כל חלק והזוויות שלהן, וזה לא כל כך פשוט.

גרסה אחרת לפאי היא גרף דונאט (כמו פאי רק עם עיגול ריק באמצע), כאן הפענוח עוד יותר קשה כי צריך להשוות בין הקשתות של כל החלקים - בקיצור שניהם לא הכי אינטואיטיביים. אם בא לכם לקרוא עוד על למה לא גרף פאי - תציצו כאן.

האלטרנטיבה לפאי הינה גרף מוערם (Stacked Bar Graph או column) - שמראה את אותם הנתונים כמו פאי או דונאט, אך בצורה פשוטה יותר. בגרף מוערם אנחנו צריכים להשוות בין אורכי הקו השונים ולא בין הזוויות או הקשתות, וזה הרבה יותר קל קוגניטיבית למוח האנושי.

גרף מוערם מציג את החלקים השונים של השלם אחד מעל השני, בדוגמא האמצעית רואים את חלוקת הסדרות לדרמה, קומדיה ופנטזיה בשנים 2013 - 2017. כלומר אותם נתונים של שנה אחת שהופיעו בגרף הפאי הוצגו וגם נערכה השוואה לשנים נוספות (דבר שאינו אפשרי בפאי).


גרף נוסף הוא Tree Map. גרף זה מתאים למצבים שיש לשלם הרבה חלקים. בדוגמא מימין אנחנו רואים את הייצוא של שוויץ בשנת 2009, שמורכבת מהרבה חלקים ותת חלקים. חשוב לציין שזהו גרף מורכב יותר ונמצא פחות בשימוש.


גרפים נוספים שמראים את החלוקה של השלם לחלקיו: Sunburst Diagram, Marimekko Chart



קורלציה


בקטגוריית גרפים זאת נשתמש כשנרצה להציג יחסים בין שני משתנים שונים עם מימדים שונים שלא ניתן לשים אותם על אותו הציר.

דוגמאות:

  • כמות המבקרים שנכנסו לאתר מסוים מול זמן השהייה של כל אחד מהם (כמות כניסות תוצג במספר שלם, זמן שהייה יוצג בשניות).

  • גובה של אנשים מול המשקל שלהם (גובה בסנטימטרים ומשקל בק"ג).

לקטגוריה הזאת נכנסים לא מעט גרפים, חשוב לציין שהגרפים האלו הם מורכבים יותר להסביר גם כאן וגם לצופים. לכן אני ממליצה לבחון את קהל היעד שלכם ולראות האם הגרפים הללו מתאימים לרמת ההבנה שלהם בקריאת גרפים, במקביל הייתי בודקת אם אפשר להשתמש באלטרנטיבה פשוטה יותר כמו הפרדה לשני גרפים.

גרף Scatterplot - גרף שמציג יחסיות בין שני משתנים כל אחד מהם מופיע על גבי ציר אחר. בדוגמא משמאל נראה את הגובה מול המשקל של נשים וגברים.


גרף Bubble Chart - דומה מאוד לScatterplot, אך מאפשר להכניס משתנה נוסף, שיוצג על ידי גודל העיגול. בדוגמא רואים את יצרניות הנפט הגדולות בעולם. ציר הX מראה את שמות המדינות וציר הY את כמות חביות הנפט שהן מייצרות ביום. גודל העיגול מראה את רזרבות הנפט של המדינה.


מפת חום - הצגה של מגמה בין שתי קטגוריות שונות של דאטה, נניח כמה אנשים נכנסו לאתר מסוים, בציר אחד יופיעו הימים ובציר שני השעות באותן הימים. כך נוכל לדעת מהן שעות הפיק של האתר.


גרף משולב Column + line - דרך נוספת להראות קשר בין שני משתנים היא על ידי שימוש בשני צירי Y. נניח אם נרצה להראות את כמות העסקות שנעשו כל חודש במשך שנה ואת סכום העסקאות הללו. ציר הX יציג את חודשי השנה, ציר Y ראשון יהיה העמודות שיציגו את כמות העסקאות וציר Y שני יהיה הקו שיציג את הסכום.



מיקום


מפות משמשות להראות נתונים מבוססי מיקום, כל מפה מדגישה פן אחר. מפות מושכות את העין ולרוב יוצרות הרבה עניין אצל הצופה, אבל לא תמיד הן מדויקות לסיפור של הנתונים שלנו.


מפת Choropleth - המפה הנפוצה ביותר, משמשת להצגת ערכים לכל איזור גיאוגרפי במפה, לרוב מדובר במדינות או איזורים גיאורפיים.


מפת Bubble - מפה שבה כל עיגול מראה את העוצמה של הנתון באיזור גאוגרפי מסוים. בדרך כלל משמשת לייצג מגמה ולא השוואה מדויקת. בעיה נפוצה עם סוג המפות הזה הוא שהרבה פעמים הבועות עולות אחת על השניה וזה מקשה את הקריאה.


מפת נקודות (Dot Map) - כל הנקודות יופיעו באותו הגודל והמטרה היא להראות פיזור גיאורפי.

סוגי מפות נוספות: Flow Map, Connection Map



לסיכום :)

סקרתי כאן את סוגי הגרפים המרכזיים ואיך מבינים מי מהם מתאים לדאטה שלנו, שווה להשקיע את הזמן ולבחור את הגרף המדויק למספרים שיש לנו. אומנם יש הרבה גרפים וזה די מבלבל בהתחלה, אבל עם הזמן ותירגול של השיטה, זה נהיה פשוט ואינטואטיבי יותר, מבטיחה.


בנוסף, יש לי עצה חשובה, תתחילו מהגרף הפשוט ביותר, ורק אם זה לא עובד לכם תנסו גרף יותר מורכב, אל תתפתו לייצר גרפים מורכבים. אתם שואלים בטח למה. אז התשובה היא שהבנת גרפים היא מורכבת, יש פער גדול בציבור ביכולת לקרוא ובעיקר להבין גרפים. אנשים שאינם רגילים לראות גרפים בחיי היום יום יתקשו בקריאת גרפים מורכבים. אז אפילו אם ממש בא לכם להכין מפת חום או Scatterplot כי זה סופר מגניב ויפה, תחשבו על מי שהולך לראות את הגרף ותנסו לפשט. תזכרו שהמטרה של דאטה ויז - זה להקל על הצופה להבין את המספרים, אז תנסו לעשות את זה. (ואם אתם רוצים להבין יותר מה זה דאטה ויז, אפשר לקרוא את זה כאן) בנוסף, מקור מעולה לכל סוגי הגרפים הוא The Data Visualisation Catalogue. בנה אותו מעצב שרצה ללמוד על התחום, אפשר למצוא שם את מרבית סוגי הגרפים, לעשות חיפוש על פי פונקציונליות או על פי שם ולמצוא מה הרעיון מאחוריו ובאיזה כלים מומלץ להשתמש כדי לבנות אותו.

בהצלחה!

ואם אתם רוצים לקבל עדכונים על מה קורה בעולם הדאטה ויז, ומה אני עושה - אתם מוזמנים להירשם כאן :)