יחידה 2: מדדי מרכז
מדדי נטייה מרכזית נועדו לתאר ערך מייצג של התפלגות. ביחידה זו נלמד שלושה מדדים עיקריים: שכיח, חציון וממוצע, ואת הקשר ביניהם לבין סולמות מדידה ופונקציות הפסד.
מדדי נטייה מרכזית – מבט כללי
שלושת מדדי הנטייה המרכזית הם:
- שכיח – הערך שמופיע בתדירות הגבוהה ביותר.
- חציון – הערך האמצעי בהתפלגות מסודרת.
- ממוצע – סכום הערכים חלקי מספר התצפיות.
לא כל מדד מתאים לכל משתנה, והבחירה ביניהם תלויה בסולם המדידה ובמטרת התיאור.
השכיח
הגדרה
השכיח הוא הערך שמופיע בשכיחות הגבוהה ביותר בהתפלגות.
הסבר אינטואיטיבי
זהו הערך ה"נפוץ ביותר" – מה שרואים הכי הרבה.
דגשים למבחן
- זהו מדד הנטייה המרכזית היחיד שמתאים לסולם שמי.
- ייתכן יותר משכיח אחד (התפלגות רב־שכיחית).
- ייתכן מצב שבו אין שכיח כלל.
דוגמה קצרה
אם מזון מועדף של קבוצה מתחלק לקטגוריות, המדד היחיד שניתן לחשב הוא השכיח.
טעויות נפוצות
- לחשוב שתמיד קיים שכיח.
- לבלבל בין שכיח לערך "ממוצע" אינטואיטיבית.
החציון
הגדרה
החציון הוא הערך שמחלק את ההתפלגות לשני חצאים שווים, לאחר סידור הערכים לפי גודל.
הסבר אינטואיטיבי
חצי מהתצפיות קטנות ממנו וחצי גדולות ממנו.
חישוב
- מספר תצפיות אי־זוגי: החציון הוא הערך האמצעי.
- מספר תצפיות זוגי: החציון הוא ממוצע שני הערכים האמצעיים.
דגשים למבחן
- החציון מתאים לפחות לסולם סדר.
- החציון עמיד לערכים קיצוניים.
- שינוי בערך קיצוני לא בהכרח ישפיע על החציון.
דוגמה מבחנית
אם מוסיפים להתפלגות תצפית קיצונית מאוד, לעיתים החציון לא ישתנה כלל — בניגוד לממוצע.
טעויות נפוצות
- לשכוח לסדר את הנתונים לפני חישוב.
- לחשוב שהחציון "חייב להיות" אחד הערכים בהתפלגות (לא תמיד).
הממוצע
הגדרה
הממוצע הוא סכום כל התצפיות חלקי מספר התצפיות:
הסבר אינטואיטיבי
הממוצע הוא נקודת "שיווי משקל" של ההתפלגות.
דגשים למבחן
- הממוצע מתאים לסולם רווח ומעלה.
- הממוצע רגיש לערכים קיצוניים.
- הוספת תצפית:
- גדולה מהממוצע → הממוצע יגדל.
- קטנה מהממוצע → הממוצע יקטן.
- שווה לממוצע → הממוצע לא ישתנה.
דוגמה קצרה
הורדת תצפית נמוכה מהממוצע תגרום לממוצע לעלות.
טעויות נפוצות
- לפרש ממוצע כערך "טיפוסי" גם בהתפלגות מוטה.
- להשתמש בממוצע כשאין משמעות לרווחים (סולם סדר).
השוואה בין מדדי הנטייה המרכזית
| מדד | סולם מינימלי | רגישות לקיצוניים | תמיד קיים |
|---|---|---|---|
| שכיח | שמי | לא | לא |
| חציון | סדר | נמוכה | כן |
| ממוצע | רווח | גבוהה | כן |
פונקציות הפסד וקשר למדדי מרכז
רעיון כללי
פונקציית הפסד מודדת "כמה טעינו" כאשר אנו מייצגים את ההתפלגות בערך אחד.
קשרים חשובים
- מזעור סכום ריבועי הסטיות:
הממוצע.
- מזעור סכום הסטיות המוחלטות:
⇒ = חציון
- מזעור מספר הטעויות (0/1):
⇒ = שכיח
דגש למבחן
שאלות על פונקציות הפסד הן דרך עקיפה לשאול: איזה מדד מרכז מתאים כאן?
טעויות נפוצות ובחינות קלאסיות
- לחשב מדד מרכז "טכני" בלי לבדוק התאמה לסולם המדידה.
- להתעלם מערכים קיצוניים כששואלים על ממוצע.
- לשכוח שחציון ושכיח לא בהכרח משתנים כשנתון בודד משתנה.