הסתברות מציאותית

מאת: אלעזר ניומן

כאשר פרופסור אחד לסטטיסטיקה נשאל על הסיכויים לזכות בלוטו, הוא אמר
שההסתברות לזכייה הגדולה אפסית ולכן מי שממלא לוטו הוא "סתם טיפש;".
כשהשואל הצביע על כך שאי אפשר להכחיש שמישהו בסופו של דבר זוכה, אמר
הפרופסור : "טוב, זה הטיפש שיש לו מזל !;".

הפרופסור בדבריו היטיב לתמצת את הפרדוקסליות הבסיסית שיש במושג:
&הסתברות של מאורע;" quot; .

לפני שקורה משהו אפשר לחשב ולהתווכח על הסתברויות, אבל לאחר שקרה מה
שקרה (ובמיוחד כשקורה משהו שהוגדר כבעל "הסתברות אפסית") כל תורת
ההסתברות נראית כחסרת משמעות.

אם לא די בכך, חישובי הסתברות,לעיתים קרובות, מנוגדים לאינטואיציה
הטבעית מה שגורם לכך שגם מי שעוד מאמין בהסתברות יכול בקלות יחסית
לטעות ולאבד את אמונתו (כמו שקרה ל- Antoine Chevalier de mere- ראה
להלן. )
זה מוביל לעתים למסקנה שהסתברות היא עוד אחד מאותם תחומים מתמטיים
המנותקים מהמציאות.
מי שרוצה לשלוט על מאורעות חייו צריך להצביע ש"ס ולסמוך על כוחות
עליונים ולא להתעסק בהבלים כמו סטטיסטיקה מתמטית...

כך אנו נתקלים מצד אחד בתופעות כמו מהמר המגדיר את עצמו כ"שחקן רולטה
מקצועי;"- כלומר הוא יודע לצפות (בשיטות מתמטיות כמובן) את התנהגות
הרולטה בעתיד (!), אבל מוצא את עצמו יום אחד מרושש לחלוטין, ומצד שני
באדם שממלא טופסי לוטו לפי תאריכי ימי ההולדת של בני המשפחה, בתקווה
שמישהו שם למעלה יבין את הרמז (אם לא השבוע אז בשבוע הבא ואם לא שבוע
הבא אז בשבוע אחרי ...)

האשם (החלקי לפחות) במצב עגום זה הוא (שוב) החינוך המתמטי אצלנו שבנושא
הסתברות שם את הדגש על הצד הפורמלי של נושא זה ופחות מדי על הצדדים
האמפיריים - יישומיים.

אילו היינו פותרים בעיות הסתברותיות בעזרת ניסויים או סימולציות, היינו
מגלים שהקשר בין הסתברות למציאות הוא חזק ויציב (אולי יותר מאשר בהרבה
תחומים אחרים במתמטיקה), והימור בניגוד לחוקי ההסתברות, מוביל בטווח
הארוך לפחות, להפסד.

במאמר זה אתייחס לקשר זה שבין הסתברות לבין המציאות ולטעויות נפוצות
בתחום זה.

תחילה ננסה לנסח את הקשר הזה וכבר כאן, מסתבר, אנו נתקלים בקשיים
רציניים.

נקח דוגמה תמימה מספרי הלימוד: "מטילים מטבע שבצידו האחד יש עץ ובצידו
השני- "פלי;".
(פא דגושה. למי שמתעניין-מקור המילה "פלי" במטבע המיל שהיה בשימוש
בתקופת המנדט הבריטי. בצד אחד של המיל היה עץ ובצד השני הוטבעו המילים
"פלשתינה ישראל" ובקיצור-"פלי;". לא לערבב מונח זה עם "פלי;"- פא
רפויה, שם תואר הקשור לאחד מאיברי הגבר...)

על פי ההגדרה הפורמלית- קלסית להסתברות, ההסתברות לפלי בהטלת מטבע היא
;½. מהי המשמעות המעשית של הגדרה זו? כלומר, מה זה אומר ביחס לניסוי
אמיתי של הטלת מטבע?

אם נראה לכם שאתם יודעים לענות על שאלה זאת, שימו לב לכך שאם אתם
משתמשים בתשובתכם בביטויים כמו "סבירות גבוהה" או "רוב הסיכויים" אז
אתם בבעיה קטנה, שכן ביטויים אלו בדרך כלל משמשים כביטויים נרדפים
למונח "הסתברות;", כלומר אתם מגדירים את משמעות ההסתברות במונחים של
הסתברות ונכנסתם להגדרה מעגלית מסחררת שאין ממנה מוצא...!

אם אתם רוצים להינצל מהמעגליות, יש להירגע, לקחת אוויר, לצלול לעומק
ולחתוך ימינה או שמאלה...
(כך יוצאים ממערבולת בים כפי שהסביר לי פעם מציל ותיק...)

אז כדי לצאת מהמעגליות של הגדרות הסתברותיות, בואו נחליט שבהמשך,
בביטוי " מאורע בעל סבירות גבוהה" אין הכוונה למאורע שהסתברותו גבוהה
אלא למאורעשכדאי להמר שהוא יקרה.
כלומר, מאורע בעל סבירות גבוהה הוא מאורע שהימור שהוא יקרה מניב ברוב
המקרים רווחים (כמעט אמרתי "סביר שיניב רווחים..." אבל עצרתי את עצמי
בזמן !),ובדומה, מאורע בעל סבירות נמוכה הוא מאורע שכדאי להמר שהוא לא
יקרה.

לכן מעכשיו ועד הודעה חדשה הדרך לבדוק "סבירות" של מאורע היא רק על ידי
עריכת הימורים חוזרים על המאורע ורישום הרווחים או, כמובן בעזרת
סימולציה ממוחשבת.
(תרגיל פשוט ומומלץ למי שיודע איזו שהיא שפת תכנות. כדי לדמות זריקת
מטבע מגדירים משתנים Pali ו TotalPali ומשתנים נוספים לפי הצורך,
מפעילים פונקציה היוצרת מספרים מקריים בין 0 ל 1 בד"כ מהצורה או
<( )rand או< ( )random
ואז כותבים משהו כמו : ,5 pali=1 else pali=0.if rnd<0
TotalPali=TotalPali+pali                     ;nbsp;             &
(כמובן שאפשר להחליף את ;5".quot;if rnd<0& ב-;5"." if rnd>0, בשני המקרים
נקבל סימולציה שבה כמחצית מהפעמים המשתנה Pali יקבל ערך 1 וכמחצית
מהפעמים ערך 0)
את הפקודה הנ"ל מכניסים ללולאה על פי מספר הפעמים שרוצים להטיל את המטבע.
לבדיקת הסבירות של מספרי תוצאות הפלי בניסוי כזה, יוצרים לולאה חיצונית
נוספת שתפעיל את הפרוצדורה הנ"ל הרבה פעמים ומסכמים את התוצאות. )

מי שייתפס עושה חישובי הסתברות כמו בבית ספר יוצא מהשיעור....

לאחר שעברנו (פחות או יותר) את מכשול המעגליות, אפשר לחזור לשאלה
המקורית, כאשר כעת מותר להשתמש בביטויים כמו "סבירות גבוהה" או "סבירות
נמוכה;", בהגדרתם החדשה.

בחרו אחת (או יותר) מהתשובות הבאות:

1. אם נטיל את המטבע 4 פעמים, יש סבירות גבוהה שבדיוק פעמיים
(= 189; * 4#&) הוא יראה פלי.

2. אם נטיל את המטבע 100 פעם,יש סבירות גבוהה שבדיוק 50 פעמים
(189; * 100 = 50#&) הוא יראה פלי.

3. תשובות 1 ו-2 אינן נכונות אבל יותר סביר שיקרה 2 מאשר 1. ובאופן
כללי ככל שנטיל את המטבע יותר פעמים יש סבירות גבוהה יותר שבדיוק חצי
מהפעמים המטבע יראה פלי.

4. לא משנה כמה פעמים מטילים את המטבע, הסבירות שמחצית הפעמים יצא פלי
נשארת זהה.

5. אם נטיל את המטבע הרבה פעמים וקיבלנו יותר תוצאות של עץ מאשר פלי אז
הסבירות לפלי בהמשך גדולה יותר. כך,למשל, אם זרקנו 100 פעם את המטבע
והיו 80 תוצאות עץ, הסבירות שהתוצאה הבאה תהיה פלי, גבוהה ביותר!

6. אף אחת מהתשובות 5-1 אינה נכונה.


אחרי שעשיתם את הניסויים הדרושים או את הסימולציות במחשב, אפשר לסכם את
התוצאות ולומר שהתשובה הנכונה היא:... ! 6


וביתר פירוט:
אם עושים את הניסוי:<הטלת מטבע 4 פעמים-הרבה פעמים, רק כ 3/8 מהפעמים
יצא בדיוק פעמיים פלי, כלומר סבירות לא גבוהה ולכן תשובה 1 אינה נכונה.

אם עושים את הניסוי:<הטלת מטבע 100 פעמים-הרבה פעמים, רק כ 1/12
מהפעמים יצא בדיוק 50 פעמים פלי, ולכן תשובה 2 אינה נכונה. מכאן שגם
תשובות 3 ו-4 אינן נכונות.

לגבי תשובה 3 אוסיף רק שככל שנטיל את המטבע יותר פעמים, הסבירות שנקבל
בדיוק מחצית הפעמים פלי, הולכת וקטנה.
כך,למשל, אם נעשה את הניסוי: הטלת מטבע 1000 פעמים- הרבה פעמים, רק כ
1/40 מהפעמים נקבל בדיוק 500 פעמים פלי.

אם אתם שואלים איך הגעתי לערכים אלו, אשיב לכם בתמימות שעשיתי סימולציה
במחשב (כתבתי תוכנית נניח ב C++ שעושה את הניסוי המבוקש ואלו השכיחויות
שהמחשב פלט..)
כמובן שתחת לחץ ואיומים אסכים אולי להודות שקצת נעזרתי בהתפלגות
הבינומית...

לגבי תשובה 5 אין צורך בניסוי כדי להבין שתשובה זאת לא הגיונית.
בהנחה שאלוהים לא משחק במשחקי מזל ולכן נותן למטבע להחליט לבד על איזה
צד הוא יפול, ובהנחה הסבירה שהמטבע עצמו גם כן לא זוכר את התוצאות
הקודמות שלו, הסבירות לפלי בכל הטלה היא זהה ללא תלות במה שקרה קודם.

הנטייה לחשוב שיש איזה אל הסתברותי המסתתר בתוך מטבעות (או קוביות או
רולטה...) המתעורר לחיים ברגע שמטבע מתחיל לסטות מהתנהגות הסתברותית
נאותה ודואג להחזיר את הסוטה לדרך ישרה, היא למרבה הפלא נפוצה מאוד
ולכן יש לה שם: quot; ) The gamblers fallacy&אשליית המהמר;").
על בסיס אשליה זאת אף הומצאה "שיטה" פופולרית לנצח בגלגל הרולטה הנקראת:
"שיטת ד'אלמברט;"
בשיטה זאת מהמרים על מספר (או צבע) קבוע, כאשר אחרי כל ניצחון מקטינים(The d'Alembert system).
את סכום ההימור ואחרי כל הפסד מגדילים אותו. ההנחה היא,כפי הנראה,
שאחרי שאתה מפסיד, כדור השנהב של הרולטה נוטה יותר לטובתך (מתוך רחמים
?), ולהפך כשאתה זוכה.
דוגמא משעשעת נוספת לאשליה זאת היא סצינה אהובה עלי מתוך הסרט "העולם
לפי גארפ;". בדיוק כשגארפ הצעיר וזוגתו עומדים להיכנס לביתם החדש, מטוס
קל מתרסק הישר לתוך הקומה השנייה של הבית.
כשהנערה המבוהלת מגיבה בחשש מסוים מלהיכנס לביתה החדש (ברקע נשמעים
קולות של זכוכיות מתנפצות ושל הטייס המנסה לחלץ את עצמו...), אומר לה
גארפ: " השתגעת? הבית הפך להיות עכשיו הרבה יותר בטוח. הסיכויים שדבר
כזה יקרה שוב הם אפסיים!;"


אם נחזור לשאלתנו,לאחר שפסלנו את כל התשובות ראוי כמובן שניתן תשובה
נכונה לשאלה.


ובכן, בהסתמך על מה שנקרא בפי הסטטיסטיקאים "החוק החלש של המספרים
הגדולים; ":
ככל שנטיל את המטבע מספר רב יותר של פעמים, החלק היחסי של תוצאות פלי
(או מה שנקרא "השכיחות היחסית" של תוצאת פלי ) ישאף (יתקרב) ל-;½.
או בניסוח מעט יותר ברור:<אם נקבע תחום קבוע סביב,;189#& נניח: %51- 49% אז ככל שנגדיל את מספר
ההטלות, הסבירות שהחלק היחסי של תוצאות פלי יהיה בתחום זה, הולך וגדל.
<
כך למשל אם נעשה את הניסוי: <100
-הרבה פעמים, כ-%24
מהפעמים החלק היחסי של תוצאות פלי ייפול בתחום זה. (כלומר בכ-%24
מהפעמים מספר תוצאות הפלי יהיה בין 49 ל 51 כולל הקצוות )

אם נחליף את הניסוי ל 1000 הטלות אז נהיה בתחום <%51 כבר 50%
מהפעמים (כלומר בכ-50% מהפעמים מספר תוצאות הפלי יהיה בין 490 ל
510 כולל הקצוות )
ועבור ניסוי של מיליון הטלות, הסבירות להיות מחוץ לתחום זה היא כל כך
קטנה שיותר סביר שיהיה שלום עם חמאס ובני הישיבות יתגייסו לצה"ל...

נוכל כמובן להקטין את התחום כך שיהיה קרוב כרצוננו ל- ;189#& למשל ל:
<%1, וגם אז אם מספר ההטלות בניסוי גדול מספיק, הסבירות ליפול
בתחום זה תהיה קרובה כרצוננו ל 10) %100 מיליון הטלות כאן יספיקו בשביל
להגיע ל %99. כמובן שאף פעם לא נוכל להגיע לסבירות של %100).

[ למי שמתעניין במתמטיקה הסטטיסטית שמאחורי החישובים האחרונים-הם
מבוססים על הקירוב הנורמלי להתפלגות הבינומית תוך הסתמכות על "משפט
הגבול המרכזי;"... ו- (למי שלא ברח) אפשר לקרוא על זה בכל ספר סטטיסטיקה
בסיסי[

לאחר שהבהרנו את הקשר הנכון בין הסתברות למציאות נחקור קצת את הניגוד
שקיים לעיתים בין האינטואיציה להסתברות.

הראשון שהעלה בעיה זאת, עוד בטרם נוסחה תורת ההסתברות, היה הצרפתי mere
Antoine Chevalier de איש חצר משכיל בן המאה ה-17 שהיה גם מהמר די כבד.
ב 1654 כתב de mere לידידו המתמטיקאי המפורסם פסקל, שהמתמטיקה אכזבה
אותו קשות.
מניסיונו בהימורים ידע de mere שהימור על התוצאה 6 לפחות פעם אחת מתוך 4
הטלות קובייה הוא הימור משתלם.
לכן, אמר לעצמו de mere גם הימור על התוצאה (6,6) לפחות פעם אחת מתוך
24 הטלות של שתי קוביות צריך להיות הימור משתלם שכן "מרחב המדגם" גדל
פי 36 ) 6 תוצאות אפשריות בשתי קוביות לעומת 6 תוצאות אפשריות בקוביה
אחת), ולכן אם נגדיל גם את מספר ההטלות פי 6 (כלומר ל-4=24 6 הטלות)
המצב מבחינה הסתברותית צריך להיות זהה.

אז למה, לכל הרוחות, אני כל הזמן יוצא מופסד בהימור זה?! או כמו שבוודאי
התבטא de mere:
!!? putain de merde...que il-fait comment se

(השערה בלבד.אין לי הטקסט המקורי של המכתב וגם לא מידע על קללות של
אצילים צרפתים מהמאה ה- 17...)

הטעות של de mere היא מובנת וטבעית. כידוע, יש לנו נטייה לראות את
העולם באופן לינארי (כלומר לייחס קשר של "יחס ישר" או "יחס הפוך" לכל
הקשרים הפיזיקליים והמתמטיים) וזה באמת עובד בהרבה מקרים (ראה מאמר
בנושא זה באתגרים לראות את הדברים בפרופורציה1) אבל כמובן לא תמיד.

תשובתו של פסקל ידועה בוודאי למי שזוכר קצת את חוקי ההסתברות:


ההסתברות של 6 בקוביה אחת היא 1/6. הסתברות ל-לא 6 היא 5/6.
ב-4 הטלות, ההסתברות שבכל הקוביות לא יהיה 6 היא :
ולכן ההסתברות ל-לפחות פעם אחת 6 ב-4 הטלות היא:
כלומר הסתברות גדולה במעט מ 5.0 ולכן ההימור משתלם.

( שימו לב שמספיק הסתברות מעט גדולה מ-5.0 כדי להבטיח שההימור משתלם ! )

אם נעשה את החישוב האנלוגי לשתי קוביות ו-24 הטלות נקבל שההסתברות
ל-(6,6) לפחות פעם אחת מתוך 24 הטלות של שתי קוביות היא :
כלומר הסתברות קטנה מ-5.0, ולכן ההימור אינו משתלם, ולכן de mere
המסכן יצא מופסד מהימור זה.

מעניין לציין שמעז יצא מתוק, שכן בזכות שאלותיו האינטלגנטיות של mere
de לפסקל ( ובמיוחד בזכות "בעיית הניקוד" המפורסמת-;des partis"
quot;probleme& שהפנה de mere לפסקל באותו מכתב) נולדה תורת ההסתברות.
בעקבות שאלות אלו של de mere, פסקל פנה ל-Fermat (כן,ההוא מהמשפט
המפורסם...) ויחד הם ניסחו את היסודות המתמטיים של תורת ההסתברות.

פרט לאי-לינאריות של הסתברות, יש דוגמאות רבות נוספות להסתברויות
מפתיעות ומנוגדות לאינטואיציה, כמו למשל אי הטרנזיטיביות של הסתברות
(ראה על כך בחידה 3 בגיליון 25 של אתגרים
פרדוקס הקוביות
וכן מאמר באתגרים:
המדור ליחסים נון טרנזיטיביים(.
דוגמה נוספת מעניינת במיוחד, היא בעיית Monty Hall (ראה חידה 3 גיליון
17 של אתגרים-
הנידון למוות) שלה אקדיש מאמר נפרד.

לעיתים אנו נוטים לעשות הערכת חסר של הסתברויות (כלומר, לחשוב שהסתברות
של מאורע מסוים נמוכה מכפי שהיא באמת), כמו למשל בבעיית ימי ההולדת
המפורסמת (מה ההסתברות שמתוך 40 אנשים יש לפחות שניים שנולדו באותו
תאריך לועזי?-תשובה: כ-90% ! ) וכמובן גם הערכת יתר של הסתברויות ( מה
ההסתברות שאזכה בלוטו, בסה"כ אני צריך לקלוע ל-6 מספרים מתוך 49. כמה
אפשרויות כבר יכולות להיות?-תשובה: 13983816 כלומר הסתברות זכייה של
בערך אחד ל 14 מיליון!).

בכל המקרים, קל לאמת את הקשר בין הסתברות נכונה של מאורע לבין שכיחותה
במציאות ע"י ניסיונות חוזרים ובד"כ מספיקים מספר לא רב של ניסיונות (או
סימולציות) כדי להשתכנע שתורת ההסתברות אמנם מחוברת חזק מאד למציאות
חיינו.

אסיים בדבריו האלמותיים של אחד מהוגי הדעות החשובים של המאה ה-20-
Simpson Homer:
" בן, אם אתה רוצה להשיג משהו בחיים, אתה צריך לעבוד בשביל זה. עכשיו
שקט ! עוד רגע משדרים את המספרים הזוכים בלוטו...;"

לתגובות,והערות- לכתוב ל
אלעזר ניומן


כל הזכויות שמורות ;2003 © > FONT>



מאמרים נוספים בפינה: חשבון מהחיים

חיפוש

חיפוש מתקדם

הצטרף לרשימת התפוצה שלנו