שאלה בהסתברות 674737
נניח שאהרוני טוען שהוא "מצליח בהסתברות 2/3", או באופן כללי P.
כיצד הופכים טענה מעורפלת כזאת להתפלגות? ההתפלגות ההיפרגאומטרית מניחה משקל שווה לכל בחירה של תת קבוצה. כיצד מרחיבים את המודל למקרה שאנחנו מצויידים באורקל הסתברותי?
___

האם אהרוני בחר בדיוק 15 בורות בסריקה הראשונה שלו? הוא לא נאלץ לשנות את בחירתו הראשונית כדי שהמספר יהיה 15 כנתון מראש? אם כך, כיצד היה בטוח בבחירתו?
שאלה בהסתברות 674739
אני מגדיר "התפלגות אורקל" באופן שתתמזג עם התפלגות היפרגאומטרית עבור P=0.5.

function oProb = oHyper(N, K, P)
%OHYPER

oProb = zeros(K,1);
for k = 1:K
oProb(k) = nchoosek(K,k)*P^k * nchoosek(N-K,K-k)*(1-P)^(K-k);
end
oProb = oProb / sum(oProb);

end

ואחר כך מריץ את הסקריפט הבא:

%%
clear;clc
format LONG

%%
oProb = oHyper(30, 15, 0.5);
hProb = hygepdf(1:15,30,15,15)';
disp([oProb hProb]);

%%
oProb = oHyper(30, 15, 2/3);
fprintf('\\nOracle distribution for P = 2/3\\n')
disp(oProb);
fprintf('\\nOracle prob for 8 or less successes %5f\\n', sum(oProb(1:8)));

אני מקבל

0.000001450513143 0.000001450513134
0.000071075144001 0.000071075143543
0.001334633259574 0.001334633250970
0.012011699336166 0.012011699258730
0.058136624787043 0.058136624412252
0.161490624408453 0.161490623367367
0.266953889328258 0.266953887607280
0.266953889328258 0.266953887607280
0.161490624408453 0.161490623367367
0.058136624787043 0.058136624412252
0.012011699336166 0.012011699258730
0.001334633259574 0.001334633250970
0.000071075144001 0.000071075143543
0.000001450513143 0.000001450513134
0.000000006446725 0.000000006446725

Oracle distribution for P = 2/3
0.000000010080107
0.000000987850518
0.000037099275003
0.000667786950053
0.006464177676510
0.035912098202832
0.118729794058344
0.237459588116687
0.287296785622658
0.206853685648314
0.085476729606741
0.018994828801498
0.002023117860515
0.000082576239205
0.000000734011015

Oracle prob for 8 or less successes 0.399272

תוצאה שלא פוסלת את טענת ה- 2/3.
שאלה בהסתברות 674741
מבלי להתעמק במספרים: הניסוי בא לבדוק השערה מסויימת. אתה מעלה השערה אחרת. כדי לאושש אותה צריכים ניסוי נוסף.

אבל בנוסף, מהי ביוק המשמעות של רמת הדיוק הזו? כשלון בגילוי מטרות קיימות או גילוי שגוי של מטרות שגויות? כמוכן: האם כשאהרוני חופר בריכה ומחפש צינורות, יש לו הסתברות של שליש לפספס כל צינור שעובר שם? ואם כן, מהי ההסתברות שלו לפספס צינור כלשהו שעובר שם?
שאלה בהסתברות 674751
הניסוי נערך ותוצאותיו נתונות. הפרשנות תלויה במודל המתמטי, ומותר לבדוק השערות שונות.

ביחס לרמת הדיוק - רציתי לוודא שאין לי באג ע"י השוואה נומרית של התוצאות עבור P=0.5 להתפלגות ההיפרגיאומטרית. הכל נעשה בחופזה וזה נשאר כך כשהעתקתי. אין לדיוק חשיבות מיוחדת.

אם היה מדובר בהתפלגות בינומית הייתי מיחס לטענת ה-‏2/3 משמעות כמו בניסוי ברנולי. אבל כאן המשתנים לא בלתי תלויים. אני לא יודע איך לתרגם טענת ה-‏2/3 למודל הסתברותי. מאחר שזו בסה"כ בעיה נאיבית, ורוב המגיבים מגיעים מרקע של מתמטיקה-מדעי המחשב-פיזיקה, הייתי בטוח שמישהו יקפוץ מייד ויתן את התשובה שאמורה להיות ידועה היטב, ואני במקרה לא יודע אותה.

הפונקציה oHyper היא פנקצית הסתברות מפני שנירמלתי את הטווח שלה. היא מבוססת על שיקולים אינטואיטיביים ולא הוכחה של ממש. בכל אופן צריכה להיות פונקציה כזאת, וצריך לבדוק מה ההסתברות שאהרוני יקבל תוצאה כפי שקיבל או גרועה יותר בהנחה של פונקציית ההתפלגות שמיצגת את הטענה שלו (בעצם את הטענה שאני מיחס לו).
שאלה בהסתברות 674784
"הניסוי נערך ותוצאותיו נתונות. הפרשנות תלויה במודל המתמטי, ומותר לבדוק השערות שונות."

מה זאת אומרת? תמיד אפשר "לתפור" תיאוריה שתתאים לתוצאות הניסוי. כידוע אפילו לחזור על הניסוי מההתחלה לכל תיאוריה זה לא מספיק.
שאלה בהסתברות 674765
הטענה "מצליח בהסתברות 2/3" היא אכן מעורפלת. מצליח במה? בלזהות לפחות 13 עצמים מבין 15 שמוטמנים באקראי בין 30 בורות? בלזהות באיזה מבין שני בורות נתונים מוטמן עצם? משהו אחר? אם מישהו היה טוען בפני טענה כזו, הייתי מצביע בפניו על העמימות ומבקש ממנו להתנסח מחדש באופן ברור.

לא ברור לי מהי כוונתך כאן ב"אורקל הסתברותי".

אם בביטוי "הסריקה הראשונית שלו" אתה מתכוון לניסוי המקדים, אז לא, הדאוזר לא בחר שם 15 בורות, כי המספרים שם היו אחרים. אם כוונתך לניסוי האמיתי, אז כן, הוא אכן סימן 15 בורות (בכל אזור), והוא ידע מראש שהולכים להיות 15 עצמים מוטמנים. ראה את הפרוטוקול המקושר במאמר. לא יודע איך הוא היה בטוח בבחירתו. (ויש לי הרגשה שלא הבנתי מה אתה מנסה לשאול.)
שאלה בהסתברות 674789
נניח שיש בין כל בור יחיד ובין מר אהרוני ערוץ תקשורת דאוזי בינארי וסימטרי. אם הבור ריק הוא משדר 0, ואם יש בו אוצר הוא משדר 1. ערוץ התקשורת מעביר את ההודעה ללא שינוי בהסתברות P, ובהסתברות P-1 (אחד מינוס P) הוא הופך 1 ל-‏0 ו-‏0 ל-‏1. הפרמטר P מיצג את כישוריו של אהרוני כדאוזר. אם 1/2=P לא עוברת אינפורמציה, ולאהרוני אין יכולת דאוזרית כלל, ואם 1=P (או 0, אבל נתעלם מכך) אז הוא דאוזר מושלם.

רוצים לערוך ניסוי שיבדוק את כישוריו של אהרוני כדאוזר. חופרים N בורות, ממלאים חלק מהם, וחלק נשארים ריקים. אהרוני סורק את הבורות ומסמן כל אחד מהם באופן בלתי תלוי באחרים כמלא או ריק, לפי כישוריו כדראוזר בלבד. מוצאים מספר K בין 0 ל-N שמייצג את מספר הפעמים שערוץ התקשורת העביר את ההודעה ללא שינוי.

עבור כל ערך של P אפשר לחשב באמצעות ההתפלגות הבינומית את ההסתברות לקבל 0 עד K בניסוי. הסתברות זו היא הסבירות לקבל תוצאה כפי שהתקבלה, או גרועה יותר בהנחה שיש לאהרוני כישורי דאוזינג בעוצמה P. ברור שתוצאה קרובה ל-‏2/N פוסלת במידה רבה ערכים של P הקרובים ל-‏1, אבל אינה פוסלת כישורים בעוצמה קרובה אבל גדולה מ-‏1/2. מה שמעניין באמת הוא תחום הפסילה של הניסוי.

בניסוי כפי שערכתם אהרוני משתמש גם בכישוריו כדאוזר, אבל גם באינפורמציה הנוספת שיש בדיוק 2/N בורות מלאים. אני לא יכול להשתמש יותר בהתפלגות הבינומית כדי לחשב את הסבירות של התוצאה בהנחה של כישורי דאוזיג בעוצמה P, מפני שהמשתנים המקריים תלויים. אני לא ידע איך לחשב את ההתפלגות כפי שהיא בניסוי שלכם.

אני מניח שהשתמשתם בהתפלגות ההיפרגאומטרית כדי לבדוק את סבירות התוצאה בהנחה שמר אהרוני מחליט באופן רנדומלי. באמת אם אהרוני היה משיג תוצאה גבוהה, תוצאה זו הייתה פוסלת את הנחת הרנדומליות. אבל עכשיו אחרי שאהרני לא השיג תוצאה גבוהה, הנחת הרנדומליות לא הופרכה. זה הכל. אם אני לא יודע לחשב את ההתפלגות בהנחה של הפרמטר P, אני לא יודע הרבה על כישריו של אהרוני כדאוזר.

אתמול ניסיתי לאלתר התפלגות כזו, ע"י וראציה על ההתפלגות ההיפרגאומטרית.
N - מספר הבורות (30)
K - מספר הבורות המלאים (15)
P - הפרמטר ההסתברותי
ואז עבור כל k בין 0 ל-K (מספר ההצלחות של אהרוני) ההתפלגות פרופורציונית ל:

nchoosek(K,k)*P^k * nchoosek(N-K,K-k)*(1-P)^(K-k)

אני מניח שאתה יכול לעשות עבודה טובה יותר. (במיוחד שהצלחתי להשחיל באג קטן לכמה שורות הקוד שפרסמתי. אבל לא נורא, הקוראים הנבונים של האייל דילגו וודאי על התגובה, כך שלא נגרם נזק ממשי לאיש)
שאלה בהסתברות 674801
אם הבור ריק הוא משדר 0, ואם יש בו אוצר הוא משדר 1.
___________
א. אם בבור הוטמן בקבוק מים קטן או מטבע בעומק של מ' הוא משדר אות חלוש, נניח 0.12. טקסט על נייר יכול לשדר 10.
ב. ישנם אם אפשר לקרוא לזה כך, ערוצי תקשורת או זרמים שמוליכים מידע בצורה טובה יותר לכיוון מסויים. אם תעמוד צפונית לבור לדוגמא, אתה עלול לקלוט 0.72 אך דרומית תקלוט 1.38.
ג. יש מקומות שבהם רובץ "רעש לבן". אם ה"אוצר" משדר 1 והרעש הלבן משדר 0.98 הסיכוי לגילוי יורד משמעותית.
ד. הדאוזר עצמו מושפע משינויים יומיים (רגשות, תחושות, דיוק, ריכוז) ולכן היעילות של מבחן ביום מסויים יורדת או עולה. להעלאת המובהקות כדאי לבדוק מספר פעמים.

יש עוד נקודות שאפשר לשפר בניסוי לצד מסקנות שמחייבות להכיל מעבר לניסוי משקל של שכל ישר. העלות היומית של חיפוש קו מים או נזילה בשטח (יום טרקטור עם פועלים מסביב וכו') מתקרבת ל 3,000 ש"ח. כל ילד היה מאמץ שיטה שעובדת וזונח אמצעים שלא עובדים (שאכן נזנחו במהלך השנים). ישנם יישובים קטנים שיודעים על נזילות בהיקף אלפי, ועשרות אלפי ש"ח בחודש. לפעמים מדובר בעשרות אחוזים מהצריכה הכוללת- ולמרות זאת, מפני שעלות החיפוש והאיתור כה יקרה הם מוותרים וממשיכים לחיות עם הנזילות. למה לא לשכור מומחי דאוזינג? שאלה טובה עם הרבה תשובות.
שאלה בהתניה 674813
אני מצטער על המוגבלות של המוח המותנה שלי, אבל בכל פעם שאני קורא כאן ''אהרוני'' אני עובר לחלקיק שנייה דרך החיווי ''לא השף, אחד אחר'' ואז לעוד חלקיק שנייה דרך ''לא הפרופ' לפיזיקה, אחד אחר'' ואז מתכנס לנכון.
שאלה בהתניה 674831
אתה מתכוון לפרופ' למתמטיקה רון? או שיש עוד אהרוני?
שאלה בהתניה 674835
יש עוד.
שאלה בהסתברות 674844
אני חושב שאני מבין עכשיו את השאלה שלך. תודה על ההבהרות.

אילו הייתי אני דאוזר עם יכולת חישה P (במובן שהגדרת), ובמהלך ניסוי היכולת שלי היתה מצביעה על, נאמר, 17 בורות כעל מכילים חפצים, אבל הפרוטוקל מכריח אותי לסמן רק 15, אז הדבר ההגיוני היחיד שאני רואה שאפשר לעשות פה זה להפוך מ-‏1 ל-‏0 את הסימון על שני בורות שאבחר בשרירותיות מתוך ה-‏17. אם "בשרירותיות" אומר "באקראי", וגם הבחירה של המטמינים באיזה מ-‏15 הבורות לשים את החפצים היתה באקראי, אז עקרונית אפשר לחשב את ההתפלגות של מספר הסימונים הנכונים שסימנתי. תסלח לי אם בשעת ערב מאוחרת כזו אני לא מתעמק בחישוב, אבל לא נראה לי שהנוסחה שכתבת נותנת את ההתפלגות הזו.

ההנחה שלך נכונה - אכן השתמשתי בהתפלגות ההיפר-גאומטרית בניתוח ההסתברותי.

הערה צדדית: במודל שלך לשני סוגי הטעויות, false positive ו-false negative, יש אותה הסתברות - אחד מינוס P. זה קצת מוזר בסיטואציה של קלסיפיקציה בינארית / דיאגנוסטיקה שבה עסקינן (אני שוכח לרגע שאנחנו מתעסקים עם יומרות ליכולת על-טבעית, ומעמיד פנים שאנחנו מתעסקים עם משהו כמו מגלה מתכות).
שאלה בהסתברות 674849
חשבתי על האפשרות הזו כשכתבתי: "האם אהרוני בחר בדיוק 15 בורות בסריקה הראשונה שלו? הוא לא נאלץ לשנות את בחירתו הראשונית כדי שהמספר יהיה 15 כנתון מראש? אם כך, כיצד היה בטוח בבחירתו?" - אני לא חושב שהיא סבירה מפני שאדם לא יכול גם להיות בטוח וגם לקבל החלטות אקראיות.

עכשיו אני חושב שההצעה גם לא הוגנת מפני שהוספת גורם של מקריות אחרי החלטה שמבוססת על כישורים כלשהם מסתירה את הכישורים.
שאלה בהסתברות 674850
אולי כדאי לשנות את המודל כך שבפלט של הערוץ יהיה משתנה מקרי רציף המקבל ערכים בקטע [0-1] כפונקציה של P וערכי הכניסה? אני רוצה שגם במקרה של טעות יתקבל ערך קרוב יחסית ל-‏1/2 (מהצד הלא נכון). לאחר הסריקה מתקבל וקטור של 30 מספרים, ומר אהרוני בוחר את 15 הגדולים ביותר. זה יותר טבעי ויותר הוגן מפני שיש לו סיכוי גדול יותר להכניס false negative להחלטה הסופית שלו.
שאלה בהסתברות 674851
עכשיו אני מבין למה התכוונת ב"סריקה ראשונה" בתגובה שהתחילה את הפתיל הזה.

נו מה לעשות, המודל שהצעת פשוט לא משתלב עם האילוץ "חייבים לסמן בדיוק 15 בורות". צריך או לוותר על האילוץ, או לכופף את התוצאה כדי לקיים את האילוץ (למשל באופן שהצעתי, למרות שזו הצעה "לא סבירה" ו"לא הוגנת"), או להגדיר מודל חדש.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים