בדיקת המתודה, כיצד? 94137
בדיון שהתחיל תחת חדשה, (תגובה 94097)

שאלתי את זה: תגובה 94128

למען הסדר הטוב, אני מעביר את הפתיל לכאן, בתקווה לקבל כאן תשובה.
בדיקת המתודה, כיצד? 94148
לא ברור איזה מין תשובה אתה רוצה; אלא אם אתה באמת לא יודע איך מחקר השוואתי ראוי לשמו צריך להערך.

דבר ראשון, מן הסתם לא תוכל להוכיח שום דבר עם מקרה בודד. אז ראוי להתחיל עם מדגם סטטיסטי כלשהו. ראוי להזכיר שהצורך לערוך מבדק חדש היא רק עקב העובדה שאין מחקרים השוואתיים קיימים מהם יהיה אפשר ליצור איזה Meta-Analysis ולהסיק מסקנות כלליות.

אתן לך דוגמא קיימת לאיך אפשר להסיק מסקנות על אמינות השוואתית:
עורכים מבדק משולב של 50 כימיקלים שהשפעתם הקלינית ידועה, ב- 61 סוגי מבדקי In Vitro, ושרעילותם נבדקה על בע"ח והתוצאות פורסמו.

מבדק מסוג זה נערך בעבר, אתה יכול לקרוא עליו כאן: http://www.pcrm.org/issues/Animal_Experimentation_Is...
(המאמר המקורי כאן: ATLA 1996;24:273-311)

לעומת 65% דיוק ממוצע של המודל החייתי בהקשר זה, מבדקי In Vitro המבוססים על תרביות תאי-אדם זכו לממוצע של 80% דיוק.

מאחר ו- 61 סוגים שונים של מבדקים המבוססים על תרביות תאים הושוו האחד לשני ולמבדקים על בע"ח, היה ניתן בבירור לראות אילו עליונים על אילו - ושחלקם בעלי אמינות גבוהה משמעותית מבע"ח בחיזוי רעילות קלינית. לאחר ניתוח התוצאות ניתן היה למצוא את הקומבינציה הטובה ביותר - סוללה של 4 סוגי מבדקים משולבים, שהגיעו יחד ל- 77% דיוק. יחד עם מודל ממוחשב לחיזוי פגיעה מוחית הם הגיעו ל- 83% דיוק.

כדי להסיק מסקנה חד משמעית יותר, צריך לעשות מבדק השוואתי מקיף - שהדרך הטובה ביותר לערוך אותו היא לצרף מבדקי In Vitro וסימולציות ממוחשבות לכל מבדקי הרעילות שממשיכים להערך. תוך מס' שנים כבר לא יהיה טעם להתווכח כלל. אבל בינתיים, המידע הקיים מראה שהשימוש בבע"ח נחות בהשוואה לשיטות מבדק המבוססות על תרביות תאים אנושיים.
בדיקת המתודה, כיצד? 94179
רוב תודות.

שתי תהיות ברשותך:

1. האם קבוצת הרעלנים שזוהו על ידי המודל החייתי מוכלת באלו שזוהו על ידי המודל המבחנתי? (ברפרוף על הקישור שנתת לא מצאתי תשובה)

2. המודל הממוחשב הוקם אחרי שכבר היה ידוע מי רעיל ומי לא, וזה, אם תסלח לי, חוכמה יחסית יותר קטנה. האם יש דרך בה לדעתך ניתן לבדוק איזה כלי אמין יותר בתנאי אי ודאות?
בדיקת המתודה, כיצד? 94211
לאור הודעתם של הזוג וישנה, הרי שאני מוותר על תשובה למלבן שלי. הם ניסחו את תהיותי הגולמיות בצורה טובה יותר מכפי שיכולתי.
אמשיך לעקוב בעניין.

(ואסף, זהו לא ויתור פטרוני מתוך ההנחה שתמיר עובד בשבילי, אלא תרומה למיקוד הדיון)
בדיקת המתודה, כיצד? 94191
המחקר הזה רחוק מאד מלשכנע אותי לנטוש את הניסויים בבעלי-חיים. יש בו המון כשלים מתודיים, ונקודות המוצא שלו גם הן בעיתיות.
התגובה נכתבה בשיתוף עם טלי (שהיא רופאה ועוסקת במחקר רפואי).

בקצרה, הניסוי נערך כך. בחרו 50 חומרים שרעילותם לבני-אדם ידועה, ושיש מידע מבוסס בדבר הרעילות שלהם לבעלי חיים. הורכבה סוללה של 61 בדיקות מבחנה (ברקמות), וכל אחד מ-‏50 החומרים נבדק בכל אחת מ-‏61 הבדיקות.
את התוצאות שילבו כדי לנסות לחזות את הרעילות לבני-אדם; המסקנות הושוו למידע המבוסס על ניסויים בבעלי-חיים. בניתוח סטטיסטי של התוצאות החוקרים מצאו סוללה מסויימת (בת ארבע בדיקות) שלה ההצלחה המובהקת ביותר, והם טוענים שהסוללה הזו היא חזאית רעילות עדיפה על בדיקה in Vivo.

0. ראשית צריך להבהיר: הלוואי שתצליחו. הלוואי שאפשר היה לבדוק רעילות בעזרת ערכת בדיקה ייעודית, או בסימולציה במחשב, ולא בניסוי בבעלי-חיים. ולא רק מטעמים מוסריים, אלא גם כלכליים: הניסויים בבעלי-חיים הם יקרים וממושכים, ואם אפשר היה להחליף אותן במשהו יעיל יותר (או אפילו יעיל טיפטיפה פחות), חברות התרופות היו מפעילות לחץ אדיר (ומנומק!) לעשות זאת. הניסוי שאתה מצטט בוצע אמנם בכמה מרכזים והושקעו בו מאמצים ניכרים, אבל הוא רחוק מאד מלשכנע.
גם האכסניה שלו (ATLA=Alternatives To Laboratory Animals) אינה בדיוק נייטרלית, אבל את כל פרטי הביקורת שלהלן כתבתי לפני שגיליתי את הפרט הזה.

וכעת להערות על הניסוי עצמו.

1. עם כל-כך הרבה (61) בדיקות מבחנה, לא פלא שאפשר לקבל תוצאות טובות, ואפילו באקראי. אילו המאמר היה טוען להשוואה בין בדיקת מעבדה מסויימת לבין ניסויים בבע"ח, זה היה מתקבל על הדעת. אבל זה לא מה שעשו; אפילו לא לקחו את הטוב מבין 61 הבדיקות האלה, אלא את *הקומבינציה האופטימלית* (מן הסתם תוך הגבלה על מספר הבדיקות; ארבע במקרה הזה).
חשוב להבין שזו לא הערה קטנונית מהסוג של "חיפשו בין כל-כך הרבה בדיקות מעבדה, אז לא פלא שמצאו קומבינציה שמצליחה יותר מניסויים בבעלי-חיים" - כי בהחלט מספיק למצוא קומבינציה אחת כזו, ובאמת לא חשוב איך. העניין הוא עקרוני: עם בסך-הכל 50 מספרים לחזות (נתוני הרעילות בבני-אדם), אפילו נתונים מקריים יכולים להצליח. הרי 61 הוקטורים באורך חמשים (של נתוני הבדיקות) פורשים את המרחב הליניארי כולו - אז תמיד אפשר למצוא מקדמים ש"יסבירו" כל וקטור תוצאות נתון מראש.

2. זה לא הוגן להשוות 61 בדיקות מעבדה לנתון האמורפי "מידע שהושג מניסויים בבעלי-חיים". היה מקום להשוות את המידע המעבדתי לקומבינציה אופטימלית של כמה ניסויים, למשל נתוני הרעילות בעכברים, בחולדות, בקביות, בחתולים ובכלבים. זו לא רק בעיה של "הגינות" - אם רוצים לשכנע אותי לזנוח שיטת מחקר מסויימת, צריך להצליח יותר מן האופטימום שלה ולא יותר מאיזשהו דחליל שאינו מייצג אותה.

3. מהסקירה לא ברור מהו בדיוק המידע שמנסים לחזות לגבי בני-אדם. הרי בחרו בכוונה חומרים רעילים, אז מה נשאר בדיוק לעשות? היה מקום להוסיף להם גם חמשים חומרים שידוע כי אינם רעילים.

4. האם לא ניתן לחלק את חמשים החומרים שנבחרו למשפחות? נניח, למשל, שבדיקות מעבדה הן באמת מוצלחות יותר באבחון רעלנים שיש בהם מתכות, אבל פחות טובות בזיהוי רעלנים שאין בהם מתכות. היינו רוצים לדעת שזה המצב, כדי לבחור בשיטה המתאימה יותר לכל חומר חשוד. בנוסף, בחירה (אפילו אקראית) של יותר רעלנים מסוג אחד יצביעו על שיטה עדיפה (לכלל הרעלנים), ללא ביסוס מספיק.

5. בחירת החומרים היא שלב קריטי בניסוי, שכן בזמן בחירת החומר כבר ידועה התוצאה של ניסויים בבעלי-חיים עליו. המשמעות היא שהטיה (אפילו לא מכוונת) של *בחירת* החומרים לכיוון חומרים שבהם ניסויים בבעלי-חיים כשלו, מטה גם את התוצאות.

6. על הסכנות של שיפוץ תוצאות רטרואקטיבי אפשר ללמוד מהשיטה שמתוארת במאמר, כיצד להעלות את רמת החיזוי של בדיקות מעבדה מ- 77% ל- 88%: מתוך 50 החומרים, פוסלים שבעה שפוגעים במנגנון הפעולה של תאים חיים. השאלה היא כמובן אם אפשר היה לאתר חומרים כאלה מראש, ולא בדיעבד (לאחר שהניסויים בבעלי חיים כבר בוצעו).

7. הסוללה נותנת ציון (IC50), שהוא אכן מדד מקובל לרעילות. אלא שמניסויים בבעלי-חיים אפשר לקבל גם מידע מפורט על רעילות למח, לכליות, לכבד, ללב; ומידע כזה הוא חיוני לקביעת ההתוויות של תרופה (למשל, לא לתת תרופה מסויימת לחולי כליות).

8. הצעה פרקטית למחקר: לאחר שנבחרה הסוללה של ארבעת המבדקים ונקבעו הפרמטרים שלה, יש לבחור חומרים *חדשים*, שלא השתתפו במחקר הנוכחי. אותם צריך לבדוק, באותה מידה של יסודיות שהושקעה בבדיקה המעבדתית, על בעלי-חיים שונים - להשוואה כזו תהיה יותר משמעות.

יש נקודה עקרונית נוספת, שבגללה כל התקוות הגדולות שתולים באלטרנטיביות נדונות לדעתי לכשלון. נניח שכושר החיזוי של מבדקי המעבדה הטובים ביותר יהיה 85%, וכושר החיזוי של ניסויים בבעלי-חיים הוא רק 60%.
ונניח שסוללה משולבת, המורכבת ממבחני מעבדה *וגם* מניסויים בבעלי-חיים, משיגה הצלחה של 90%. ההכרעה המוסרית של רוב מדעני העולם תהיה לדעתי לבחור בשילוב הזה, ולצורך העניין דעתך האישית על ההכרעה המוסרית הזו לא רלוונטית.
גישת ה"אלטרנטיבות" תצליח רק אם בדרך-פלא מבדקי מעבדה יצליחו כל-כך עד שניסוי בבעלי-חיים יהפוך למיותר; ועם כל הרצון הטוב, זה נראה לי אופטימי מדי.
ועוד הערה 94201
שתצער עמוקות גם אותי: אם מבחני הרעילות על בע"ח לא מספיק אמינים, אולי המסקנה היא דוקא שצריך לבצע רבים מהם על בע"ח קרובים יותר לאדם, ובעיקר על קופי אדם.

האמת היא שאם מבחני הרעילות היו מבוצעים באופן תדיר על בונובוס הייתי בדילמה מוסרית כבדה. אבל אל תגלו לאף אחד.
בדיקת המתודה, כיצד? 94261
נתחיל מתיקון אי דיוקים. ATLA הוא כתב עת מדעי, ואחד מהיותר מוערכים באירופה. לומר שהוא אינו נייטרלי בענייני חלופות זה כמו לומר ש- Science לא נייטרלי בענייני מדע, ש- BJC לא נייטרלי בפרסומיו על חקר הסרטן, וכו'.

היתרון הכלכלי של חלופות לשימוש בבע"ח יוצר לחץ לשכלול השיטות; לחץ שמוביל לשינוי הדרגתי ואיטי עקב הביורוקטיה של הגופים הרגולטוריים שאמורים להחליט לכאן או לכאן (וכמובן, כל מיני פסאודו-מדענים מקובעים שלא טרחו לבדוק את אמיתות טענותיהם בדבר העדרן של חלופות). השינוי הדרמטי ביותר עד כה התרחש בשני העשורים האחרונים.

סקירה קצרה בסדר כרונולוגי יורד:

- לפי המכון הלאומי לחקר הסרטן בארה"ב (NCI), מודלים חייתיים לחקר הסרטן נחשבים היום ל"מיושנים". היום כלי מחקר מודרני ויעיל הוא שימוש ברקמות אנושיות ממוחזרות. ניתן לקרוא על כך כאן (אך יש להירשם קודם):
- ב- 27 לפברואר 2002, התפרסמה כתבה בבוסטון גלוב בה תואר שינוי מהותי במדיניותה של חברת מעבדות צ'רלס ריבר, החברה הגדולה בעולם המשווקת בע"ח למעבדות ניסויים. להלן כמה ציטוטים מהכתבה (לא הצלחתי לאתר אותה יותר באתר הבית שלהם, אך יש לי אותה על המחשב, אם מישהו רוצה עותק):

"Our needs move in tandem with the industry," said Jim Foster, the company's chief executive. "Companies need to get drugs to market faster. To do that, they need more nonanimal testing technologies”…

In the past five years, the lab animal portion of Charles River's business has gone from 80 percent to 40 percent.

The company's foray into non-animal tests reflects the growing dependence of drugmakers on such tests. And as opposed to the 1980s, when calls from animal activists focused the drug industry on more humane methods, today's movement is driven largely by economics and science.

החברה צמצמה לא פחות מ- 50% ממערך גידול חיות המעבדה שלה כדי לעבור לייצר חלופות. מזל שהם לא קראו באייל הקורא שאי אפשר להשתמש בחלופות כדי לבדוק רעילות של תרופות וחומרים.

- ב- 3 לאוקטובר 2001, הכריז הארגון האחראי על ולידציה של חלופות במשרד הבריאות האמריקאי כי ניתן להפחית מיידית 30% מסך בעלי-החיים המעורבים במבדקי רעילות בזכות שימוש בתרביות רקמה. http://www.niehs.nih.gov/oc/news/anitest2.htm (אתה חושב שהפחיתו?)

- בשנת 2000, הוכרזה כוונה לחדול לאלתר מביצוע מבדק ה- LD50, ולעבור במקום להשתמש בחלופות. חלופות למבדקי רעילות לעור ולעין אושרו באירופה ובארה"ב והחליפו (!) את המבדק שעד לפני שנתיים נערך בבעלי חיים.

- על התפתחות החלופות במאה הקודמת: http://www.hsus.org/ace/12443

1. אני מאוד מצטער, אבל הערותיכם מראות פשוט על חוסר הבנה של המחקר שנערך. אכן, נבדקו 61 מבדקים שונים לכל כימיקל – אולם כל אחד מהמבדקים הללו נותן תוצאה דיסקרטית לפי קריטריונים שהוצבו מראש: מסוכן או לא מסוכן + דירוג של רמת הסיכון). הקומבינציה של 4 המבדקים שנבחרו לבסוף היא של המבדקים שנתנו את מירב התוצאות הנכונות והמדויקות, כלומר: תוצאותיהן מכסות על תוצאותיהן של שאר המבדקים (שהושוו זה לזה ולא נבדקו כקומבינציה!) והם מגיעים יחד ל- 77% דיוק בהשוואה לתוצאות הקליניות. הניסוי לא יצא להוכיח שבעזרת 61 מבדקים משולבים אפשר לקבל תוצאות טובות יותר משימוש בבע"ח, אלא למצוא את אותה הקומבינציה במינימום מבדקים שתתן מקסימום תוצאות נכונות. השילוב האופטימלי הוא זה שמתואר בתקציר.

2. נתוני הרעילות ממבדקי בע"ח הם בכלל לא אמורפיים; החוקרים לקחו מידע נגיש וקיים בספרות המדעית שהיה מספק מבחינה סטטיסטית, ואכן כלל מגוון מינים ביולוגיים (נערכה גם השוואה נפרדת לחולדות בלבד – שזה מבדק הרעילות הסטנדרטי אגב, שכמובן היה עוד פחות אמין בהשוואה לשיטות המבחנה המתקדמות). אתה מוזמן לקרוא את מלוא המידע המספרי במאמר המקורי (קישור מטה).

3. טענתכם שבחירת החומרים היתה בעייתית איננה נכונה. רעילות היא תלויית מינון. כמעט כל חומר רעיל במינון מסוים והשאלה האמיתית במבדקי רעילות היא מה המינון המסוכן לבני-אדם. בין השאר נבדקו שם חומרים כמו ניקוטין, קפאין ואספירין.

4. לא ברור לי מה אתה רוצה לשאול פה. הכי טוב שתקרא את המאמר המקורי בעצמך, עם כל הטבלאות ורשימת החומרים המלאה:

5. כן, בחירת החומרים היא ללא ספק קריטית. האם אתה מאשים מישהו בהטיית התוצאות לכיוון מסוים? אם כן, רצוי שתבסס את ההאשמה. אם אתה דווקא רוצה לדבר על דרכים להטות תוצאות מבדק כך שיתאימו להיפותזה של החוקר, אני חושב שכדאי לך להתחיל לחפש אותן במחקרים מבוסס בע"ח, שם סוג המודל החייתי נבחר פעמים רבות לפי התיאוריה שמנסים להוכיח.

6. שוב מדובר בחוסר הבנה. שבעה מהחומרים הם מקרי קצה שהשפעתם ספציפית מאוד ואין כיום שום מבדק שהיה מגלה את רעילותם הקלינית, כולל כמובן מבדקי רעילות על בע"ח. פסילתם העלתה לכן את רמת החיזוי של שתי צורות המבדק.

7. ניסויים בבע"ח אולי "מספקים מידע" על רעילות למערכת העצבים, הכליות, הכבד והלב – אבל אף אחד לא מבטיח לך שיש קשר בין המידע הזה לתוצאות בניסויים הקליניים. בעיקר לא הסטטיסטיקה. ובכל זאת טעות בידך. המבדק המדובר דווקא כן בדק רעילות לאיברים ספציפיים (בעזרת שימוש ברקמות המתאימות) וגם מידע זה הושווה למידע ממבדקי רעילות קליניים וספציפיים על בע"ח. אחוזי האמינות עליהם מדובר כוללים גם שקלול של המידע הזה.

8. מסכים איתך בנוגע לכל הפסקה. יתרה על כך – כל מבדק רעילות צריך להכיל גם סוללת MEIC, כך שיתקבל מידע סטטיסטי בלתי מעורער שיספק תמונה רחבה על האמינות ההשוואתית של שתי השיטות.

למרבית הצער בחרת לסיים בנאום הסטנדרטי של אלה שלא נותנים לעובדות לבלבל אותם: כל התקוות נדונות מראש לכישלון, אם יהיו אי פעם חלופות אז שישתמשו גם בהן אבל לא במקום החיות, וכו' וכו'. זה פשוט עצוב. המידע הקיים כבר היום מוכיח מעל לכל ספק ששיטות מבדק In Vitro מגבירות את אמינות המבדקים הפרה-קליניים. הקיבעון המודגם גם בפסקה האחרונה שלכם הוא אחת הסיבות העיקריות לכך שהן עדיין לא חלק קבוע מפרוטוקול המבדקים הפרה-קליניים ושהן אינן נדרשות ע"י הרגולטור למרות ששיטות מהמאות שעברו שמעולם לא הוכחו מדעית נהוגות בכל מקום ונחשבות לשיא המדעיות.
בדיקת המתודה, כיצד? 94271
טוב, קיוויתי שתענה על כך לעוזי (בעיקר לפסקה האחרונה אליה נמנעת מלתת תגובה עניינית), אז אני אשאל בכ"ז את השאלה המקורית שלי:

האם קבוצת הרעלנים שזוהו על ידי המודל החייתי מוכלת באלו שזוהו על ידי המודל המבחנתי?
בדיקת המתודה, כיצד? 94514
השאלה ששאלת, הדורשת מעבר על 50 תוצאות כפול 5, בעייתית לא רק מאחר ומדובר בבזבוז עצום של זמן, וחיפוש נתונים שכרגע אינם נגישים ברשת (האתר המוקדש למחקר השוטף מושבת זמנית); אלא מאחר ועם כל הכבוד, מדובר בשאלה קטנונית שמראה על ליקוי בהבנת משמעותו של המחקר.

והיה והמודל החייתי, שאמינותו קרובה לזו של הטלת מטבע, מספק תשובה נכונה. מה בדיוק זה אומר?

הצגתי בפניכם את אחד המחקרים הראשונים שיצאו לחפש סוללה בעלת יכולת להחליף את בעלי-החיים למבדקי רעילות, וכבר בו התברר שהיא אמינה יותר מהמודל החייתי ב- 18% בממוצע, למרות שמדובר בתחום שכמות ההשקעה בו עומדת על פחות מ- 10% מהכסף שמושקע במחקר מבוסס בע"ח, שגם וותיק במעל ל- 100 שנה.

המודל החלופי ההתחלתי הזה, יכול כבר עכשיו לשפר ללא ספק את אמינות מבדקי הרעילות כשהוא עדיין בחיתוליו. ובמקום לשאול איך זה שאף אחד לא טורח לדאוג שהוא יהפוך את התרופות שאתה נוטל לבטוחות יותר, זה מה שאתה שואל. שליפה קצרה מתוך המאמר, ע"מ 7:

Simple human cell tests were shown to be relevant for human acute lethal action for as many as 43 of the 50 MEIC reference chemicals (86%). The exceptions were atropine, digoxin, malathion, nicotine, cyanide, paracetamol, and paraquat – all specific receptormediated toxicants.

A battery of three of these human cell line tests (nos. 1, 9, 5/16) was found to be highly predictive (R2 = 0.77) of the peak human lethal blood concentrations (LC50) of chemicals. The prediction increased markedly (R2 = 0.83) when a simple algorithm based on the knowledge of passage across the blood-brain barrier was used to adapt in vitro to in vivo concentrations

Prediction was better than the prediction of human lethal doses by rat and mouse LD50-values (R2 = 0.65).

The prediction of human toxicity by the tests of slow-acting chemicals was much improved when 48-hour cytotoxic concentrations were compared with 48-hour
human lethal blood concentrations. Thus, an in vitro test providing a discrimination between a rapid and a slow cytotoxic action would increase the predictive power of a cell test battery on acute toxicity.

אם זה עדיין מעניין אותך, תחפש את הנתונים בעצמך. אל תשכח לעבור על נספח 3, בו יש טבלה נחמדה ונוחה שמווה בין נתוני ה- LD50 של חולדות, עכברים ואנשים. מאיר עיניים.
בדיקת המתודה, כיצד? 94516
זו שאלה עניינית, ו"אמינה כהטלת מטבע" זו דמגוגיה.

שאלה עניינית - אני חושב, אינטואיטיבית, שמודל משולב יעיל יותר מהחלופה לבד. אם אכן הקבוצה לא מוכלת הרי שמ.ש.ל.

דמגוגיה - אם התחלת עם 200 חומרים, 100 רעילים ו100 לא, ובדקת במודל החייתי, תשאר עם 100 לא רעילים ו35 כן. תבדוק בהטלת מטבע, תישאר עם 50 לא רעילים ו50 כן. "יעילה כהטלת מטבע", נובמת.

בנוסף, אני לא שואל איך זה שאף אחד לא עובד עם החלופות, כי אני מאמין שעובדים *גם* עם החלופות. אם לא, אז נראה לי שראוי שכן.
בדיקת המתודה, כיצד? 94537
א. השאלה ה'עניינית' שלך לא רלוונטית מאחר ולמקרה שעוד לא הבנת את זה, היא מקדימה את זמנה. בינתיים, בניגוד למה ש'אתה חושב', לא עובדים גם עם החלופות - מתבססים רק על שימוש בבע"ח כמעט בכל מכוני המחקר (למה שישלבו ויבזבזו עוד כסף אם הם לא חייבים?). האינטואיציה שלך, גם היא לא רלוונטית. השורה התחתונה היא שמודל התחלתי הצליח להיות אמין בקרוב ל- 30% יותר מניסויים בבע"ח עם תקציב שעומד על הרבה פחות מ- 30% ממה שמוקצה למחקר מבוסס בע"ח.

ב. לא ברור מה קשה להבין - מטבע אמין סטטיסטית ב- 50% מהמקרים. ניסויים בבע"ח 65% בממוצע. אגב, הדוגמא שהצעת מגוחכת ולא משקפת את המציאות - כימות מספרי אבסולוטי לא משקף טעויות לכאן ולכאן (חיברת את הרעילים הנכונים והשגויים, וכנ"ל את הלא רעילים האמיתיים והשגויים). עדיף אם תמשיך לדבוק בפילוסופיה.
בדיקת המתודה, כיצד? 94542
ב. אני מודה לך על ההמלצה, (ואתה חושב שתוכל לספר לעיגול פעם באה שאתם נפגשים? הוא דווקא לא כל כך חושב שזה התחום שלי) אבל אם יש לך חומר בלתי מזוהה מולך, מטבע אמין סטטיסטית ב0% מהמקרים, וזאת כי אין קשר בין ההטלה והחומר. אתה בטוח שאתה מבין את המשמעות של אמינות סטטיסטית? אולי עדיף שתשאר עם ביולוגיה.

א. תראה, אם יש מישהו עם אינטרס ברור להצליח לזהות בזמן את המינון הרעיל, הרי שזה לחברות המייצרות תרופות. מבדקים קליניים עולים המון כסף, ואם פסלת את התרופה לפני שהיא תפסל במבדקים הקליניים, חסכת. אם אכן חברות התרופות לא משתמשות במודלים ממוחשבים ותרביות תאים (שעלותן זניחה ביחס) הרי שהן פועלות בניגוד לאינטרסים שלהן עצמן, והחברה הראשונה להבין זאת תרוויח, ובגדול. אם כבר ממליצים אחד לשני באיזה תחום לדבוק - לך להקים אחת כזו, ועכשיו. תקבל המון כסף.
בדיקת המתודה, כיצד? 94623
אני מסיים כעת להגיב על המאמר שתמיר לוסקי הפנה אליו, אבל התגובה מתארכת, ויש נתון אחד שאולי כדאי להפנות אליו תשומת לב: המודל החייתי אינו עונה רק על השאלה של רעיל-או-לא-רעיל (שאז הצלחה של 65% באמת אינה הרבה יותר טובה מהטלת מטבע) - החיזוי הוא של *המינון* שבו החומר הרעיל. זהו משתנה מסובך יותר (עם טווח של מיליגרמים בודדים לק"ג משקל גוף, עד לעשרות אלפי מיליגרמים).

המספר 65% הוא לא "אחוז ההצלחה" אלא מקדם המתאם של שני המשתנים המסבירים (LD50 בחולדות ובעכברים‏1) והמשתנה המוסבר שהוא מינון קטלני ממוצע בבני-אדם‏2.
ההסתברות לקבל תוצאה כזו (0.65) אם לא היה קשר בין המשתנים המסבירים למוסבר, היא פחות מקלושה: 3 כפול 10 בחזקת 17-. במחקרים רגילים במדעי החיים מקובל לדרוש הסתברות של 1% או 5%.
אני מקווה שזה עונה אחת ולתמיד על הטענה ש"המודל החייתי לא הוכח".

הערות נוספות:
* אם היו משתמשים בנתונים חייתיים נוספים (כלבים, חתולים, ארנבות), יכולת החיזוי היתה כמובן משתפרת.
* למרות שמקדם המתאם של ארבעת מבדקי המעבדה טוב יותר (77% לעומת 65%), ההסתברות לקבל תוצאה *כזו* באקראי היא רק 4 כפול 10 בחזקת 17- (דהיינו, זה קצת יותר סביר‏3). בנסיון נואש לדחוס קורס בזק בסטטיסטיקה לשלוש שורות, הסיבה היא שאפילו הוספת משתנים מסבירים *אקראיים* תשפר את יכולת החיזוי, או ליתר דיוק תתן אשליה של שיפור. ההסתברות מתחשבת לא רק במקדם המתאם, אלא גם במספר המשתנים המסבירים, ובמקרה, הסיכוי ל- 65% עם שני משתנים נמוך יותר מ- 77% עם ארבעה.
כל זה בהנחה שהיו קובעים את ארבעת המבחנים האלה מראש - למרות שבפועל הם נבחרו בדיעבד מתוך מספר גדול בהרבה של משתנים מסבירים. בתגובה הארוכה אפרט גם בעניין זה.

1 LD50 הוא המינון שהורג 50% מן הנבדקים.
2 למעשה בשני המקרים המשתנה הוא הלוגריתם הטבעי של המינון, ולא המינון עצמו. המודל הכפלי סביר יותר מן המודל הליניארי בגלל הטווחים בהם מדובר.
3 עוד הבהרה: ההסתברויות המחושבות להלן הן משמעותיות בטווח ה"סטנדרטי", נגיד מעל מליונית. מתחת זה הן לא מדויקות, וה"יתרון" של 3 חלקי 10 בחזקת 17 על 4 חלקי 10 בחזקת 17 הוא לא משמעותי.
בדיקת המתודה, כיצד? 94644
אה, חשבתי שבודקים מינון מסויים, ולו יש ערך בינארי של רעיל / לא רעיל, כשמודל חייתי מזהה ב65% רעיל, אבל ב100% לא רעיל. (ואז הוא בטח יעיל יותר ממטבע, שמזהה 50% בכל מקרה, בלי שום תאימות).

האמת, כפי שהצגת אותה, כמובן הרבה יותר חזקה, ומדגימה הרבה יותר טוב מדוע "יעיל כהטלת מטבע" זו דמגוגיה פשוטה המסתמכת על אי הבנת הקורא בניסוי שבוצע, ובהסתברות.
אמינות סטטיסטית? 94651
אני לא בטוחה שברור לי המושג. אשמח להסבר.
אמינות סטטיסטית? 94657
מה שכיוונתי אליו, ולא דייקתי (להסבר מדוייק קראי את עוזי, אבל לאט), הוא כזה:
נאמר שיש לך 100 חומרים, 50 מסוג A ו50 מסוג B. עכשיו את מחליטה איזה חומר הוא מה ע"ס זריקת מטבע. אחרי שזרקת, התוצאות שלך (בממוצע) יהיו:

25 חומרים סוג A שזיהית כסוג A
25 חומרים סוג A שזיהית כסוג B
25 חומרים סוג B שזיהית כסוג A
25 חומרים סוג B שזיהית כסוג B

עכשיו נאמר שאני רוצה לבנות מדד שאומר לי מה האמינות של הטלת המטבע. אני מחליט לתת נקודה על כל זיהוי נכון, ולחסר נקודה על זיהו שגוי. מדד כזה, במקרה הזה, יתן לי אפס נקודות אמינות עבור הטלת המטבע (זיהית נכון 50 וטעית ב50), וזאת כי אין קשר בין הטלת המטבע והחומר.
אם היה קשר, נאמר שהתשמשנו במבחן אחר, יותר אמין, אז היו לי פחות false positives וגם פחות false negatives, והיית מקבלת מספר חיובי של נקודות. (או שלילי, זה לא משנה. הרי מבחן שתמיד טועה בזיהוי חומר B למעשה מזהה לי אותו... הערך המוחלט חשוב). מבחן של 100 או 100- נקודות במקרה זה, יהיה מבחן אמין להבדלה בין החומרים.

(זה הסבר אינטואיטיבי. בדרך כלל שמדברים על אמינות סטטיסטית מדברים על עוד דברים, אבל אז ההסבר צריך לכלול את המילה coefficient, וגם אני הייתי מתחיל להסתבך)
אמינות סטטיסטית? 94663
כן, למרות שכתבתי משהו שונה לגמרי, התכוונתי לכל מה שעוזי אמר מתחתי. (כן, בטח...)
אמינות סטטיסטית? 94667
אני רוצה לקשר את ההסבר (הנכון) של גלעד להסבר שנתתי למטה לאותה שאלה (תגובה תגובה 94662 ).

מטבע רגיל הוא "נביא של 0%" (כי הוא תמיד עונה תשובה אקראית). נביא-אמת הוא "נביא של 100%" (כי הוא תמיד עונה את התשובה הנכונה.
אפשר גם לדמיין לעצמנו "נביא של 40%", ש- 40% מהזמן נותן תשובה אמיתית, ובשאר הזמן כדור הבדולח שלו מתערפל, והוא עונה תשובה אקראית.

כעת, מגיע אלינו אדם שטוען ליכולות נבואה (בפתיל הזה, מדובר נניח בשיטת ניבוי רעילות מסויימת). ערכנו ניסוי, והוא ענה נכונה על 70 שאלות כן/לא מתוך מאה (כאשר התשובות הנכונות התפלגו 50/50).

במקרה, זוהי התוצאה שנצפה לקבל מנביא-של-‏40% (כי הוא יענה נכון על 40 שאלות, ויקלע במקרה ל- 30 משאר הששים).

יש כמה השערות מחקר שאנחנו עשויים לרצות לבדוק. למשל "זהו נביא של 40%", או "זהו נביא של יותר מ- 20%", או "הנביא הזה עדיף על הטלת מטבע".
בכל המקרים ה*סטטיסטי* יכול להיות, בדומה למה שגלעד הציע, מספר ההצלחות. ההתפלגות שלו היא (גם כאן) התפלגות נורמלית, שהממוצע שלה תלוי בהשערה שאנחנו מנסים להוכיח.

לא בדקתי את המספרים, אבל ברור שאת ההשערה הראשונה (נביא של 40%) לא נצליח להוכיח, כי נביא-של-‏35%-שהיה-לו-מזל יכול להצליח כמו נביא-של-‏40%, ולכן משיעור הצלחה של 40% לא ניתן להוכיח נביאות-של-‏40%.

את ההשערה השניה אפשר יהיה כנראה להוכיח (כי נביאים של 20% אמורים לקבל רק 60 תשובות נכונות, או קצת יותר, אבל לא 70). מעניין לשים לב שאם גודל המדגם (מספר השאלות, 100 במקרה שלנו) היה קטן יותר, אולי לא היינו משתכנעים שההשערה השניה נכונה (במדגם של 20 שאלות, נביא-של-‏40% אמור להצליח 14 פעם, ונביא-של-‏20%, רק 12; אבל גם הוא יכול להצליח 14 פעמים ביום טוב...). לעומת זאת במדגם ממש גדול (40000 שאלות למשל), היינו מן-הסתם משתכנעים אפילו שמדובר בנביא-של-לפחות-‏39%.

את ההשערה השלישית (נביא-עדיף-ממטבע) נוכל מן הסתם להוכיח אפילו אם *באמת* היה מדובר רק בנביא-של-‏20%.
אמינות סטטיסטית? 94662
להן הסבר (קצר) על המבנה המקובל של מחקר, הכולל ניתוח סטטיסטי.

החוקר מעלה השערה (למשל: הציונים של בנים ובנות בחשבון שונים אלו מאלו), מברר לעצמו מה יפריך את ההשערה (אם הם מצליחים במדה שווה), וקורא להשערה הנגדית הזאת H0. כעת החוקר משנס מותניו ומנסה *להפריך את H0* (זה הרי יוכיח שהוא צדק מלכתחילה). ‏1

החוקר שולח מאסטרנטים לאסוף נתונים (30 ציונים של בנים, 30 ציונים של בנות).
כעת בונים "סטטיסטי", שהוא מספר המחושב מתוך הנתונים הגולמיים (בדוגמא, זה יהיה ההפרש בין ממוצעי הציונים, מחולק בסטיית התקן המשותפת). במקביל (או מראש), מוצאים את ההתפלגות של הסטטיסטי בהנחת ההשערה H0 (בדוגמא, ההתפלגות היא זו המכונה "התפלגות נורמלית" ‏2).

(מהי ההתפלגות הזאת, בכלל? חישוב ההתפלגות שקול לעריכה וירטואלית של המון ניסויים מאותו סוג, שבהם ההשערה H0 *נכונה*, למשל איסוף של 60 ציונים וחלוקתם לקבוצות לפי שם המשפחה ולא לפי המין. מתוך מליון ניסויים כאלה, 39800 יהיו בין 0 ל- 0.1; 39400 יהיו בין 0.1 ל- 0.2; ... 380 יפלו בין 3 ל- 3.1, וכן הלאה) ‏3.

השלב האחרון הוא לחפש את הציון שקיבלנו (בפועל, במחקר הנוכחי) על עקומת ההתפלגות (שמצאנו בספר). למשל, נניח שקיבלנו את המספר 2.05. לפי ההתפלגות שבספר, מספר כזה יופיע באקראי (כזכור, בהנחה ש- H0 היא ההשערה הנכונה) בהסתברות 4%. החוקר די מרוצה - המשמעות של תוצאה כזו היא שאם באמת H0 נכונה (והחוקר מקווה שלא כך), המספר 2.05 יופיע רק בסיכוי של 4%. אבל במציאות, בניסוי שהחוקר ערך, הוא *באמת* קיבל את המספר הזה - אז נראה לו לא סביר להניח ש- H0 נכונה (כי אחרת דברים כך-כך לא סבירים כמו 2.05 לא היו קורים דוקא לו).

לעומת זאת, אם החוקר היה מקבל שהסטטיסטי הוא 0.9, דבר שהסתברותו 36%, זו לא תהיה עדות משכנעת ש- H0 שגויה, שהרי דברים בעלי סיכוי גבוה כל-כך קורים לנו כל הזמן.

מקובל במדעי החברה לדרוש שההסתברות לקבל את הסטטיסטי המסוים שהתקבל בפועל, תהיה מתחת 5%. אם זה כך, ההשערה H0 נחשבת למופרכת (ולכן השערת הנגד שממנה יצאנו - נכונה). המספר הזה (5%) נקרא "המובהקות הססטיסטית של המחקר".

הערה: אם חוזרים על ניסוי הרבה פעמים, זה דוקא *כן* סביר שיקרו דברים "לא סבירים" (שהסתברותם למשל 5%). בפרט, אחת מכל 20 טענות ש"הוכחו סטטיסטית" (ברמת מובהקות של 5%) צריכה להיות שגויה...
בתחומים מסויימים במדעי הטבע מקובל לדרוש רמת מובהקות של 1%, מה שמצד אחד מגדיל את האמינות של התוצאות, ומצד שני שולח יותר חוקרים מאוכזבים לתכנן את הפרוייקט הבא.

אם משהו לא ברור - נא להצביע.

1 למעשה, לשלב הזה קודם משהו בסיסי יותר, שבו החוקר מנסח את המודל שלו (בדוגמא: שציוני בנים וציוני בנות הם בעלי התפלגות נורמלית עם אותה סטיית תקן).
2 איך יודעים מה ההתפלגות? זו שאלה שאני *באמת* אשמח לענות עליה - אבל מומלץ לשאול רק אם את באמת רוצה לדעת...
3 מאיפה לוקחים את המספרים האלה? אותה תשובה כמו ‏2.
אמינות סטטיסטית? 94665
בתור מי שבא מעולם של הסתברות ולא מעולם של סטטיסטיקה, להבנתי, כשהחוקר מפריך את H0 הוא בעצם אומר שהניסויים (בדיקת הציון של הבנים והבנות) הם לא i.i.d (*), וזה מה שרצינו להראות.
אבל, ייתכן שH0 נכונה ו*עדיין* הניסויים הם לא i.i.d, פשוט כי המדגם קטן מידי. ולמיטב זכרוני, מה שמבטיח התפלגות גאוסיינית זה WLLN (**), שבעצמו מתקיים רק בשאיפה לאינסוף, לא?

(*) Indipendent Identical Distribution
(**) Weak Law of Large Numbers
אמינות סטטיסטית? 94671
חלילה לחוקר מלהוכיח שהדגימות שלו אינן IID...
בדוגמא שלי המודל הוא ששתי האוכלוסיות מתפלגות נורמלית, ו-H0 היא ההשערה שלשתי האוכלוסיות יש אותה תוחלת. הפרכת ההשערה מראה שזה לא כך, אבל עדיין (יש לקוות) הדגימות בכל אוכלוסיה *בפני עצמה* הן IID.

לעניין גודל המדגם - כל שתי דגימות אמורות להיות IID (שיטת הדגימה אמורה להבטיח זאת). נכון שגם בהנחה הזו, הסטטיסטי יתפלג נורמלית רק אם האוכלוסיות באמת מתפלגות נורמלית (ואז גודל המדגם *לא משנה*), או שהדגימה גדולה מספיק.
קישור לכתבה 94277
תודה! 94280
בדיקת המתודה, כיצד? 94629
א. אולי באמת נתחיל בתיקון אי דיוקים.
המאמר התפרסם, כזכור, בכתב העת ATLA. העורך הראשי של כתב העת הזה הוא Michael Balls מה- Environment Institute של איטליה, שהוא גם אחד מראשי ה- European Centre for the Validation of Alternative Methods.
עורכי המשנה: Bob Combes, שהוא המנהל המדעי של הסניף הבריטי של FRAME (ראה להלן), ו- Horst Spielmann מה National Centre for Documentation and Evaluation of Alternative Methods to Animal Experiments של גרמניה.

אולי צריך לציין שעורכים של עיתונים מדעיים אינם מגיעים בדרך כלל מ"המכון לקבעון מחשבתי והתעקשות על ניסויים בבעלי-חיים" אלא מאוניברסיטאות מכובדות.

אולי ה- ATLA הוא באמת "אחד מהעיתונים היותר מוערכים באירופה". אבל בשביל לעזור לטענה שהוא נייטרלי בענייני חלופות, היה כדאי שהבעלים שלו (FRAME, Fund for the Replacement of Animals in Medial Experiments) יסווה את עצמו בשם אחר.

בעמוד 5 של הסקירה, המחברים כותבים שבזמן תכנון המחקר (ב- 1989), המטרה "establishing batteries of existing in vitro toxicity tests as replacement of acute toxicity tests on animals" נחשבה "practical and ethical". עם כל הרצון להוכיח את השערות המחקר, לקרוא להן "מטרות אתיות" עשוי (בעיני קוראים מסויימים) להחשיד בחוסר אובייקטיביות.

ועם כל זה לא נזקקתי בתגובה הקודמת לנימוקים של חוסר אמון בכותבי המאמר, ולא אפנה אליהם גם בזו.

ב. העובדה שחלופות מעבדתיות לשימוש בבעלי-חיים הן זולות יותר היא הוכחה טובה מאד לטיעון המרכזי שלי: שלא הוכח קיומן של אלטרנטיבות טובות מספיק. ברגע שיהיו הוכחות שאלטרנטיבות כאלה קיימות, לא תהיה שום סיבה לא להשתמש בהן. אבל לא משתמשים רק בהן, אז מסתבר שעוד לא הוכיחו.

ג. התרשמתי שאתה מאד מחבב את הביטוי "פסאודו-מדענים". אם הכוונה היא אלי (ואל טלי), אשמח לשמוע זאת במפורש, ורצוי באופן מנומק; מי יודע, אולי יהיה לי מה להגיד בנושא.
מאד נח לקרוא לכל מי שחושב שניסויים בבעלי חיים מניבים תוצאות, "פסאודו מדען". אבל חשוב לזכור שההגדרה הזו כוללת היום קצת יותר מרוב דחוק של העוסקים במדעי החיים. הבעיה אינה בכך שהכינוי הזה מעליב, אלא בכך שהוא מונע ממך להבין את הסיבות האמיתיות שבגללן אנשים חושבים אחרת ממך. אם כולם פסאודו מדענים, אז אולי הם באמת חושבים שהניסויים נחוצים בגלל קבעון מחשבתי, ולא מסיבות לגיטימיות.

ד. "העדר של חלופות" זו לא טענה שצריך להוכיח. היא אומרת דבר מאד אלמנטרי (מבחינת הפשטות שלו, לא בכך שהוא בהכרח מובן מאליו): לא הוכיחו שיש חלופות טובות. לא את הטענה הזו צריך "להוכיח", אלא את שלילתה.

ה. הנה עוד ציטוט מן הכתבה בבוסטון גלוב (ותודה לאשר לבשן על הקישור).
"In vitro tests, powerful as they are only provide certain pieces of puzzle," said Paul Silber, president and chief executive of In Vitro Technologies. "Live animals provide the rest. The two together are stronger than either standing alone - at least at present."

ו. לא טענתי ש"אי אפשר" להשתמש בחלופות. אדרבה - יש להשתמש בהן ככל האפשר. הן זולות ומהירות יחסית, ועשויות לייתר חלק גדול מן הניסויים המתבצעים היום. בעזרת בדיקות מתאימות אפשר יהיה גם לקבוע מהו המודל החייתי המתאים ביותר לחומר הנבדק. אבל אם אתה מצפה שבסוף בדיקות המעבדה יזנקו לניסויים בחולים בגלל שתהיה להן אמינות כל-כך גבוהה עד שהניסויים בבעלי-חיים יהפכו למיותרים, אלו נראים לי חלומות באספמיא.

ז. גם אם לפני פחות משנה הכריז הארגון המתאים במשרד הבריאות האמריקאי שתרביות רקמה מאפשרות להפחית 30% מבעלי החיים המעורבים במבדקי רעילות - מה אתה מצפה שיקרה? שלמחרת יבטלו רטרואקטיבית 30% מהניסויים? הניסויים הם ממושכים, ושינויים במבנה שלהם לוקחים זמן. ההפחתה הזו מבוססת על נסויי תרבית שיש לבצע, וגם בזה לא כל מעבדה יכולה להתמחות בין לילה. ככל שיצליחו לשפר את האלטרנטיבות, יהיו יותר מערכי ניסוי שינצלו אותן, ומספר בעלי-החיים בניסויים יפחת.
היה סמוך ובטוח שברגע שהדבר יהיה אפשרי, הלחץ הכלכלי יפעל לטובת העניין הזה יותר מכל נימוק מוסרי שתעלה.

ח. אתה מספר בכזו חדווה על חלופות למבדקי רעילות לעור ולעין, עד שאני נוטה לחשוב שדילגת על ההערה שמספרה 0 בתגובה שלי. אני מאד שמח לשמוע שיש אלטרנטיבות. באמת. בכל מקום שהיעילות שלהן תוכח, צריך לאמץ אותן. אלא שאני חושב שמי שצריך להכריע שההוכחות קבילות הוא הממסד המדעי, ולא לחץ חיצוני.

קראתי את 66 העמודים של הסקירה המלאה, ואני מבקש להתייחס כעת לנקודות הביקורת שלי ולתגובות עליהן.

1. ההערה המקורית שלי היתה מדויקת. במחקר מחשבים את מקדם המתאם בין משתנים מסבירים (נתוני LD50 של חיות מצד אחד, או תוצאות המעבדה מצד שני), לבין המשתנה המוסבר, שהוא לוגריתם הריכוז הקטלני הממוצע לבני אדם. במדגם של 50 חומרים, שני משתני LD50 (עכברים וחולדות) משיגים מקדם 0.65, וארבעה מבדקי מעבדה משיגים מתאם 0.77.
בשני המקרים בהחלט מדובר ב*קומבינציה*, דהיינו צירוף ליניארי של המשתנים המסבירים.
הדרך המקובלת להשוות מקדמי מתאם כאלה היא ההסתברות לקבל אותם באקראי (דהיינו מתוך ההנחה שהמשתנה המוסבר בלתי תלוי במסבירים). בכל מאמר מדעי מביאים את ההסתברות הזאת בצמוד למקדם המתאם, וקצת התפלאתי לא למצוא אותה כאן (אפילו שמדובר רק בסקירה). בכל אופן, את ההסתברויות אפשר לחשב מתוך הנתונים וגודל המדגם (שהוא 50), והתוצאות הן כדלקמן:
- ההסתברות לקבל 0.65 עם שני משתנים מסבירים היא 3.25 כפול עשר בחזקת מינוס 17.
- ההסתברות לקבל 0.77 עם שני משתנים מסבירים היא 4.18 כפול עשר בחזקת מינוס 17. (ההבדל אינו משמעותי, אבל הוא לטובת הנתונים החייתיים).
ארבעת מבדקי המעבדה נבחרו משום שהם נותנים את הצירוף הטוב ביותר מכל 61 בדיקות המעבדה. מכיוון שכך, את ההסתברות עבורם יש להכפיל במספר הרביעיות שאפשר לבחור מ-‏61 בדיקות, וההסתברות עולה ל- 2.18 כפול עשר בחזקת מינוס 11.

לסיכום נקודה זו: היתרון של מבדקי המעבדה על נתונים שנאספו מניסויים בבעלי חיים נובע כולו מכך שהשוו המון מבחני מעבדה ומעט נתונים חייתיים.

ישנו מבחן סטטיסטי שמתייחס מפורשות לשאלה האם קבוצת משתנים מסויימת (למשל ה-LD50) משפרת את הידע שלנו אחרי שנעשה שימוש בקבוצה אחרת (למשל נתוני המעבדה), אלא שאותו איני יכול להפעיל בלי הנתונים הגולמיים. חבל שמאמר הסקירה אינו מתייחס לשאלה הזו.

[אגב - במספר מקומות בסקירה נאמר שהסוללה "1,9,5/16" כוללת שלושה מבחנים, ובמספר מקומות מתייחסים לארבעת המבחנים "1,9,5,16". אם מדובר אכן בשלושה מבחנים ולא ארבעה, ההסתברות המתוקנת היא 2.2 כפול עשר בחזקת מינוס 14, עדיין פחות טוב מנתוני ה- LD50].

2. כתבתי כאן ש"אם רוצים לשכנע לזנוח שיטת מחקר מסויימת, צריך להצליח יותר מן האופטימום שלה, ולא יותר מאיזשהו דחליל שאינו מייצג אותה". ואכן, החוקרים לא השתמשו ב"מגוון מינים ביולוגיים", אלא בנתוני LD50 של חולדות ועכברים בלבד. מן הראוי היה להוסיף את נתוני הרעילות במינים נוספים, כגון ארנבות, חתולים וכלבים.

3. (זו היתה שאלת הבהרה, עליה קיבלתי מענה מן הסקירה המפורטת. לא טענתי כאן ש"בחירת החומרים היתה בעייתית" - אבל אני עושה בדיוק את זה בסעיף 5).

4. שאלתי אם אפשר לחלק את החומרים למשפחות מראש, ואולי לגלות שבדיקות מעבדה באמת מצליחות טוב יותר מנתוני LD50 עבור משפחה מסויימת. למרות שרשימת החומרים נתונה (עמוד 25), אני לא יודע אם יש חלוקה טבעית כזו או לא. בכל מקרה הייתי מצפה מהחוקרים להתייחס לשאלה הזו, כי זה עלול להטות את התוצאות (בשני הכיוונים).

5. בזמן שבוחרים את החומרים, כבר ידועות התוצאה של ניסויים בבעלי-חיים עליהם. אני לא צריך להאשים אף אחד בהטיית התוצאות - על החוקרים מוטלת החובה להסביר את שיטות המחקר שלהם ולהסיר חששות כאלה. בסקירה לא הסבירו כיצד נבחרו 50 החומרים, ובוודאי שלא מוצע שום מנגנון אקראי שיבצע בחירה כזו. בכך יש פגם מתודולוגי חמור.

6. דעתי על שיפוץ רטרואקטיבי של התוצאות (בנוגע למחסום דם-מח) לא השתנתה, אבל זו לא נקודה עקרונית. (מה גם שהמידע שהושג בעניין, אחוז החומרים שעבורם רקמות אנושיות הן relevant for human acute lethal action (פסקה חמישית בעמוד 11 של הסקירה), חסר משמעות).

7. מעיון בסוללה של מבדקי המעבדה, הם אכן יכולים עקרונית לספק מידע על רעילות לאיברים ספציפיים. בסקירה אין שום מידע השוואתי בין נתונים כאלה לנתונים שיכולים להתקבל מבעלי חיים. המשפט "אחוזי האמינות עליהם מדובר כוללים גם שקלול של המידע הזה" שכתבת הוא חסר שחר. הסקירה לא נותנת אחוזי אמינות אלא מקדמי מתאם, והם לא משקללים שום דבר פרט למשתנים שתארתי בסעיף 1.

הערות נוספות:

9. המחקר הוא יחסית "עתיק". בכמה השנים האחרונות התפתח מחקר ענף בשאלה כיצד לבחור את מין החיות שעליו יבוצעו מבחני רעילות, ואיכות המידע שאפשר לקבל מהן השתפרה. אני מניח שבמקביל גם מבחני המעבדה השתפרו.

10. במחקר שותפו 39 מעבדות, ולא נערך כל תאום בקניית החומרים לערכות המעבדה (מה שיקבע את רמת הטוהר של הכימיקלים), ובפרוטוקולים, מה שכמובן מקשה על ניתוח התוצאות. הנימוק שניתן להחלטה הזו משעשע-משהו: רצו להגדיל כמה שיותר את ה-protocol diversity...

11. בעמוד 12 של הסקירה (סעיף 8.0, מסקנות), מבהירים החוקרים שהתוצאות שלהם לא יכולות להחליף את הניסויים בבעלי-חיים, שכן נתונים מבוססים על ספיגה בגוף החי עדיין אינם בנמצא. באופטימיות-משהו, הם מסבירים שמבחני ספיגה פשוטים כנראה יוכלו להשלים את החסר. לא ברור על מה החוקרים נסמכים בכך.

12. לגבי הטענה שהמחקר הרב-מרכזי הזה מוכיח את העדיפות של מבדקי מעבדה על ניסויים בבעלי חיים ובאילו אין יותר צורך, אני מפנה לעמוד 14, שבו מונים החוקרים את הדברים ש-"required to be reviewed and evaluated" לשם "complete and formal assesment of the validation status" של הסוללה המוצעת, ביחס למבחנים הסטנדרטיים. ברשימת המשימות שלהם, בראשי פרקים, יש ארבעה עמודים.

את הפסקה האחרונה שלך אני מתקשה לפענח. אני כתבתי שגם כאשר ניסויי מעבדה (כשלעצמם) יצליחו יותר מניסויים בבעלי-חיים (כשלעצמם), כמעט ודאי שהשילוב יצליח אף יותר. ובמקרה כזה, לדעתי, יהיה נכון להשתמש בשילוב הזה ולא לוותר על אף חלק שלו.
להערה הזו (המכונה "נאום סטנדרטי של אלה שלא נותנים לעובדות לבלבל אותם") אתה מגיב כך:
A. זה פשוט עצוב.
B. שיטות מבדק In Vitro מגבירות את אמינות המבדקים הפרה-קליניים.
C. (גם) זה מדגים קיבעון מחשבתי.
D. בגלל הנימוק שציינתי אין מבצעים מבדקי In Vitro כחלק מפרוטוקול המבדקים הפרה-קליניים.
E. ניסויים בבעלי-חיים הם שיטות מהמאות שעברו, שמעולם לא הוכחו מדעית ובכל-זאת נחשבות לשיא המדעיות.

התגובות האלה נראות לי לחלוטין לא רלוונטיות למה שאמרתי, ואני מרגיש צורך לסכם את הנקודה הזו שוב: לדעתי, חיפוש אלטרנטיבות הוא כיוון מדעי ראוי ואני מניח שהתוצאות ילכו וישתפרו. עם זאת, לתקווה שבסופה (הנראה לעין) של הדרך נוכל לוותר על ניסויים בבעלי-חיים אין לדעתי על מה לסמוך. זוהי, אגב, גם דעתם של כותבי הסקירה: הטבלה המוצעת בעמוד 66 צופה "Limited in vivo confirmatory acute toxicity study" בסופו של תהליך האישור של חומרים חדשים.
אם אתה מוצא את ההערה הזו לוקה בקבעון מחשבתי, אשמח לשמוע למה בדיוק.
בדיקת המתודה, כיצד? 95321
רק הערה קצרה: במקום לכתוב "2.14 כפול עשר בחזקת מינוס 17", אפשר פשוט: "2.14e-17".
בדיקת המתודה, כיצד? 95400
נכון, תודה.
ואם כבר, תיקון: בשורה הרביעית של הערה 1 צריך להיות "ארבעה משתנים", ולא "שני משתנים".
תמיר? אנו מחכים בכליון עינים 97470
בדיקת המתודה, כיצד? 97961
לתמיר כנראה נמאס או שהוא עסוק, אבל בינתיים גם אני קראתי את המאמר ולהלן הערותי.

1. מה זה משנה באיזה בטאון מדעי התפרסם המחקר ומי העורך שלו? אתה מציג את זה כאילו העובדה שהעורך הראשי ועורכי המשנה לא מקובלים עליך מסיבה כלשהי, קשורה לאמינות המחקר. העורכים של ATLA לא ביצעו את המחקר וגם לא כתבו את המאמר. המחקר נערך ע"י Scandinavian Society for Cell Toxicity בשיתוף 96 מעבדות שונות מכל רחבי העולם. האם יוזמי המחקר ו/או 96 המעבדות חשודים בעיניך באהבת חיות יתרה? האם מפתיע שעיתון העוסק בחלופות in vitro יפרסם מאמר מדעי המסכם מחקר השוואתי יסודי ומקיף בנושא יעילותן של חלופות כאלה? בקיצור, מה הבעיה?

2. כתבת שהגדרת מטרת המחקר כ- "practical and ethical" עשויה להחשיד את החוקרים בחוסר אובייקטיביות. אולי לפני שמפריחים רמיזות כאלה, כדאי לקרוא את ההגדרה המלאה של מטרות המחקר? הנה היא:

MEIC was started with two goals. The first was to investigate the relevance of results from in vitro tests for predicting the acute toxic action of chemicals in humans. The second was to establish batteries of existing in vitro toxicity tests as replacements for acute toxicity tests on animals (LD50). Achievement of the second goal, the practical and ethical one, was considered to be entirely dependent on a successful outcome of the first, scientific goal.

כלומר, לא רק שלא ציינת שההתייחסות שציטטת היתה למטרה השניה של המחקר, ולא רק ששכחת לצטט את ההדגשה המפורשת על כך שהשגת יעד זה תלויה במלואה בתוצאות המטרה הראשית (שהיא בדיקת הרלוונטיות של בדיקות רעילות in vitro ביחס להשפעת החומרים על האדם), פתאום אתה גם מתנגד לטענה ששימוש בחלופות - במידה והן יעילות מספיק - הוא מטרה פרקטית ואתית. אני מניח שלגבי היתרון הפרקטי של שימוש בחלופות לא צריך להרחיב, ולגבי האתיות, החוקרים לא טענו שום טענה אשר שונה מהותית ממה שטוען הממסד המדעי בנושא הזה (ואשר משתקפת גם בחוק הדורש שימוש בחלופות במידה והן זמינות); הם פשוט גם טרחו לעשות משהו כדי לבדוק את הנושא ולא הסתפקו בהמתנה פסיבית עד שמישהו אחר יוכיח שכדאי להשתמש בחלופות.

3. נראה שאתה מביע אכזבה מכך שהמחקר התמקד בהשוואת החלופות מול תוצאות המבדקים בחולדות ובעכברים בלבד, כאילו שהמאמר טוען במקום כלשהו שהוכחה עליונות החלופות על פני כל קומבינציה אפשרית של בעלי-חיים. בפועל, גם ההשוואה לחולדות ולעכברים היתה מטרה משנית של המחקר, אשר עסק בראש ובראשונה בהשוואת תוצאות הבדיקה באמצעות הסוללה לבין נתוני אמת על הרעלות של בני-אדם. התוצאות היו, כזכור, שהמבדק בחולדות ובעכברים נחות יותר מהמבדק באמצעות הסוללה. אתה חושב שמול מבדק בחתולים או בקומבינציה של חתולים, כלבים וסוסים יצא ההפך? אנא, קח גם אתה שבע שנים ובדוק זאת ביסודיות. לא ניתן לדרוש ממחקר אחד שיתן תשובות לכל השאלות בעולם, מה גם שאפילו המסקנות (ה"עתיקות") שלו לגבי מבדקים בחולדות ובעכברים לא בדיוק גרמו לכך שאלה יאבדו בינתיים את מעמדם כערכה הפופולרית ביותר בעולם לבדיקות רעילות.

4. אתה רומז לקיומו של קשר סמוי בין סוגי החומרים שנבחרו לבין תוצאות הניסויים בבעלי-חיים שנערכו בהם בעבר. זה לא מה שנראה מהמאמר, שבו צוין במפורש:

“Selection was based on the availability of reasonably accurate human data on acute toxicity.”

כלומר, בחירת החומרים הוכתבה מאילוצי המציאות. מכיוון שהמחקר בא לבדוק בראש ובראשונה את יעילות מבדקי in vitro מול נתוני אמת של בני אדם שהורעלו, ומכיוון שלא לגבי כל חומר ישנם נתונים כאלה, נבחרו אותם חומרים שנבחרו. האם בידיך נתוני אמת על הרעלות מחומרים נוספים, שלדעתך היו צריכים להשתתף במחקר והיו משנים את תוצאותיו? אם לא, הייתי מציע לקבל את הטענה כנכונה עד שיוכח אחרת.

5. טענתך שההחלטה להשתמש בחומרים שהגיעו מספקים שונים מקשה על ניתוח התוצאות, מתעלמת מכך שזה בדיוק מצבם של נתוני האמת. כל האנשים שהורעלו והגיעו לחדרי מיון, לא הורעלו מחומרים שסופקו להם ע"י ספק יחיד, ומבחן השוואתי ראוי לשמו לא אמור להתעלם מזה ולהשוות את המציאות לתנאי מעבדה מלאכותיים רק כדי שיהיה יותר קל לנתח את התוצאות.

6. האשמתך ב"שיפוץ רטרואקטיבי של התוצאות" (מהסיבה שלתוך תוצאות מבדקי החלופות שוקלל מרכיב המבוסס על ידע אמפירי, דבר שהעלה את הרלוונטיות שלהם מ-‏77% ל-‏83%) שוב מתייחסת לכל העניין כאל מעין תחרות ספורטיבית בין שתי מתודות שאמורות להיבחן זו מול זו "בעירום מלא". השקלול הרי לא בוצע סלקטיבית על המבדקים שנכשלו אלא על כל התוצאות של כל המבדקים, והוא מגלם בתוכו ידע מדעי לגבי הדינמיקה של מערכת אנושית חיה. השקלול הזה מהווה התייחסות מדעית לטענה הלא-מאד-מדעית שבדיקות רעילות אמינות חייבות להתבצע על גוף חי שלם, וכל עוד הוא מופעל באופן גלובלי על כל המבדקים, תהא התוצאה אשר תהא, אין לדעתי סיבה להניח שמדובר בשיפוץ רטרואקטיבי של התוצאות אלא בשיפור המודל הלא-חייתי תוך שימוש לגיטימי בידע מדעי גלוי.

היו לי עוד כמה הערות לגבי טענותיך, אך בינתיים אני אסתפק באלה ואעבור למשהו יותר אישי לגבי הקבעון המחשבתי. הסגנון של הודעתך, יותר מהחלקים הענייניים שהיו בה, משדר קבעון כזה לכל אורך הדרך. זה מתחיל מרמיזות לא מבוססות על מפוקפקותם של עורכי המחקר, ממשיך ברמיזות לא מבוססות על הדרך המפוקפקת שבה נבחרו החומרים למבדק, עובר דרך טענות לא מבוססות על שקלול מפוקפק של התוצאות (כביכול כדי לשפרן באופן מלאכותי), מודיע שבמחקר יש "המון כשלים מתודיים" עוד לפני שקראת את המאמר, מייחס לחוקרים "אופטימיות-משהו" ומאשימם בשימוש בנימוקים משעשעים-משהו (בלי להתייחס להסברים הענייניים אשר הופיעו במאמר), משתמש בחדווה במסקנת החוקרים שגם בתום המחקר הספציפי הזה ייתכנו סיטואציות בהן יהיה צורך במבדקי in vivo לאחר שקטלת הן את יושרם והן את אמינות מחקרם כמה וכמה פעמים, ומסתייג מכל מיני "נימוקים מוסריים" ו"לחץ חיצוני" למרות שאלה כלל לא הוצעו. בין לבין, מפוזרות בדבריך שלל אמירות מוחלטות כגון "לתקווה שבסופה (הנראה לעין) של הדרך נוכל לוותר על ניסויים בבעלי-חיים אין לדעתי על מה לסמוך", "חלומות באספמיא", "כל התקוות הגדולות שתולים באלטרנטיביות נדונות לדעתי לכשלון", וכמובן פסק הדין: "גישת ה"אלטרנטיבות" תצליח רק אם בדרך-פלא מבדקי מעבדה יצליחו כל-כך עד שניסוי בבעלי-חיים יהפוך למיותר".

לאור חוסר האמון העמוק שלך בשיטה, חוסר אמון שאותו טרחת להבהיר בכל כך הרבה מקומות, האיחול "הלוואי שתצליחו" נשמע כמו לגלוג או לכל היותר כמס שפתיים. מהלהט שבו אתה מציג את שלל ה"פגמים" שכביכול מצאת במחקר המקיף הזה, נוצר הרושם שזה לא ממש משנה איזה מחקר יוצג בפניך - אם הוא בעד שימוש בחלופות, אתה כבר תמצא איך לקטול אותו. המחקר המינימלי שאתה וטלי תסכימו לקבל יהיה חייב להראות מקדם מתאם של מובהקות מושלמת בין המודל לבין האדם, הוא יהיה חייב לספק נתונים השוואתיים מלאים של יעילות מודל מסוים מול כל קומבינציה אפשרית של בעלי-חיים, אסור יהיה לו לנסות קומבינציות שונות של חלופות ולבחור מתוכן את הקומבינציה הטובה ביותר כי זה לא הוגן, הוא יהיה חייב כמובן לספק "דרך הילוכו" גם תשובות מלאות לשאלות נוספות מלבד שאלת הרעילות הבסיסית, ובנוסף לכל אלה, הוא גם יצטרך להתבצע ע"י גוף שאינו עוסק בחקר חלופות ולהתפרסם בעיתון שאינו עוסק בחקר חלופות. האם לגבי מבדקים בבעלי-חיים ראיתם פעם מחקר שעונה על כל התנאים הללו? האם ראיתם ולו מחקר השוואתי אחד בין מבדקים בבעלי-חיים לבין נתוני אמת מבני-אדם, שבו הוכח ביניהם מתאם שיבסס את האמון העיוור שלכם במתודה הזו? מדוע אתם מתייחסים למבדקים בבעלי-חיים כאל מדע מוצק ואמין בלי שיהיה לכך בסיס מדעי, ודווקא מול המודלים המודרניים והמדויקים יותר אתם מערימים כל כך הרבה קשיים? חשוב רגע ברצינות: האם כל דרך התנהלותכם בתת-הדיון הזה לא מעידה על קבעון מחשבתי?
בדיקת המתודה, כיצד? 98071
חבל שתמיר נוטש בדיוק עכשיו, כי המאמר הזה, שאליו הוא הפנה מספר פעמים, עושה שני דברים חשובים:
* הוא מוכיח את הטענה-הבלתי-מדעית-והלא-מוכחת שניסויי רעילות בבעלי חיים נותנים חיזוי מצוין לתוצאות בבני אדם.
* בהשוואה בין האלטרנטיבות המעבדתיות לבין תוצאות ממבחנים בבעלי-חיים, הוא מוצא יתרון (קל) דוקא לשיטה השניה (ראה הערה 1 שלי).

1+2. ההבדל בין תגובה באייל לבין מאמר מדעי הוא בזה שהמאמר עבר ביקורת עמיתים, ושיפוט של עורך. עורכי ה- ATLA אינם צריכים להיות "לא מקובלים עלי", אלא חסרי פניות, ויש לי סיבה טובה לחשוב שזה לא כך (מקום עבודתם, למשל). לו אני הייתי referee של המאמר הזה, הייתי ממליץ על תיקונים רבים לפני הפרסום; אולי זה בדיוק מה שקרה, והעורך החליט שהמאמר חשוב מכדי שיעכבו אותו?

דעותיהם הפרטיות של החוקרים על החשיבות האתית של הצלחת הניסוי, לא היו צריכות למצוא את דרכן למאמר.

בכל מקרה, האמינות של החוקרים או העורכים אינה הנושא המרכזי. התוצאות עצמן רחוקות מלהוכיח את מה שתמיר חזר וטען.

3. המאמר לא טען שהוכחה עליונות החלופות על פני כל קומבינציה אפשרית של בעלי-חיים, וזה בהחלט יכול לחכות למחקרים נוספים. הנקודה היא שעד שיבצעו את אותם מחקרים נוספים, אי אפשר להסיק שהאלטרנטיבות מצליחות יותר.
למרות זאת, לאחר שהושקע מאמץ גדול כל-כך בבדיקת תוצאות המעבדה, אפשר היה לאסוף יותר מידע על ניסויים קיים בבעלי-חיים, כפי שעשו לגבי חולדות ועכברים.

התוצאות *לא הראו* עדיפות לבדיקות המעבדה. זהו יתרון סטטיסטי שנובע מהשימוש ביותר משתנים מסבירים במקרה הזה!

בהחלט יתכן שמבדק בקומבינציה של עכברים וחולדות, וגם חתולים, כלבים וסוסים יתן תוצאות עוד יותר טובות. מי שרוצה לשכנע אותי לנטוש את השיטה הזאת ולעבור לאלטרנטיבות, מוזמן ללקט את הנתונים, לנתח ולפרסם אותם.

המסקנות של המחקר רק מאשרות שבדיקות בחולדות ועכברים הן בעלות אמינות רבה, וכדי להראות שסוללת מבחנים מסויימת מצליחה יותר יש לבדוק זאת בחומרים נוספים (מפני שאת *מקדמי* השקלול קבענו באופן שיתאים אופטימלית ל-‏50 החומרים הראשונים; את המקדמים האלה יש לבדוק במחקר נפרד).

4. אני לא רומז, אלא אומר במפורש שהחוקרים היו צריכים להסביר את השיטה שבה נבחרו (בדיוק) 50 החומרים.
יכולתי להציע כמה סכמות אחרות (מומחים בלתי תלויים ירכיבו את הרשימה; 50 החומרים הנפוצים ביותר בהרעלות; בחירה באקראי מרשימת 1000 הכימיקלים של איזשהו textbook בכימיה; כל החומרים שפורסמו עליהם נתונים משנת 1992 עד 1994 בעיתון מסויים) - אבל המאמר מסתפק בSelection was based on the availability of reasonably accurate human data on acute toxicity, וזה לא מסביר כלום.

"האם בידיך נתוני אמת על הרעלות מחומרים נוספים, שלדעתך היו צריכים להשתתף במחקר והיו משנים את תוצאותיו? אם לא, הייתי מציע לקבל את הטענה כנכונה עד שיוכח אחרת" - אני מצטער מאד, אבל לא כך עובדים. את האמינות של מחקר צריך לבנות (על-ידי סתימת כל הפרצות שאני מצביע עליהן), והמבקר אינו צריך לערוך מחקר שיפריך את התוצאות כדי להצביע על בעיות.

5. אני מקבל את ההסבר שהבחירה בספקים שונים נותנת אומד טוב יותר לתוצאות במקרה של הרעלה (ההסבר הזה לא מופיע במאמר).

6. זו לא תחרות עם דרישה ל"הגינות" אלא מחקר, ואני רוצה להסביר שוב את ההבדל. בפשטנות מסוימת, מדובר כאן על השוואה בין שתי שיטות (בדיקות מעבדה מול ניסויים בבעלי-חיים). אם היו קובעים את הנוסחה המדויקת למבחני המעבדה *מראש* (ואין זה משנה כיצד, או בכמה ידע ובאיזו מידה של תחכום מדעי היא משתמשת) - ההשוואה היתה במקום. אבל כאן בחרו את פרטי השיטה (שלושת או ארבעת החומרים בסוללה, ו*מקדמי השקלול* שלהם) בדיעבד - וזה כבר לא אותו דבר.

מבחינת המטרה המרכזית של המחקר - לבנות סוללת מבחני מעבדה - זה בדיוק מה שהיו צריכים לעשות. ככל הידוע לנו (ובהנחה שהחומרים נבחרו באופן אקראי (ובגלל זה נקודה 4 חשובה)), המדד הטוב ביותר לרעילות של החומר ה-‏51 (בהסתמך על מבדקי מעבדה בלבד), יהיה לפי המקדמים שנמצאו במחקר הזה.
המקדמים נקבעים *לפי התוצאות שנאספו*, ולא מראש. אין כאן בעיה של "זיוף תוצאות"; מההיבט של חיזוי רעילות, זו הגישה הנכונה.

אבל המטרה השניה, השוואה לנתונים מבעלי חיים, הוחמצה לחלוטין. כדי להראות ששיטה אחת עדיפה על אחרת, לא מספיק להראות שאחוז השונות המוסבר בשיטה הראשונה גדול מאשר בשניה (כי באחת יש כמה עשרות משתנים מסבירים ומהם נבחרו ארבעה, ובשניה יש רק שניים).
יש שתי דרכים להשוות את השיטות: אחת, להפעיל מבחנים סטיסטיים מסויימים על הנתונים הגולמיים שנאספו כאן (וזה לא נעשה). השניה, לאחר שהמקדמים של ניסויי המעבדה נקבעו, וכל האלגוריתמים המדעיים לשיפור התוצאות נקבעו, יש לאסוף חומרים חדשים, ולהשוות את מידת ההצלחה עליהם.

ובענין הסגנון שלי:
- הטענות שלי על אמינות עורכי העיתון אינן "בלתי מבוססות", ועם זאת אפילו במקום אחד לא פטרתי את המחקר ב"אני לא מאמין להם". כל ההערות שלי הן לגופו של המחקר.
- דרך בחירת החומרים באמת מפוקפקת, ונטל ההוכחה הוא על כותבי המאמר.
- התוצאות באמת שופרו באופן מלאכותי. זה בסדר גמור אם רוצים לבנות סוללה אופטימלית של בדיקות, ופסול לחלוטין אם רוצים לשכנע בעדיפות של הבדיקות האלה על שיטות אחרות.
- במחקר יש המון כשלים מתודיים, והתייחסתי אליהם בהרחבה.
- החוקרים מקווים שיהיו מודלים להסבר הספיגה בגוף החי (וזו אחת הבעיות העיקריות בכל חלופה אפשרית לניסויים בבעלי-חיים) - ולפטור בעיה מרכזית כזו בתקוה מעורפלת, זו באמת אופטימיות.
- המלים "לחץ חיצוני" התייחסו לזה שאני חושב שתמיר חושב שצריך להפעיל על חוקרים כדי שישתמשו בחלופות. אני חושב שאסור. אם גם תמיר חושב כך, אז יופי.
- החוקרים לא מציעים המשך השימוש במבחני in vivo לאחר החקר שלהם בלבד, אלא גם כשיטה עתידית (עמוד 66 בסקירה). זו גישה מציאותית יותר מזו שתמיר מציג, ואם זו היתה עמדתו הייתי מתייחס אליה אחרת. נחזור לזה בהמשך. אני לא מסתמך עליהם (אחרי ש"קטלתי את יושרם"), אלא מציין שבמסקנות שתמיר ניסה לגזור מהתוצאות שלהם, אפילו הם לא תומכים.

אני חוזר על כל האמירות המוחלטות שלי שאתה מצטט:
לתקווה שבסופה (הנראה לעין) של הדרך נוכל לוותר על ניסויים בבעלי-חיים אין לדעתי על מה לסמוך.
אם אתה מצפה שבסוף בדיקות המעבדה יזנקו לניסויים בחולים בגלל שתהיה להן אמינות כל-כך גבוהה עד שהניסויים בבעלי-חיים יהפכו למיותרים, אלו נראים לי חלומות באספמיא.

התקוות הגדולות (שנדונות לדעתי לכשלון) הן שאלטרנטיבות יוחלו *להחליף* את השימוש במודל החייתי. אם זו המטרה, אז גישת האלטרנטיבות תצליח רק אם בדרך-פלא מבדקי מעבדה יצליחו כל-כך עד שניסוי בבעלי-חיים יהפוך למיותר. מה לא ברור ב"פסק הדין" הזה?

באשר לפסקה האחרונה, צריך להבחין בין שימוש בחלופות כדי להפחית את מספר הניסויים בבעלי חיים (ולשפר את התוצאות!), לבין חלופות (במשמעות הרגילה של המלה) - במקום ניסויים בבעלי חיים.
ההצעה הראשונה היא חיובית מכל בחינה, ואני תומך בה בלי טיפת ציניות. הלהט שלי כולו מוקדש למאבק בגישה השניה. ואכן, המאמר אינו מוכיח שניסויי מעבדה יתנו תוצאות טובות יותר מניסויים בבעלי חיים.

כדי להוכיח שמבחני מעבדה, או מודלים ממוחשבים, או כל דבר אחר *משפר* את הידע שלנו, מספיק מאמץ די קטן. כדי להוכיח שכל החלופות האלו מספיקות כדי שאפשר יהיה לוותר על ניסויים, צריך להוכיח משהו שהוא באמת לדעתי כמעט בלתי אפשרי (ומכאן הפסימיות שלי): שהמידע הנוסף הנאסף בדרך הזו הוא זניח.

מחקר שיוכיח את הטענה הזו צריך להראות מתאם מובהק (לאו דוקא "מושלם") בין המודל לבין האדם, לספק נתונים השוואתיים מלאים של יעילות מודל מסוים מול כל קומבינציה (רלוונטית, לאו דוקא "אפשרית") של בעלי-חיים, אסור יהיה לו לנסות קומבינציות שונות של חלופות ולבחור מתוכן את הקומבינציה הטובה ביותר (אלא אם כן *זה נעשה מראש*, ולא בהסתמך על נתוני הניסוי; לא "כי זה לא הוגן", אלא כי זה לא יוכיח את הטענה הנכונה).

מחקר שיטען להחלפה מושלמת של השיטה הנוכחית, יצטרך לספק גם תשובות מלאות לשאלות נוספות מלבד שאלת הרעילות הבסיסית, מכיוון שניסויים בבעלי-חיים נותנים את התשובות האלה.

"האם ראיתם ולו מחקר השוואתי אחד בין מבדקים בבעלי-חיים לבין נתוני אמת מבני-אדם, שבו הוכח ביניהם מתאם שיבסס את האמון העיוור שלכם במתודה הזו?" - בהחלט. המחקר שתמיר הביא מוכיח את המתודה הזו; מקדם המתאם שהוא נותן בין ניסויים בחולדות ועכברים לבין הנתונים מבני-אדם הוא בעל מובהקות של 3e-17.

מדוע "דווקא מול המודלים המודרניים והמדויקים יותר אתם מערימים קשיים?" - לא בגלל שמשהו לא בסדר איתם. אתם מנסים לכפות את המודלים האלה במקום השיטה אחרת, והבעיה היא אתכם, לא איתם.
בדיקת המתודה, כיצד? 106275
תמיר, אם אתה עסוק, האם תוכל לענות רק לפסקה הראשונה בדבריו של עוזי? טענותיו נשמעות חזקות, וחבל יהיה אם יישארו ללא מענה. כוונתי בעיקר לטענה שדווקא הניסויים בבעלי החיים השיגו יתרון זעיר על הניסויים בחלופה.
בדיקת המתודה, כיצד? 106277
היתרון של נתונים מן החי על פני נתוני המעבדה הוא לא הרבה מעבר לקוריוז מספרי (ראה הערה 1 בתגובה 94629; בשורה השלישית מסוף ההערה צריך להיות "ארבעה משתנים מסבירים" ולא שנים), ותגובה 94623, בעיקר הערה ‏3.

המחקר מוכיח שאפשר לחזות נתוני רעילות בבני אדם לפי נתוני הרעילות בעכברים ובחולדות; ושאפשר לחזות את אותם נתונים לפי בדיקות מעבדה. החיזוי במקרה השני נראה טוב יותר, אלא שזה כך רק בגלל שהשתמשו ביותר נתוני מעבדה מאשר נתוני ניסויים בבעלי חיים (ובענין זה, ראה שלוש הפסקאות של הערה 6 בתגובה 98071).
אם ימחקו את הודעת ההקפצה הזו, האם עדיין ישאר הדיון במעלה הרשימה? 149321
אם ימחקו את הודעת ההקפצה הזו, האם עדיין ישאר הדיון במעלה הרשימה? 149326
לא, הדיון ''יחזור למקומו''. להבא, אבקש להפנות אלי שאלות כאלה בדואל ולא להטריד את קהל הקוראים כולו. תודה.
תיקון לינק 94149

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים