top of page

בעידן הממוחשב של ימינו, באופן כמעט גורף מתבצע איסוף נתונים. בין אם המטרה היא לפתח תרופה על סמך נתונים פיזיולוגיים, או לחסוך בעלויות שינוע של מפעל בגדים - איסוף, ניתוח והטמעה של הנתונים הוא קריטי.

איך מתכננים ניסוי?

משתנה איכותי? משתנה כמותי? הכל עניין של גישה.

ניקח לדוגמא את מנגנון התורשה הגנטי של צבע העיניים בבני אדם:

במחקר שפורסם ב2009 ופורסם בCurrent Biology, נבחנה אוכלוסיה הולנדית (n=6168) במטרה למצוא סמני DNA שיוכלו לחזות האם צבע העיניים יהיה חום או כחול. החוקרים מצאו 24 סמני DNA, ובנו באמצעותם מודל מולטי-נומינלי לרגרסיה לוגיסטית, ועל סמך התוצאות שלו הגיעו לדיוק של 93%-91%. 

במחקר נוסף שפורסם ב2013, החוקרים צילמו את רשתית העין בקרב אוכלוסיה הולנדית (n=5,951), וניתחו את התמונות באמצעות תוכנת מחשב, אשר מודדת את צבע העין בRGB. מודל כמותי לניתוח צבע העיניים הצליח להסביר מעל 50% מהשונות בתכונה. 

מה ההבדל?

הקבוצה הראשונה התייחסה לצבע העיניים בתור נתון איכותי (חום/כחול). אסטרטגיה זו נפוצה בקרב מחקרים א-פרמטריים, שבהם הנתונים לא מתפלגים נורמלית (זכר\נקבה, חי\מת, גבוה\נמוך וכו'...). איסוף הנתונים במחקרים מסוג זה הוא מהיר יותר אך מאפשר רזולוצית ניתוח נמוכה יותר עם מרווח טעות גדול יותר. 

הקבוצה השנייה, התייחסה לצבע העיניים בתור נתון כמותי (R=213, G=65, B=122). מחקרים מסוג זה מצריכים איסוף נתונים מאסיבי (Big Data) מכיוון שבדר"כ לא ידועים לנו האפקטורים הרלוונטיים, או מה הגבולות שלהם.

לסיכום

2 הקבוצות הצליחו למצוא הסבר ומגנון ביולוגי שמסביר את צבע העיניים, אך ברזולוציות שונות. בעוד הקבוצה הראשונה הסבירה האם העין חומה או כחולה, הקבוצה השנייה הצליחה למצוא גורמים גנטיים בקרב הקבוצה בעלת העיניים הכחולות, שאחראים על גוון "כחוליות" העין. 

איסוף הנתונים, משך המחקר, כח העבודה והעלות היו גבוהים בהרבה במחקר של הקבוצה השנייה. 

לסיכום, הכל תלוי בהגדרת יעדים בתחילת הפרוייקט ותכנון נכון בהתאם למגבלות ולדרישות.

About & Subscribe
:בין לקוחותינו
Watermark_edited.png
TAU_edited.png
cures_edited.png
huji_edited.png
belinson_edited.png
1920px-Barzilai_edited.png
metzuyanut.png
rambam_edited.png
bottom of page