ספק סביר #119 – בינה מלאכותית, תחליף אנטיביוטיקה ועל מוליכים
ספק סביר – תוכנית #119 – הוקלטה ב-15/09/2012
הורדה למחשב: לחצו כאן.
לכל מי שרשום לערוץ העדכונים של הפודקאסט "ספק סביר Enhanced" – הוא מת ולא יתעדכן. הרשמו ללינק החדש – "ספק סביר" באמצעות iTunes או בכל אמצעי אחר.
פירוט התוכנית:
00:00 – הקדמה
00:55 – גישה חדשה ללחימה בבקטריות
1. ההודעה לעיתונות מהכנס המקצועי.
2. הפטנט הרלוונטי, והפטנטים הקודמים בנושא, עם שאר הצוות.
14:45 – זיהוי אוטומטי של ציורים אבסטרקטים
38:15 – על מוליך בטמפרטורת החדר?
47:30 – מבזקים
53:15 – איפה טעינו
54:50 – ספק סביר
1. ניתן לקרר מים להרבה פחות מ-0 מעלות מבלי שהם יקפאו, בלי לשחק עם הלחץ, הסביבה או להוסיף להם מומסים
2. כשמנסים למדוד במדוייק את המשקל הסגולי של מים, בקרוב ל-0 המוחלט, מגלים שהנוסחה הכימית שלהם שונה מ-h2o
3. בתנאים מסויימים (אך יומיומיים) מים חמים קופאים מהר יותר ממים קרים
עקיבא הגריל כי #1 הוא שקר
1. אכן כן.
2. לא, אבל משהו מוזר אחר קורה.
3. בהחלט, וגם הסיפור מאחורי העניין די מעניין.
להורדות אוטומטיות של פרקים חדשים – ביצוע מנוי לספק סביר
-
היה פרק מעניין ומגוון!
לגבי העמידות לאנטיביוטיקה, לכל החיידקים אין גרעין תא, והדרך בה הם מעבירים דנ"א אחד לשני היא ע"י פלסמידים שהם דנ"א מעגלי קטן בנוסף לדנ"א העיקרי המופיעים במס' עותקים בחיידקים. חלק מהפלסמידים מכילים גם את המידע ליצירת צינור הנקרא פיליי שמשמש כ"איבר המין" להעברת הפלסמיד מחיידק לחיידק.
-
מספרים, רבותיי, מספרים (אתר של אוני' הרווארד לגבי מספרים ביולוגיים):
http://bionumbers.hms.harvard.edu/ -
#4 נכתב על ידי August לפני 9 שנים
קודם כל, מצטרף להערה שהיה פרק מעניין.
רציתי לומר כמה דברים לגבי האייטם על זיהוי אוטומטי של ציורים:
1. ממש לא מסכים עם ברק שהדרך להגיע לתבונה אנושית היא דרך מציאת אלגוריתמים מוחלטים ולא דרך שיטות סטטיסטיות. ברוב סוגי הבעיות, המוח האנושי עובד בשיטות שהרבה יותר דומות לשיטות סטטיסטיות (נסיון לשקלל סטטיסטית כמות עצומה של דוגמאות שראינו בעבר) מאשר באלגוריתמים. במובן מסויים, כמו שמחשב יודע להפעיל אלגוריתמים בקלות ומתאמץ מאוד לעשות דברים מעורפלים וסטטיסטיים, בני אדם עושים דברים סטטיסטיים (כמו זיהוי דיבור, זיהוי תמונות, זיהוי אובייקטים) בקלות ומתקשים באלגוריתמים. כך, גם אם המחשב הטוב ביותר בקושי מנצח את האדם הטוב ביותר במטלות מובנות מאוד כמו שח מט ובטריוויה (ובטריוויה הבעיה היא בעיקר להבין את השאלה), מחשב ממוצע ינצח את האדם הממוצע במטלות כאלו בקלות, שלא לדבר על דברים עוד יותר אלגוריתמיים כמו חישובים מתמטיים. הבעיה של מחשבים היא יותר בדברים סטטיסטיים כמו מה שציינתי קודם (שלרוב מתחילים במילה "זיהוי").
כשאנשים מנסים לזהות תמונה, יש הרבה ראיות שמצביעות על כך שמה שהם למעשה עושים הוא להשוות את הקלט בצורה מורכבת לארכיטיפים של קטגוריות מסויימות (לכלב יש פרווה, ארבע רגליים, זנב…), השוואה שהיא מספיק מתוחכמת כדי לזהות נכון כלב עם שלוש רגליים, כלב רובוטי, כלב מצוייר מול תצלום של כלב, כלב מכל מיני זוויות, אדם עם ראש כלב, צללית של כלב, הרלוונטיות של כלב כמטאפורה בנושא כביכול לא קשור (נניח הביטוי "התכלב" במשמעות של חסך כסף ע"י הורדת איכות החיים שלמיטב ידיעתי נכנס לשפה רק בשנים האחרונות) ועוד. למעשה, ייתכן מאוד שניסויון לזיהוי אלגוריתמי חד כפי שהוצע בתכנית היה מפספס הרבה מהדברים האלו שבני אדם היו מסכימים בקלות שהם רלוונטיים למילה "כלב".2. הנקודה השנייה היא לגבי הflimsyיות של המחקר. בסופו של דבר זה מחקר במדעי המחשב, ולמרות שלא הגדרתם באופן ברור מה הקריטריונים שבעיניכם גורמים לו להיות flimsy, התחושה שלי היא שאמרתם זאת כי לא ברור שיש פה יכולת זיהוי מספיק טובה, ובפרט שאולי בגוגל עושים את זה טוב יותר. אבל אלו לא בהכרח הקריטריונים שבהם נמדדת הצלחה מדעית בתחום הזה.
בגדול, הקונספט של "ניקח הרבה דוגמאות, נתן למחשב ללמוד אותן ואז הוא יזהה דוגמאות אחרות" הוא לא מהפכני, אבל זה פחות או יותר שקול ללהגיד "נזריק לבן אדם חומר שיהרוג חיידקים וזה ירפא אותו ממחלה". הדבר המעניין הוא איך בדיוק המחשב לומד, ועד כמה שהצלחתי להבין הם השתמשו באלגוריתם (שעליו אינני יודע כלום) שנקרא SVM (Support vector machine). אני לא מכיר את האלגוריתם או את היישום שלהם, אבל התחושה שלי היא שגם אתם לא ממש, ולכן אני אסתפק בלציין כמה דברים שאולי הם עשו שמהווים התקדמות מדעית ואינם קשורים לרמה אבסולוטית של אחוזי הצלחה:
1. יישמו אלגוריתם קיים (SVM) במצב חדש – זה לא ממש מרגש, אבל חוקרים עושים גם את זה.
2. אולי הם שכללו את האלגוריתם. גם אם יסתבר שזה לא מגיע להישגים גבוהים עם תמונות, זה יכול לעזור במקומות אחרים.
3. אולי הם הראו שהאלגוריתם הזה טוב יותר מאלגוריתמי למידה אחרים בתחום זיהוי התמונות.
4. אולי הם הראו שהאלגוריתם מגיע לתוצאות טובות מהר יותר או עם פחות נתונים ראשוניים מאלגוריתמים אחרים, גם אם אלגוריתמים אחרים טובים יותר.
5. משהו שהם עשו בוודאות – בנו מאגר תמונות ששוחרר לציבור. המאגר הזה יוכל לשמש בעתיד חוקרים שינסו אלגוריתמי למידה שונים (במובן מסויים, זה מקביל מבחנית הרעיון – גם אם לא מבחינת החשיבות – למיפוי הגנום האנושי, עבודת נמלים שאין בה עצמה חידוש תיאורטי אך תוביל לחידושים בעתיד)TL;DR – תכנית מצויינת, אלגוריתמי זיהוי סטטיסטיים דומים יותר לאיך שאנשים חושבים מאשר אלגוריתמים חדים ועקביים, מחקר במדעי המחשב יכול להיות מחקר איכותי גם אם לא הוביל לביצוע מוצלח במיוחד של מטלה כלשהיא
-
היי בנאדם, נחמד לשמוע ממך.
1. אני לא חושב שהדרך להגיע לתבונה אנושית הינה רק דרך אלגוריטמים. אגב, אני כנראה מתכוון להגדרת פונקציות או מציאת חוקיות. למעשה אני חושב ששילוב בין היה שתי הרבה יותר ריאלים. יתרה מזו, מה שאתה מתאר כ "להשוות את הקלט בצורה מורכבת לארכיטיפים של קטגוריות " זה בדיוק זה. כיצד מוגדרים הארכיטיפים והקטגוריות למחשב?
"(ובטריוויה הבעיה היא בעיקר להבין את השאלה)", אני רואה את הטענה הזו מועלת פעמים רבות בקשר להישגיו של ווטסון אך לפי מיטב הבנתי הוא פעל בדיוק כמו גגוגל טראנסלייט – מצא את הפיקסלים התואמים במאגר השאלות ואת הפיקסלים שנותים להופיע אחריהם במאגר התשובות. תוצאות מרשימות כל עוד מגבילים את מבנה השאלות. מישהו יכול לעזור לי מאיפה הרעיון שווטסון עושה משהו ייחודי המתעלה על כך מגיע?
2. לא יודע על זה כלום. אולי ירון ידע?
ביי ביי -
#6 נכתב על ידי August לפני 9 שנים
אני אתייחס לזה מהזווית של למידה בעזרת רשתות נוירונים כי אותה אני מכיר טיפ טיפה ואת שאר שיטות הלמידה הממוחשבת אני לא מכיר בכלל. אני מניח שיש מרכיבים מקבילים בשיטות למידה ממוחשבת אחרות.
1. "כיצד מוגדרים הארכיטיפים והקטגוריות למחשב" – ובכן, המחשב לומד אותם לבד מתוך הנתונים בצורה סטטיסטית. המחשב מקבל קלט באופן שבני אדם נוהגים לסדר (פיקסלים של תמונות) ומתבקש לתת פלט בצורת קטגוריות שבני אדם מבקשים (במקרה שלנו – לבחור אחת מרשימה של 250 קטגוריות). מה שקורה בין הקלט והפלט ניתן ללמידה – כאשר במהלך שלב הלמידה המחשב "ילמד" על מה כדאי לו להסתכל. תוך כדי הלמידה המחשב יבין שכדאי לו לשאול את השאלה "האם יש כאן זנב קטן?" ואז עם הזמן (ברשת נוירונים) יווצר נוירון שמחזיר 1 אם יש זנב קטן ו0 אם אין. הנוירון הזה ישפיע בצורה הסתברותית – הוא יעלה את הסיכוי לבחור "כלב" אבל לא יהיה חוק שאומר "זנב+4 רגליים כלב", למשל כי אם יהיה זנב, 4 רגליים אבל עם שפם ארוך וצד עכברים, אולי זה יהיה דווקא חתול. לעומת זאת אם המידע היחיד יהיה זנב ו4 רגליים אולי זה כן יסווג ככלב כי חתולים יותר נדירים מכלבים במדגם. בקיצור, הסתברותי. גם כדי לזהות "זנב קטן" יהיו שלבים קודמים – יהיה נוירון שמזהה "עיקול" ואז הנוירון הזה בצירוף עם תוצאות של נוירונים אחרים יובילו למסקנה שיש "זנב קטן".
בקיצור, אפשר לקרוא לזה אלגוריתם, אבל יש פה הרבה עניין הסתברותי. והכל נלמד אוטומטית מתוך הקלט עם מגבלות ראשוניות בלבד – בדומה לאיך שאנשים חושבים ולומדים. אני מציע למי שקוראת לחשוב אם היא יכולה להגדיר לעצמה את האלגוריתם לפיו היא עצמה מבדילה בין כלב לחתול.
יש יוצא דופן אחד – כשרוצים שמחשבים יעשו משהו שבני אדם כבר יודעים לעשות, לפעמים מאכילים אותם קצת בכפית, למשל אפשר היה לומר למחשב מראש שהתכונה "ארבע רגליים" היא מעניינת. לרוב עדיף למידה אוטומטית כי זה יוצא יותר מדוייק מאינטואיציה אנושית לגבי מה חשוב לדעת.לגבי הייחודיות של ווטסון – למיטב הבנתי הוא פועל באופן דומה – הוא לא זוכר בע"פ צמדים של שאלות ותשובות אלא הוא ניתח מתוך צמדים רבים של שאלות ותשובות מאפיינים שמאפשרים לו לענות על שאלות חדשות. למשל יכול להיות שהוא יודע לענות על "מי היה הנשיא ב – 1946", "מי היה ראש הממשלה בתשע"ב", ו"בזמן משבר הטילים בקובה מי היה המנהיג של בית המועצות" כי הוא יודע לזהות שמדובר בשאלת "מי", עם מרכיב זמן שהוא מפענח בנפרד (למשל – מחליף "משבר הטילים בקובה" לשנה מסויימת) ויודע לזהות "תפקיד", אבל אם הוא אכן השתמש באלגוריתם למידה מהסוג שאני מדבר עליו, אז כל אלו הוא למד לבד, בלי שיתכנתו אותו מראש שיש כמה סוגי שאלות ודרכים לפתור אותן. הסיבה שאני אומר שהקושי הוא להבין את השאלה היא שקל מאוד לכתוב תכנית מחשב שבשילוב מאגר מידע תדע לשלוף מי היה המנהיג של מדינה X בשנה , Y ותהיה טובה יותר מכל בן אדם. הייחודיות של ווטסון היא בהבנת סוגים רבים של שאלות בשפה חפשית והמרתם לצורה לוגית שהוא יכול לשלוף ממאגר המידע שלו בקלות.
אגב, כמובן שאלגוריתמי הלמידה האלו מאוד מורכבים ומתחלקים לתת סוגים רבים, כך שלא כל אחד שהיה אומר "בואו ניישם את האלגוריתם על טריוויה" היה מצליח להוציא את ווטסון. -
#8 נכתב על ידי August לפני 9 שנים
לא ממש הצלחתי למצוא לינק שמסביר את אופן הפעולה המדוייק, הם כנראה קצת מסתירים אותו. אבל הנה חלק מהFAQ של IBM בעניין (they זה מערכות כמו ווטסון לצורך העניין):
While they may not be able to formally prove an answer is correct in purely logical terms, they can build confidence based on a combination of reasoning methods that operate directly on a combination of the raw natural language, automatically extracted entities, relations and available structured and semi-structured knowledge available from for example the Semantic Web.
בגדול הם אומרים שהוא משתמש בקשת רחבה של טכניקות לעיבוד שפה, למידת מכונה ועוד, אבל שהכל קשור להסקה סטטיסטית ולא לפורמולציה מדוייקת (לינק מלא ל – FAQ – http://www.research.ibm.com/deepqa/faq.shtml)בשביל באמת להבין איך הדברים עובדים (לפחות ברשתות נוירונים), אפשר למשל לקרוא בדף הזה http://en.wikiversity.org/wiki/Learning_and_neural_networks אבל זו לא קריאה פשוטה.
-
יו יו יא אוגוסט.
אוקיי. עברו שבועיים והשקעתי יותר מדי זמן בדבר הזה. כתבתי כמה ורסיות המתארות את אופן הפעולה של ווטסון למול דיפ-בלו ומה זה מייצג ואיך זה קשור לעתידה של בינה מלאכותית, אבל בסופו של דבר הגעתי למסקנה שדעתי נובעת יותר מרגש מאשר היגיון הרמטי. אין ספק שתכנות סטטיסטי קידם אותנו וימשיך לעשות זאת. בשלב זה, הדיון סובב בעיקר סביב כמה ואיך. אני רק רוצה להתייחס בקצרה* לאנלוגיית המוח שתיארת. התיאורים שנתת לאיך אנו מבצעים פעולות סטטיסטיות בדומה למחשב כזה או אחר נכונות (בעיקר) אם אנו מדברים על תהליך למידה. ואכן תכנות סטטסטי במכונות לומדות זה א' ב'. לעומת זאת לאחר שלמדנו, יש קיבוע של אסוציאציות מסויומות, כך כאשר אנו נדרשים להבין משפט אין אנו מריצים את כל האסוסיאציות האפשריות ובוחרים לבסוף את ההכי סבירה (דרך פעולתו של ווטסון) אלא שהערוץ שהתקבע אצלנו בעקבות הניסיון נכנס לפעולה ואנו "מבינים" את הכוונה. לאחר מכן יש אולי עוד פעם התעסקות ססטטיסטית כאשר אנו מנסים לשלוף משהו מהזיכרון או כאשר איננו יודעים את התשובה ועלינו להמר. אך אלו אינם תחומי ההצתיינות שלנו.
יעילותנו מול מחשב כמו ווטסון אינה טמונה בכוח המיחשוב המאסיבי שלנו, המאפשר לנו לאוץ על טריליונים של אסוסיאציות, אלא ביכולת הלימדה שלנו שנפתרת מקישורים דלי שימוש, מחזקת קישורים מוצלחים ו(זה אולי הכי חשוב) מטמיעה אותם לתוך מערכת הבנה גלובלית.
כיום ווטסון מייצר הרבה תשובות במקביל(חלקם שונות תחבירית חלקם עובדתית) ואז מחליט (רק איי.בי.אם יודעים איך) איזו הכי סבירה מבינהם. עם ווטסון היה "מבין" את השאלה הוא לא היה צריך לבחור בין אופציות כי מאגר הנתונים שלו, להבדיל משלנו, חד משמעי ומדוייק.
בכלל קצת מצחיק לדבר על הבנת שפה במבודד מהבנה כללית של בנאדם היות ולהבין שפה זה להבין את תוכנה יותר מאשר התחביר המרכיב אותה.
דוגמא למחשה: בינה מלאכותית ברק נמאס לילה טוב.לינקים שעזרו לי:
http://www.nytimes.com/2010/06/20/magazine/20Computer-t.html?pagewanted=3&_r=1&
http://en.wikipedia.org/wiki/Natural_language_processing
http://www.cnet.com/8301-30976_1-20033516-10348864.html*בקצרה = באריכות מינימלית
-
#10 נכתב על ידי August לפני 9 שנים
הפעם אני באמת אקצר:
חלק מהעניין של "לעבור על כל האסוציאציות" נובע מזה שהמוח עובד באופן סופר מקבילי (כל נוירון הוא כמו מחשב קטן שמקבל קלט ומוציא פלט), והמחשב רק מסמלץ עבודה מקבילית באמצעות מנגנון טורי (או עם מספר מעבדים קטן) – הוא כאילו עובר נוירון נוירון ובודק מה הניורון הזה היה עושה. כך שבמובן מסויים גם האדם עובר על כל האסוציאציות כולל המופרכות, פשוט בגלל שהכל מקבילי אצלו זה לא לוקח יותר זמן ולא מורגש.-
"כך שבמובן מסויים גם האדם עובר על כל האסוציאציות כולל המופרכות, פשוט בגלל שהכל מקבילי אצלו"
אני לא חושב שזה נכון כלל או כלל. וודאי שהמוח עובד בצורה מקבילית אך לא כולו לא כל הזמן ולא בשביל כל פעולה.
כך או כך, לא נראה לי שנצליח לכסות על הפער בתפישתנו דרך התגובות. אם שנינו נהיה באחד מהאירועים הספקנים בקרוב אולי נוכל להיכנס לזה כמו שצריך. עד אז שא ברכה, ותמשיך לחשוב.
-
-
-
-
#12 נכתב על ידי אודי לפני 9 שנים
לגבי קרור מים מתחת ל-0 מעלות –
קיימת תופעה דומה אך הפוכה בהרתחת מים במיקרוגל:
http://en.wikipedia.org/wiki/Superheating
http://www.tapuz.co.il/forums2008/viewmsg.aspx?forumid=592&messageid=16835504-
בדיוק מה שחשבתי עליו ששמעתי את האייטם הזה. 🙂
(סרטון פה – http://www.youtube.com/watch?v=SC_NtH8vWSc – אבל אל תהיו מטומטמים כמוהו ותנסו את זה בלי כפפות)
-
-
#14 נכתב על ידי גל לפני 9 שנים
התוכנית היתה מעניינת מאד, רק תיקון קטן:
פירוש ראשי התבות MRSA הוא Methicillin-resistant Staphylococcus aureus. זוהי דוגמא לזן מסויים של חיידק עמיד שמהווה בעיה רצינית עבור מערכות הרפואה בעולם, אבל לא כינוי כללי לתופעה של חיידקים בעלי עמידויות לסוגים רבים של אנטיביוטיקה. אולי התכוונתם ל- MDR שהוא קיצור של multiple drug resistance? -
#15 נכתב על ידי נעם ויס לפני 9 שנים
טוב, קראתי את המאמר על הזיהוי האוטומטי של ציורים אבסטרקטיים ואני חושב שבשלב הזה אני מבין אותו די טוב. אני לא לגמרי סגור לגבי מה יחשב להסבר של המאמר בהנחה שהכוונה היא להעביר פה קורס שלם על למידה ממוחשבת ועיבוד תמונה (קורסים נחמדים, דרך-אגב).
אז מה שאני אעשה זה לתת תיאור כללי מאוד של מה עושים במאמר ואני מוכן להרחיב בכל נקודה ע"פ בקשה.
אז קודם כל צריך להבין שבמאמר משתמשים בשורה של אלגוריתמים "ידועים", למעשה רוב מוחלט של הנוסחאות הן פשוט שיבוץ של פונקציות ספציפיות (פונקציות למדידת מרחק) שהאלגוריתמים עושים בהם שימוש (ודרך אדב, אין שום נוסחה סטאטיסטית במאמר ושום f מעל r). ולעיניין עצמו:
שלב ראשון: אחנו מבצעים נורמליזציה של התמונה. מה שזה בעצם אומר זה שעושים זום-אין/זום-אאוט על שהתמונה תופסת בדיוק 256 על 256 פיקסלים.
שלב שני: אנחנו רוצים לחלץ את המידע שבו אנחנו נשתמש בשביל לסווג את את התמונה. בגדול המידע מידע מתייחס לכיוונויות של הקווים. כמו שאפשר לנחש, אנשים (בודאי שאנשים לא מקצועים) לא בדיוק מדייקים בזויות שלהם. בשביל להתמודד עם הבעיה (וסתם בשביל נוחות) אנחנו מחלקים את הכיווניות לאחת מארבע אפשרויות (יש כאן כל מיני עיניינים של קוונציזציה ואינטרפולציה).
שלב שלישי: עכשיו שיש לנו את המידע שאנחנו רוצים לעבוד איתו אנחנו "מרכזים" אותו. מחלקים את התמונה ל768 חלקים (כל חלק מחסה בערך שמנית תמונה, ככה שהם חופפים) ועבור כל חלק אחנו מוצאים 64 "ממוצעים" שאומרים לנו מה קורה באותו חלק מהתמונה.
שלב רביעי: טוב, 64*768 זה הרבה מידע בשביל תמונה אחת. בשלב הזה אנחנו "דוחסים" את המידע. נסתכל על 64 ה"ממוצעים" שמדדנו בכל חלק (לצורך החלק הזה אנחנו צרכים הרבה חלקים מהרבה תמונות). אנחנו מוצאים 500 שהם "מייצגים" באיזשהו מובן. עכשיו במקום לזכור את 768*64 הערכים שלנו, נזכור רק עד כמה הם רחוקים "בממוצע" מאותם 500 ערכים מייצגים.טוב הגענו בשעה טובה ומוצלחת (אם שרדתם עד עכשיו) למצב שבו כל תמונה מיוצגת ע"י 500 ערכים שונים. פה המאמר מתחלק לשניים: החיפוש אחר יצוגים "אייקונים" וזיהוי של תמונות חדשות על בסיס תמונות קודומות וידועות. אבל זה נראה לי מקום טוב לעשות בו הפסקה לשאלות וגם לשאול על איזה משני החלקים אנשים רוצים לשמוע.
-
#17 נכתב על ידי עמית לפני 9 שנים
-
-
#20 נכתב על ידי אילן לפני 9 שנים
פרק מאד מעניין (כרגיל), ומאחר ויש שוב נושא המערב למידה ממוכנת אני מרגיש מחוייב להתייחס …
על פניו, הנתונים נשמעים טובים מאד – להגיע ללמעלה מ-50% דיוק כאשר ההסתברות להגיע לניחוש מקרי נכון היא 1/250, זה מצויין.
אבל אז קלטתי שכמות המידע שממנו המערכת למדה היא ממש קטנה. כלומר, אמנם יש 20,000 תמונות, אבל מכל קבוצה יש בסך הכל רק 80 תמונות.
כאן התחיל הספקן שבי להעלות את הראש – מניסיון, 80 פריטים למשימת למידה זה מעט. מעט מאד. הייתי חייב לבדוק איפה הקאטש…
אחת הסכנות הגדולות בכל מחקר בתחום הלמידה הוא האפשרות של "התאמת יתר" (over fitting), כלומר שהאלגוריתם לא הצליח לעשות הכללה שתאפשר לו לסווג פריטים חדשים, אלא רק התאים את עצמו למידע שהוצג.
על פניו – זה מה שקרה שם.
שימו לב – אלגוריתם SVM דורש מספר של פרמטרים שקשה מאד לדעת מראש מה להציב בהם. כדי לפתור את הבעיה, הם ביצעו Grid Search (חיפוש שיטתי על פרמוטציות אפשריות של פרמטרים – גישה סבירה בהחלט), ובחרו את סט הפרמטרים שנותנים את התצאות הטובות ביותר. זה היה יכול להיות טוב, אם היו מבצעים את ה-Grid Search על חלק מהתמונות (כולל שלב קביעת הפרמטרים), ואז מוציאים סטטיסטיקות מתוך סט אחר של תמונות. אבל זה לא מה שעשו – נראה שפשוט בחרו את המודל עם התוצאות הטובות ביותר בתהליך חיפוש הפרמטרים, ודיווחו על התוצאות של אותו מודל על אותם נתונים.
אני די בטוח שלו היו עובדים בשיטה הנכונה, ובוחנים את האלגוריתם על תמונות חדשות לחלוטין, התוצאות היו נראות הרבה פחות טובות… -
- רישום לרסס תגובות
- ספק סביר – תוכנית #168 – גראס וסכיזופרניה
- ספק סביר – תוכנית #164 – טיפול בשתן
- ספק סביר #162 – זיכרון ומריחואנה
- ספק סביר #158 – מיתוסים על גראס, חדשות חלל ומדיניות דיווח חדשה למחקרים
- ספק סביר – תוכנית בונוס #13 – House of Numbers
- ספק סביר #155 – תדרים, עכברים והדברים המשפיעים עליהם
- ספק סביר – תוכנית בונוס #11 – הבוהים בשמש
- ספק סביר #154 – מאמינים חפים מפשע ופורמולה סינית מעניינת
- ספק סביר #153 – מים חיים, סרטן מדבק ודבק רפואי
- ספק סביר #152 – עוברים מאובנים, כימיה קיצונית ועוף מזוהם
הכל חוזר עליכם ו@&$ בידכם!
ברצינות, נשברתי מרוב קללות וחיקויים טיפשיים לפני שעברו שלוש דקות.