רשתות עצביות מלאכותיות (ANNs) או מערכות חיבוריות הן מערכות מחשוב בהשראת הרשתות העצביות הביולוגיות המהוות מוח מוחי של בעלי חיים. מערכות כאלה לומדות (משפרות בהדרגה את יכולתן) לבצע משימות על ידי בחינת דוגמאות, בדרך כלל ללא תכנות ספציפית למשימות. לדוגמה, בזיהוי תמונות, הם עשויים ללמוד לזהות תמונות המכילות חתולים על ידי ניתוח תמונות לדוגמא שתויגו ידנית כ"חתול "או" אין חתול ", ולהשתמש בתוצאות האנליטיות כדי לזהות חתולים בתמונות אחרות. הם מצאו את רוב השימוש ביישומים שקשה לבטא אותם בעזרת אלגוריתם מחשבים מסורתי באמצעות תכנות מבוססת כללים.
ANN מבוסס על אוסף של יחידות מחוברות הנקראות נוירונים מלאכותיים, (מקביל לנוירונים ביולוגיים במוח ביולוגי). כל חיבור (סינפסה) בין נוירונים יכול להעביר אות לנוירון אחר. הנוירון הקולט (פוסט-סינפטי) יכול לעבד את האות / ים ואז לאות עצבים במורד הזרם המחוברים אליו. לנוירונים עשויים להיות מצב, המיוצג בדרך כלל על ידי מספרים אמיתיים, בדרך כלל בין 0 ל- 1. לנוירונים ולסינפסות עשויים להיות גם משקל שמשתנה עם התקדמות הלמידה, שיכולים להגדיל או להקטין את חוזק האות שהוא מעביר במורד הזרם.
בדרך כלל, נוירונים מסודרים בשכבות. שכבות שונות עשויות לבצע התמורות מסוגים שונים בכניסותיהם. האותות עוברים מהשכבה הראשונה (קלט), לשכבה האחרונה (פלט), אולי לאחר חציית השכבות פעמים רבות.
המטרה המקורית של גישת הרשת העצבית הייתה לפתור בעיות באותה צורה שבה היה מוח אנושי. עם הזמן, תשומת הלב התמקדה בהתאמת יכולות נפשיות ספציפיות, מה שהוביל לסטיות מהביולוגיה כמו הפרופגציה אחורית, או העברת מידע בכיוון ההפוך והתאמת הרשת כך שתשקף את המידע הזה.
רשתות עצביות שימשו במגוון משימות, כולל ראיית מחשב, זיהוי דיבור, תרגום מכונה, סינון רשת חברתית, משחקי לוח ומשחקי וידאו ואבחון רפואי.
נכון ל- 2017, לרשתות העצביות בדרך כלל יש כמה אלפים עד כמה מיליוני יחידות ומיליוני קשרים. למרות שמספר זה הוא מספר סדר גודל בסדר גודל ממספר הנוירונים במוח אנושי, רשתות אלו יכולות לבצע משימות רבות ברמה מעבר לזו של בני אדם (למשל, זיהוי פרצופים, משחק "גו").
רשת עצבית עמוקה (DNN) היא רשת עצבית מלאכותית (ANN) עם ריבוי שכבות בין שכבות הקלט והפלט. ה- DNN מוצא את המניפולציה המתמטית הנכונה כדי להפוך את הקלט לפלט, בין אם זה קשר ליניארי או קשר לא ליניארי. הרשת עוברת בשכבות ומחשבת את ההסתברות של כל פלט. לדוגמא, DNN המאומן להכיר גזעי כלבים יעבור על התמונה הנתונה ויחשב את ההסתברות שהכלב בתמונה הוא גזע מסוים. המשתמש יכול לבדוק את התוצאות ולבחור אילו הסתברויות הרשת צריכה להציג (מעל סף מסוים וכו ') ולהחזיר את התווית המוצעת. כל מניפולציה מתמטית ככזו נחשבת שכבה, ול- DNN מורכב יש שכבות רבות, ומכאן השם "רשתות עמוקות".
אנשי DNN יכולים לדגמן מערכות יחסים לא לינאריות מורכבות. אדריכלות DNN מייצרים מודלים קומפוזיציביים שבהם האובייקט בא לידי ביטוי כהרכב שכבתי של פרימיטיביות. השכבות הנוספות מאפשרות הרכב של תכונות משכבות נמוכות יותר, ועשויות לדגמן נתונים מורכבים עם פחות יחידות מאשר רשת רדודה בעלת ביצועים דומים.
אדריכלות עמוקה כוללת גרסאות רבות של כמה גישות בסיסיות. כל ארכיטקטורה מצאה הצלחה בתחומים ספציפיים. לא תמיד ניתן להשוות בין הביצועים של ארכיטקטורות מרובות, אלא אם כן הוערכו באותה מערך נתונים.
רשתות DNN הן בדרך כלל רשתות קדימה שבהן הנתונים זורמים משכבת ​​הקלט לשכבת הפלט מבלי לולאה חזרה. בהתחלה, ה- DNN יוצר מפה של נוירונים וירטואליים ומקצה ערכים מספריים אקראיים, או "משקולות", לקשרים ביניהם. המשקולות והכניסות מוכפלים ומחזירים תפוקה בין 0 ל- 1. אם הרשת לא זיהתה במדויק דפוס מסוים, אלגוריתם היה מתאים את המשקולות. ככה האלגוריתם יכול להפוך פרמטרים מסוימים להשפיע יותר, עד שהוא יקבע את המניפולציה המתמטית הנכונה לעיבוד מלא של הנתונים.
רשתות עצביות חוזרות ונשנות (RNNs), בהן נתונים יכולים לזרום לכל כיוון, משמשות ליישומים כמו דוגמנות שפה. זיכרון ארוך טווח יעיל במיוחד לשימוש זה.
רשתות עצביות עמוקות (CNN) מעוררות משמשים בראיית מחשב. רשתות CNN הוחלו גם על דוגמנות אקוסטית לזיהוי דיבור אוטומטי (ASR).

חזרה למעלה