שיקוף אירועים במערכות שליטה ובקרה

מקצוע
מילות מפתח , , , ,
שנת הגשה 2003
מספר מילים 10461
מספר מקורות 27

תקציר העבודה

 תקציר מערכות השליטה והבקרה מרכזות את ליבת העשייה הארגונית, את הדרך העיקרית לניטור ותמיכה במערכות מחשוב, וההבטחה להמשך פעילותן העסקית התקינה. פגיעה בזמינותם של מערכות אלו הינן קשות, ומהוות איום קריטי להמשך פעילותו העסקית של הארגון. איום, אשר קיבל משנה תוקף, עם הפגיעה שהייתה ב 11 בספטמבר 2001 במרכזי המחשוב שמוקמו במגדלי התאומים בארה"ב (World Trade Center).
מרבית חברות התוכנה והשירותים, המספקות שירותים ומוצרי שליטה ובקרה למערכות המחשוב הארגוני, זיהו את הפוטנציאל העצום בתחום, והחלו להציע מודלים מבוזרים לניהול אירועים, המושתתים על העקרונות של ניהול אוטונומי מלא של כל אתר (על כלל רכיבי השליטה והבקרה), תוך נסיון לממש יכולות סבילות (Fault Tolerance) לרכיב הפקח, לשם המשך טיפול באירועים ותקלות, גם באתר המקומי בצורה עצמאית.
תצורת עבודה כזו אכן מהווה פתרון לבעיית השרידות והזמינות בנושא ניהול אירועים, אך חופנת בחובה עלויות גדולות מאד.  בעצם פתרון זה מחייב רכישת שרת ניהול אירועים (פקח) עבור כל אתר, אם כרכיב עצמאי מלא, או כחלק ממימוש ניהול אירועים מבוזר בין אתרים, שכן אין היום דרך פשוטה לתמיכה בסבילות מערכות שליטה ובקרה, העושה זו בצורה אינהרנטית טובה. עלויות אלו לא מסתכמות בעלויות חומרה ותוכנה בלבד, אלא מחייבות הכשרה של כוח אדם ייעודי לתחזוקה של חוקת ניהול האירועים באתר – דבר המגדיל את מורכבות התמיכה במערך המחשוב באתר, ומחייב רמת הכשרה גבוהה.
הכרות גבוהה עם דרך פעולת כלי השליטה והבקרה, עם סקירה אקדמאית ומחקרית על הנעשה בתחום, תוך הבנת הצורך החדש לשרידות מהירה וזולה, הביאה לשינוי תפיסתי בנושא ניהול אירועים. ניתן לממש ניהול אירועים בעזרת תשתית השליטה והבקרה הקיימת, תוך התבססות על ההתקדמות המחקרית בתחום, ללא צורך במודלים מורכבים של ניהול אירועים מבוזר או רכיבי פיקוח ייעודים ויקרים, לטובת ניהול האירועים באתרים המנוהלים. המודל רותם את יתרונן של טכנולוגיות ומתדולוגיות עבודה מוכרות ופשוטות, כגון שיקוף אירועים (Event Mirroring) לשימושם של טכנולוגיות השליטה ובקרה, ואף משפרם. המודל מרחיב את עבודתן של מחקרים בתחום (שיסקרו בסקירה התאורטית), ומציג רעיון של מימוש "נציג" (Proxy) מקומי, וניהול תהליך של שיקוף אירועים באתר מנוטר, אל מול אתר שליטה ובקרה מרכזי, תוך התערבות במנגנונים הפנימים של מוצר הבקרה הסטנדרטי. הרכיבים המפותחים, יביאו לשיקוף אירועים בין האתר המקומי והמרכז, כך שלמעשה המערכת תדאג שהודעות על תקלות יגיעו גם לאתר המקומי וגם למרכז. בצורה זו נאפשר למפעיל באתר מנוהל להמשיך לטפל, בצורה מנוונת וחלקית, באירועים המתרחשים באתר המקומי,בעת נפילת הקשר אל מרכז הניטור, ללא צורך ברכיב פיקוח יעודי, ובכך נצליח להביא להעלאת הסבילות של מערכת השליטה והבקרה (Fault Tolerance) בעלות זניחה, תוך פשטות תפעולית.
המודל מוצג בתרשים הבא מסכם את תפיסת הרעיון, ואת הפשטות הישומית שלו, כאשר הריבוע הכחול המייצג את רכיב ה Event Proxy , מרכז עימו את ההתערבות בתהליך הנורמלי של זרימת האירועים, ומאפשר את ביצוע פעילות שקיפות האירועים עבור מערכת השליטה והבקרה באתר המנוטר, אל מול המרכז התפעולי, אל מול אתר ה Helpdesk.
תרשים 1 – תפיסת הרעיון המודל המוצע המיושם בעלות נמוכה ובמימוש פשוט (כמפורט בעבודה), מביא ומציג דרך חדשה להעלאת הסבילות של מערכת השליטה והבקרה, הקשורה ישירות בהעלאת שרידותו של האתר המנוטר, והבטחת אוטונמיותו של האתר,שכן אתר מנוטר הינו אתר שמזהה בעיות עם התעוררותן, ומתמודד עימם בצורה ישירה ובזמן מינימלי.
השוואת מודל זה אל מול חלופות סטנדרטיים של מימוש תצורות שרידות,  מבית היוצר של חברות מוצרי השליטה ובקרה בתעשייה, מראה בבירור שהפתרון המוצע הינו פשוט וזול למימוש ושימוש, ללא עלויות תפעוליות או עלויות רכש נוספות.
יתרונות מודל זה יכולים לתרום תרומה מג'ורית למרכזי ניטור, ואתרים מנוטרים, לשם הבטחת המשך פעילות השליטה ובקרה, גם ללא קשר לאתר הניטור המרכזי, ובכך להבטיח את המשך פעילותן התקין של מערכות המחשוב, ושל פעילותו העיסקית של הארגון.