סמינריונית DATA MINING

מוסד לימוד
סוג העבודה
מקצוע
מילות מפתח ,
שנת הגשה 2007
מספר מילים 16577
מספר מקורות 15

תקציר העבודה

Data mining -סמינריון במערכות מידע :תקציר העבודה Data mining (כריית נתונים) היא הטכנולוגיה המתקדמת ביותר לאחזור מידע  הקיימת כיום בשוק. כריית נתונים משלבת הן חומרה מתקדמת והן תוכנה המורכבת מאלגוריתמים חכמים ויעילים לניתוח וחילוץ מידע משלל הנתונים.
היא משלבת דיסציפלינות שונות מעולם המתמטיקה, סטטיסטיקה,בינה מלאכותית, מכונות למידה וכו כדי לספק את התוצר החשוב ביותר:מידע אפקטיבי.
במסגרת העבודה יוצגו  בפירוט השלבים  השונים בתהליך הכרייה  (תהליך knowledge discovery in data base או kdd) ובהם ניקוי נתונים,אינטגרצית מקורות,בחירת מידע,טרנספורמציה,כריית נתונים והערכה והצגת נתונים.
יפורטו  3 השיטות  או האסטרטגיות  השכיחות ביותר והידועות ביותר לכריית נתונים:סיווג אשכולות וחוקי היסק   ועבור כל אחת מהן יוסברו  הטכניקות המקובלות ביותר למימושן ובהן עצי החלטה,רשתות נוירונים,אלגוריתם אפריורי ,אלגוריתם k maens  שיודגם בפירוט ,אלגוריתמים גנטיים,אלגוריתם  k nearest neighbors .
ייסקרו גם היתרונות  החסרונות והצרכים בטכנולוגיה זו והשימושים העסקיים העיקריים שלה וכן ידובר על שיטות לשיפור ביצועים,הנחיות לבחירת שיטת הכרייה הטובה ביותר ותבוצע השוואה בין שני אלגורתמי כריית נתונים.
תוכן עניינים
פרק עמוד
1 .מבוא
3
2 .כריית נתונים-הגדרה ותיאור כללי
4   2.1 הגדרה-מבט על
4   2.2 הצורך בכריית נתונים מטרות ויתרונות
8   2.3 חסרונות בתהליך כריית נתונים
1 1
3 .שימושים עסקיים ותחומי יישום של כריית נתונים
1 2
4 .שלבי תהליך כריית נתונים
1 5
  4.1 זיהוי המטרה
1 5
  4.2 יצירת בסיס הנתונים לכרייה ואינטגרצית מקורות
1 6
  4.3 קדם עיבוד
1 6
  4.4 כריית נתונים
1 7
  4.5 הערכה אינטרפרטציה וניתוח תוצאות
1 8
  4.6 שלב הביצוע
2 0 5.מתודולוגיות לתכנון וביצוע כריית  נתונים
2 0   5.1 קטגוריות וטכניקות עיקריות לכריית נתונים
2 0     5.1.1 סיווג
2 0       5.1.1.1 עצי החלטה
2 2
      5.1.1.2 רשתות נוירונים
2 5
      5.1.1.3 k שכנים קרובים
2 8
    5.1.2 אשכול וחלוקה
2 9
      5.1.2.1 k means
3 1
      5.1.2.2 אלגוריתמים גנטיים
3 2
      5.1.2.3 divisive clustering
3 4
    5.1.3 חוקי היסק
3 4
      5.1.3.1 אלגוריתם אפריורי
3 6
  5.2 כיצד לבחור בין השיטות?
38
  5.3 ניתוח והשוואת אלגוריתמים-שיטת אשכולות
3 9
6 .טכניקות לשיפור ביצועים
4 2
7.סיכום
4 4
8 .נספחים
4 5
  8.1 נספח א' נתונים-הגדרות ומושגים הרלוונטיים לתהליך                    הכרייה
4 5
  8.2 נספח ב' כלי data mining
4 8
  8.3 נספח ג' אלגוריתמים מתחום כריית הנתונים 50 9.רשימת מקורות 53