איחזור מידע
מתוך Ohalo Wiki
אחזור מידע, הוא רחב ולא מוגדר מספיק, אך במאמר זה (Information Retrieval) " המושג "אחזור מידע אתייחס רק למערכות אחזור מידע אוטומטיות. 'אוטומטי' בניגוד לידני, ו'מידע' בניגוד לנתונים מידע, ,(IR) או עובדות. לרוע המזל המילה 'מידע' יכולה להיות מטעה. בהקשר של אחזור מידע במובן הטכני כפי שמוצג בתיאורית התקשורת של שאנון, איננו ניתן למדידה ולכימות בקלות. למעשה, במקרים רבים תיאור של אחזור יהיה מספיק על ידי החלפת המילה 'מידע' במילה
- (Lancaster) 'מסמך'. בכל זאת, מקובל ש 'אחזור מידע' מתואר ע"י ההגדרה הבאה
'אחזור מידע הוא המושג שבד"כ, אם כי לא תמיד במדויק, מתייחס לפעילות במאמר זה. מערכת אחזור מידע לא משנה (מחדשת) את הידע שבידי המשתמש לגבי נושא חקירתו. המערכת רק מיידעת על קיום (או אי- קיום) ומיקום מסמכים הקשורים לבקשה של המשתמש.' ולהוציא מערכות ,Minsky ו Winograd זאת, להוציא מערכות שאלה-תשובה כפי שתוארו ע"י כמו מערכות בבורסות לני"ע. (Data) אחזור נתונים מוצגים בטבלה הבאה (IR) לבין אחזור מידע (DR) ע"מ להבהיר את ההבדל בין אחזור נתונים כמה מהמאפיינים של אחזור נתונים ואחזור מידע: IR אחזור מידע DR מאפיין אחזור נתונים התאמה התאמה מדויקת התאמה חלקית, מכסימלית הסקת מסקנה דדוקציה אינדוקציה מודל דטרמיניסטי הסתברותי מיון מונותטי פוליתטי שפת שאילתה מלאכותית טבעית מפרט שאילתה שלם לא שלם נדרש מהפריטים התאמה רלוונטיות תגובה על טעות רגישה לא רגישה ניתן לבקר חלוקה דיכוטומית זו, מפני שאחרי הכול הגבול שבין השתיים מעורפל, אך חלוקה זו שימושית מפני שהיא מדגימה את טווח המורכבות שבכל מודל אחזור. נבחן עכשיו בפירוט כל פריט מהטבלה. באחזור נתונים אנו בד"כ מחפשים התאמה מושלמת, אנו בודקים אם פריט נמצא או איננו נמצא בקובץ. באחזור מידע אנו בד"כ רוצים למצוא את הפריטים המתאימים חלקית למבוקש, ואז לבחור את המתאימים ביותר.

