פנינו היכן?

במאגרי הספרייה הלאומית תצלומים רבים של אישים אף מלפני קום המדינה. חלק נכבד מהם אינו מתויג ולא ניתן למוצאם. כלומר, הם נמקים בתהומות הדיגיטליים של האלמוניות המוחלטת במערכות המידע של הספרייה הלאומית. זאת, פרט למאגר אחד - אוסף "אברהם שבדרון", שהינו אוסף פורטרטים מתוייגים, קרי קיים זיהוי טקסטואלי של כל פורטרט במאגר. הפרוייקט שאף לפתח מכונה שתוכל לסרוק מאגרי התצלומים הבלתי מתוייגים הקיימים הספרייה הלאומית ולזהות, בעזרת אוסף שבדרון, את הישויות שבמאגרים אלו. בכך יתאפשר תיוג אוטומטי וצרוף התצלומים הבלתי מתוייגים אל חיק הישויות הנגישות.

אחד הקשיים לרמת איכות התיוג נובע מכך שבאוסף שבדרון הינו מאגר של תצלומים בני כמה עשרות שנים, כתוצאה מכך מכונת זיהוי הפנים זיהתה רבות מהתצלומים האנונימיים כישויות על-פי שבדרון, אך בבדיקה ידנית אותרו מעט התאמות אמת, על כן בשלב זה נמצאת המכונה בשלבי לימוד נוספים.

האם ברצונך לעבוד על פרויקט זה?

הערות

לעיונך, הנה הצהרת הפרטיות שלנו.