גיימרה

מסגרת תכנות זיהוי מסמך.
הורד עכשיו

גיימרה דירוג וסיכום

פרסומת

  • Rating:
  • רישיון:
  • GPL
  • מחיר:
  • FREE
  • שם המפרסם:
  • Michael Droettboom
  • אתר האינטרנט של המוציא לאור:
  • http://ldp.library.jhu.edu/projects/gamera/

גיימרה תגים


גיימרה תיאור

מסגרת תכנות זיהוי מסמכים. פרויקט Gamera הוא מסגרת עבור יצירת יישומי ניתוח מסמכים מובנים על ידי מומחים בתחום. מומחי תחום הם אנשים שיש להם ידע חזק של המסמכים באוסף, אבל לא יכול להיות רקע טכני פורמלי. המטרה היא ליצור כלי הממנף את הידע שלהם של מסמכי היעד כדי ליצור יישומים מותאמים אישית ולא בניסיון לפגוש מגוונים דרישות עם יישום מונוליטי. נייר זה נותן סקירה כללית של הארכיטקטורה ועקרונות העיצוב של Gamera.Developing מערכות זיהוי עבור מסמכים היסטוריים קשה דורש ניסויים מאז הפתרון הוא לעתים קרובות לא ברור. לכן, המטרה העיקרית של Gamera היא לתמוך במחזור פיתוח מבחן ו-לחידוך. כל פרט יישום מונע על ידי מטרה זו. לדוגמה, Python נבחרה לשפת הליבה בגלל יכולות ההתבוננות שלה, הקלדה דינמית וקלות שימוש. זה כבר בשימוש שפת התכנות הראשון עם הצלחה ניכרת .c + + משמש לכתוב plugins שבו ביצועי זמן ריצה הוא בעדיפות, אבל גם במקרה זה, מערכת תוסף Gamera נועד לעשות כתבות כתיבה כמו קל ככל האפשר. Gamera כולל ממשק משתמש גרפי מלא, המספק מספר קיצורי דרך להכשרה, כמו גם בדיקה של תוצאות האלגוריתמים בכל צעד. על ידי שיפור הקלות של הניסויים, אנו מקווים לשים את הכוח לפתח מערכות זיהוי עם אלה מי מבין את המסמכים הטובים ביותר. אנו מצפים לפחות שני סוגים של מפתחים לעבוד עם המערכת: אלה עם רקע טכני הוספת אלגוריתמים למערכת, ואלה העובדים על צבירה ברמה גבוהה יותר של חתיכות אלה. חשוב לציין את ההבחנה הזאת, שכן קבוצות אלה מייצגות ערכות מיומנות שונות ודרישות. בנוסף לתמיכתו בפיתוח מבחן ומחדד, יש גם כמה יתרונות נוספים שחשובים לפרויקטים גדולים של דיגיטציה בכלל. אלה הם: · קוד קוד פתוח וקביעת תקנים, כך שהתוכנה יכולה לקיים אינטראקציה היטב עם חלקים אחרים של מסגרת דיגיטציה · עצמאות פלטפורמה, פועל על מגוון רחב של מערכות הפעלה, כולל לינוקס, Microsoft Windows ו- Mac OS-X · מערכת זרימת עבודה כדי לשלב משימות ברמה גבוהה · עיבוד אצווה · מסגרת בדיקה יחידה כדי להבטיח נכונות ולהימנע רגרסיה · רכיבי ממשק משתמש לפיתוח וסיווג הדרכה · הכרה ביטחון פלט כך מנהלי איסוף יכולים בקלות למקד מסמכים הזקוקים לתיקון או באסטרטגיות זיהוי שונות. Gamera יש ארכיטקטורת תוסף מודולרי. מודולים אלה בדרך כלל מבצעים אחד מחמש משימות זיהוי מסמך: 1. טרום עיבוד 2. פילוח מסמך וניתוח 3. סמל פילוח וסיווג 4. ניתוח תחבירי או מבני 5. תפוקת משימות אלה יכולה להיות מורכבת באופן שרירותי, לערב אסטרטגיות או מודולים מרובים, או להסיר לחלוטין בהתאם לבעיית ההכרה הספציפית בהישג יד. השלבים בפועל המרכיבים מערכת זיהוי מלאה נשלטים לחלוטין על ידי המשתמש. תשומת לב קרובה לחידוש של צעדים אלה חשובה במיוחד כאשר עובדים עם מסמכים היסטוריים מושפלים. מה חדש במהדורה זו: · Plugins to_numpy וממילה הוסיף לתמיכה של numpy; המודולים המספריים והמספרות המושלמים הוחלפו במונדי · הדגשה גם עובד עם Greyscale ו- Onetbit תמונות · מתוקן שינוי גודל פונקציה ב- vigra · סיווג KNN יכול כעת לחזור אמצעי ביטחון שונים עבור מזהה הראשי כי הם לבחירה על ידי המשתמש. עיין בתיעוד API מסווג לפרטים. · סיווג KNN עכשיו עובד כצפוי כאשר k> 1; עד כה, id_name היה מסודר על ידי ביטחון, ופירוש הדבר כי תמיד הרחוק ביותר בין השכנים הקרובים ביותר של K הוחזר כ- Main_ID · עכשיו compiles עם python 2.6 (תודה prapat suriyaphol)


גיימרה תוכנה קשורה

Crocopat

Crocopat הוא כלי עבור חישוב יחסי פשוט ויעיל. ...

149

הורד

cgtkcalc

cgtkcalc הוא מחשבון מדעי פשוט עבור מספרים מורכבים. ...

148

הורד

Chototplot

knotplot היא תוכנית OpenGL שפועלת על רוב סוגי המחשבים. ...

166

הורד