| מערכת קלארק מערכת תוכנה מבוססת XML עבור Corpora פיתוח מיושם Java |
הורד עכשיו |
מערכת קלארק דירוג וסיכום
- מערכות הפעלה:
- Windows All
מערכת קלארק תגים
מערכת קלארק תיאור
המטרה העיקרית שמאחורי העיצוב של המערכת היא המזער של ההתערבות האנושית במהלך יצירת משאבי השפה. הוא משלבת מספר טכנולוגיות: 1. טכנולוגיית XML; 2. Unicode; 3. דקדוקים רגילים; 4. אילוצים מעל מסמכי XML. עבור ניהול מסמכים, אחסון ושאילתה, בחרנו את טכנולוגיית XML בגלל הפופולריות שלה ואת הקלות שלה ההבנה. הליבה של קלארק היא עורך XML Unicode, שהוא הממשק העיקרי למערכת. מלבד שפת ה- XML עצמה, יישמנו שפת XPATH לניווט במסמכים ושפת XSLT לשינוי מסמכי XML. עבור משימות עיבוד רב לשוני, קלארק מבוסס על קידוד Unicode של המידע בתוך המערכת. יש מנגנון ליצירת היררכיה של tokenisers. הם יכולים להיות מחוברים אלמנטים ב- DTDs ובדרך זו יש tokenisers שונים עבור חלקים שונים של המסמכים. המנגנון הבסיסי של קלארק לעיבוד לשוני של Corpora טקסט הוא מעבד דקדוק רגיל מדורגים. האתגר העיקרי לדתות המדוברות הוא כיצד ליישם אותם על קידוד XML של המידע הלשוני. המערכת מציעה פתרון באמצעות שפת XPath לבניית מילה קלט לדקדוק קידוד XML של הקטגוריות של המילים המוכרות. תן מערכת קלארק לנסות להעריך באופן מלא את היכולות שלה!
מערכת קלארק תוכנה קשורה