אלוגון

ellogon הוא צולב, רב לשוני, כללי מטרה הנדסה סביבה
הורד עכשיו

אלוגון דירוג וסיכום

פרסומת

  • Rating:
  • רישיון:
  • GPL
  • שם המפרסם:
  • Georgios Petasis
  • מערכות הפעלה:
  • Windows All
  • גודל הקובץ:
  • 10.6 MB

אלוגון תגים


אלוגון תיאור

אלוגון הוא צולב, רב לשוני, כללי, שפה הנדסה סביבה, שפותחה על מנת לסייע הן חוקרים שעושים מחקר בלשנות חישוביות, כמו גם חברות המייצרות ולספק הנדסת שפה אלוגון כפלטפורמת הנדסת שפה מציעה קבוצה מקיפה של מתקנים, כולל כלים לעיבוד ויזואליזציה של נתוני טקסטואלים / HTML / XML ומידע לשוני הקשורים, תמיכה במשאבים לקסיקאלי (כגון יצירת ו Embedding), כלים ליצירת Corpora מורם, גישה למסדי נתונים , השוואת נתונים בולטים, או להפוך מידע לשוני לתוך וקטורים לשימוש עם אלגוריתמים שונים למידה מכונה. בעשור האחרון הוצגו מספר רב של תשתיות תוכנה שמטרתו להקל על RD בתחום עיבוד השפה הטבעי. חלק מתשתיות אלה, כגון LT-NSL / LT-XML כלים או שער, הפכו פופולריים מאוד כפי שהם הוחלו על מגוון רחב של משימות על ידי מוסדות רבים ברחבי העולם. אלוגון שייך לקטגוריה של פלטפורמות התייחסות או ביאור, שבהן המידע הלשוני מאוחסן בנפרד מהנתונים הטקסטואליים, שיש להם הפניות לטקסט המקורי. בהתבסס על מודל הנתונים Tipter, אלוגון מספק תשתית עבור: · ניהול, אחסון והחלפת נתונים טקסטואליים וכן את המידע הלשוני המשויך. · יצירת, הטבעה וניהול רכיבי עיבוד לשוניים. · להקל על תקשורת בין רכיבים לשוניים שונים על ידי הגדרת ממשק תכנות מתאים (API). · דמיינו נתונים טקסטואליים ומידע לשוני. אלוגון מניות באותו מודל נתונים כמו ארכיטקטורת Tipter. בשל כך, היא חולקת כמה תכונות בסיסיות עם תשתיות אחרות של Tipter מבוססי, כגון שער. עם זאת, הוא גם מציע מספר רב של תכונות להבדיל אותו מתשתיות כאלה. האלמנט המרכזי לאחסון נתונים באלוגון הוא האוסף. אוסף הוא קבוצה סופית של מסמכים. מסמך אלוגון כולל נתונים טקסטואליים וכן מידע לשוני על הנתונים הטקסטואליים. מידע לשוני זה מאוחסן בצורה של תכונות והערות. תכונה חוקרת סוג מסוים של מידע עם ערך מוקלד. ביאור שותף מידע שרירותי (בצורה של תכונות) עם חלקים של נתונים טקסטואליים. כל חלק כזה, בשם טווח, מורכב משני קיזוז אופי המציין את ההתחלה ואת תווים הסופו של החלק, כפי שנמדד מן התו הראשון של כמה נתונים טקסטואליים. הערות בדרך כלל מורכבות מארבעה אלמנטים: · מזהה מספרי. מזהה זה ייחודי לכל ביאור במסמך והוא יכול לשמש כדי לזהות באופן חד משמעי את ההערה. · סוג. סוגי ביאור הם ערכים טקסטואליים המשמשים לסווג הערות לקטגוריות. · קבוצה של משטח שציין את טווח הנתונים הטקסטואליים המפורסמים. · מערכת של תכונות. תכונות אלה בדרך כלל מקודדות את המידע הלשוני הדרוש. Ellogon ב עונה בצורתו הנוכחית כל הדרישות הללו. כפי Ellogon מבוססת על ארכיטקטורת המודיע, שהיא חולקת מאפיינים בסיסיים רבים עם תשתיות מודיעות מבוססת אחרים כמו GATE. עם זאת, Ellogon מציעה מספר תכונות חשובות שמבדילים אותו תשתיות דומות: · פיתוח רכיב קל זה די קל להבין את התהליך של פיתוח רכיבים חדשים ולפתח אותם באמצעות הפונקציות שמספקות Ellogon. בנוסף, מגוון רחב של שפות תכנות עבור פיתוח רכיב נתמך, כולל C, C ++, Java, TCL, Perl ו- Python. · סביבת פיתוח משולבת Ellogon פועלת בתור סביבת פיתוח משולבת, כפי שהוא מספק תמיכה מלאה מחזור הפיתוח של רכיב. רכיבים ניתן ליצור, לערוך, הידור ומקושר (אם רלוונטי), בתוך Ellogon. יתר על כן, C / C ++ / Java רכיבים ניתן לפרוק, שונה, הידור מחדש לתוך Ellogon מבלי להתפטר מן Ellogon. היכולת לפרוק או לטעון מחדש את כל הרכיבים חיוני שכן היא פוגעת מחזור הפיתוח באופן משמעותי, שכן שינויים רכיב ניתן להעריך באופן מיידי. · מוכן לשימוש "ארגז כלים" רכיב Ellogon מצויד במספר רב של כלים מוכנים לשימוש עבור ביצוע משימות כמו יצירת corpora מבוארת, דור וקטור או השוואת נתונים. בנוסף, מספר רכיבי מדגם ניתנים כי ניתן להתאים את הדומיינים והשפות השונות, המבצעות כמה משימות בסיסיות כמו Tokenization, תיוג חלק של דיבור או Listeter Listup. לבסוף, ellogon מציעה מספר כלי הדמיה נתונים, החל מצופים פשוטים עבור מסד הנתונים ביאור לצופים המסוגלים להציג מידע היררכי, כמו עצי תחביר. · פריסה קלה כמו אלוגון מיישמת ארכיטקטורה מתפוררת, זה מאוד קל ליצור קל לשימוש המוצר ממערכת של רכיבים המבצעים משימה ספציפית. כל הרכיבים יחד עם חלקים Ellogon הדרושים ניתן לארוז או באפשרות אחת (אשר צריך שום התקנה) או כבקשת (אשר ניתן לרוץ ללא שינוי תחת מערכות מרובות). יישומים מיוחדים אלה יכולים להיות מופצים בשימוש בכל מערכת, גם אם ellogon לא הותקן למערכת. דרישות: · TCL / TK 8.4 (או חדש יותר), · Java JDK / JRE 1.4.1 (אופציונלי), · פרל 5.8.1 (אופציונלי), · פייתון 2.2 (אופציונלי).


אלוגון תוכנה קשורה

Gsglose

gsglossary היא תוכנית קטנה כדי לעזור לך ללמוד את אוצר המילים שלך. ...

179 186 KB

הורד