Xapian ואומגה

Xapian הוא קוד פתוח ספריית אחזור מידע הסתברותי, שוחרר תחת GPL.
הורד עכשיו

Xapian ואומגה דירוג וסיכום

פרסומת

  • Rating:
  • רישיון:
  • GPL
  • מחיר:
  • FREE
  • שם המפרסם:
  • Xapian Team
  • אתר האינטרנט של המוציא לאור:
  • http://www.xapian.org/

Xapian ואומגה תגים


Xapian ואומגה תיאור

Xapian היא ספריית אחזור מידע הסתברותי קוד פתוח, משוחרר תחת GPL. Xapian היא ספריית אחזור מידע הסתברותי קוד פתוח, משוחרר תחת GPL. ISS Xapian שנכתב ב- C, עם איגודי כדי לאפשר שימוש משפות אחרות (Perl, Java, Python, PHP, ו TCL כרגע נתמכים; עורמה ו- C # להיות עבד) .Xapian נועד להיות ערכת כלים וישימה כדי לאפשר למפתחים כדי להוסיף לאינדקס מתקדם בקלות ולחפש המתקנים applications.If משלהם שאתה מחפש במנוע חיפוש ארוז עבור אתר האינטרנט שלך, אתה צריך להעיף מבט האומגה, אשר היא יישום אנו מספקים בנוי על Xapian. אבל שלא כמו פתרונות חיפוש באתר רוב אחרים, הרבגוניות של Xapian מאפשרת לך להרחיב אומגה כדי לענות על הצרכים שלך ככל שהם גדלים. הנה כמה תכונות עיקריות של "Xapian ואומגה": · קוד פתוח / תוכנה חופשית - תחת רישיון GPL. · מאוד נייד - פועל על רבי לינוקס, MacOS X, רבי פלטפורמות יוניקס אחרות, ו- Microsoft Windows. · נכתב ב- C. איגודי Perl זמינים חיפוש מודול :: Xapian על CPAN. איגודי Java JNI כלולים במודול-איגודי Xapian. אנו תומכים גם סוויג אשר יכול ליצור איגודים עבור 13 שפות. נכון לעכשיו אלה עבור Python, PHP4, ו TCL עובדים. # עורמה ו- C להיות עבד. · מדורג חיפוש probablistic - המילים החשובות מקבלים משקל רב יותר מאשר מילים לא חשובות, כך המסמכים הרלוונטיים ביותר נוטים יותר לבוא סמוך לראש רשימת התוצאות. · משוב רלוונטי - נתון אחד או יותר מסמכים, Xapian יכול להציע תנאי המדד הרלוונטיים ביותר להרחבת שאילתא, מראים מסמכים נלווים, מסמכים לקטלג, וכו ' · חיפוש ביטוי והקרבה - משתמשים יכולים לחפש מילים המתחוללים באזור ביטוי מדויק או בתוך מספר מסוים של מילים, או לפי סדר מסוים, או בכל סדר. · מגוון מלא של מפעילי חיפוש בוליאני מובנים ( "לא שוק המניות", וכו '). תוצאות חיפוש בוליאני מדורגות על ידי משקולות probablistic. מסננים בוליאני יכול להיות מיושם גם להגביל חיפוש הסתברותית. · תומך נובע של מונחי חיפוש (למשל, חיפוש אחר "כדורגל" יתאים מסמכים אשר מזכירים "רגל" או "כדורגלן"). זה עוזר למצוא את המסמכים רלוונטיים אשר עלולים לפספס אחר. Stemmers כלולים כיום עבור דנית, הולנדית, אנגלית, פינית, צרפתית, גרמנית, איטלקית, נורווגית, פורטוגזית, רוסית, ספרדית ושוודית. · קבצי מסד נתונים תמך> 2GB - חיוני עבור ומדרוג אוסף מסמכים גדולים. · פורמטי נתונים עצמאיים פלטפורמה - אתה יכול לבנות מאגר מידע על מכונה אחת ולחפש אותו על אחר. · מאפשר עדכון וחיפוש סימולטני. מסמכים חדשים שניתן יהיה למצוא מיד. כמו גם את הספרייה, אנו מספקים מספר תוכניות דוגמא קטנה, ואת יישום גדול - אינדקס יישום מבוסס CGI שנקרא אומגה: · המדד יכול המסופק האינדקסים HTML, PHP, PDF, PostScript, וטקסט רגיל. הוספת תמיכה עבור אינדקס פורמטים אחרים קלה שבו מסנני המרה זמינים (לדוגמא Microsoft Word). אינדקסים זה עובד באמצעות מערכת התיוק, אבל אנחנו גם מספקים תסריט לאפשר סורק האינטרנט htdig להיות מכור, המאפשרים לאתרים מרוחקים לבצע חיפוש באמצעות אומגה. · ניתן גם נתוני מדד מכל SQL או RDBMS אחרים נתמך על ידי מודול פרל DBI. זה כולל MySQL, PostgreSQL, SQLite, Sybase, MS SQL, LDAP, ו ODBC. · חיפוש CGI חזיתי מסופק עם מראה להתאמה אישי. זה יכול גם להיות מותאם אישית לתוצאות הפלט ב- XML או CSV, וזה שימושי אם אתם מייצרים דפים באופן דינמי (למשל עם PHP או mod_perl) ופשוט רוצים תוצאות החיפוש גלם אשר ניתן לעבד בקוד פריסת עמוד משלך. מה חדש במהדורה זו: API: · Xapian :: המסמך לא פעם מאחסן ערכים ריקים במפורש. זה לא היה בהתנהגות מכוונת, ואיך במקרה זה טופל לא מתועד. ההתנהגות המתוקנת עולה בקנה אחד עם איך metadata המשתמש מטופל. שינוי זה אינו ניתן לצפייה באמצעות מסמך :: get_value (), אך ניתן להבחין כאשר ולביקורות עם מסמך :: values_begin (), באמצעות מסמך :: values_count (), או מנסה למחוק את הערך עם מסמך :: remove_value (). חבילת בדיקות: · תקן testcase scaleweight4 לא להיכשל על x86 כאשר הידור עם -O0. הבעיה הייתה בקוד testcase, וכן נגרמה על ידי דיוק עודף בערכי FP ביניים. · Testcases אשר בבדיקת פעולות שיש להם O צפוי (...) התנהגות לא זמן מעבד מחאה במקום זמן wallclock על רוב הפלטפורמות, שאמור לחסל לכשלים לעתים בשל קוצי עומס מתהליכים אחרים. · (כרטיס # 308) · כשלי מבחן תקן בשל SKIP_TEST_FOR_BACKEND ( "inmemory") לא מדלגים כשזה צריך עקב מחרוזות תווי השוואה עם == (על תא מטען הערך המוחזר נבדק STD :: המחרוזת במקום char const *). · שפר את כיסוי בדיקה במקרים פינו מספר. · תקן testcase consistency2 למעשה שיופעל (למרבה המזל זה עובר). · בשנת testcases שנוצר, השיחה get_description () על אובייקט בנוי ברירת המחדל של כל הכיתה לוודא כי העבודות (ואינו מנסה לבטל את ההפניה למבנה NULL, או להיכשל קביעה כלשהי, וכו '). כל כיתות נבדק כעת הם בסדר - זו היא להימנע רגרסיות בעתיד או בעיות כאלה עם כיתות חדשות. · בתקופת ההכנות כיסוי הבדיקות, השימוש "--coverage" במקום "-fprofile-קשתות-כיסוי -ftest". · הרתמה המבחן עכשיו יש את backend inmemory למבוגים תומך metadata שציין משתמש (מלבד איטרציה מעל מקשי metadata). של מתאים: · אם שאילתת מכיל שאילתת משנה MatchAll, לבדוק את זה לפני שאתם בודקים את התנאים האחרים, כך הלולאה אשר בודק איך המשחק מבחינת רבים יכולים לצאת מוקדם אם הם לכל אורך המשחק. · כאשר OR או ANY_MAYBE דועך AND, אנו בזהירות היו מחליפים את הילדים ליעילות מקסימלית, אבל המצב היה הפוך אז היינו למעשה מחמיר את המצב. זה היה שם לב כי זה היה וכתוצאה מכך באותה שאילתא לרוץ מהר יותר כאשר יותר תוצאות מתבקשות על! · רק לבנות את termname כדי termfreq ומפה משקל עבור subdatabase הראשון במקום לבנות אותו מחדש עבור כל אחד. כמו כן אין להעתיק את המפה הזאת כדי להחזיר אותו. זה אמור להאיץ את החיפושים קצת, במיוחד אלה מעל מסדי נתונים מרובים. · אם submatcher נכשל אבל ErrorHandler אומר לנו להמשיך בלעדיו, אנחנו פשוט להשתמש מצביעים NULL לעמוד במקום הקצאת אובייקט מקום וכתובת דמה מיוחד. · הסר AndPostList, לטובת MultiAndPostList. AndPostList שימש רק כמוצר ריקבון (על ידי AndMaybePostList ו OrPostList), ואינו נראה כל מהר. הסרה שהיא מקטינה את לחץ מטמון מעבד, והוא פחות קוד לשמור. · בדיקת שיחה () במקום skip_to () על ענף אופציונלי של AND_MAYBE. backend צור: · תיקון באג ב TermIterator :: skip_to () מעל מקשי מטה. backend מרחוק: · תקן Xapian-tcpsrv אפשרות --interface לעבודה על MacOS X (כרטיס # 373). · Typo תקן שגרמו לנו להחזיר את docid במקום המשקל המרבי מסמך ממשחק מרחוק יכול לחזור! זה עלול היה להוביל לתוצאות הלא נכון בעת חיפוש במסדי נתונים מרובים עם backend מרחוק, אבל כנראה בדרך כלל לא משנה כמו עם BM25 את המשקולות הם קטנים בדרך כלל (לעתים קרובות כל <1) בעוד docids הם בהכרח> = 1. backend inmemory: · החלק העורפי inmemory אינו תומך ולביקורות מעל מקשי מטה. ניסיון לעשות זאת נהגה לתת איטרציה ריקה, אבל תוקן לזרוק · UnimplementedError (ו מגבלה זו כעת הועד). מערכת לבנות: · סר הרבה תכלילים כותרת בשימוש וכמה קוד בשימוש שאמורה להפוך לבנות מהר קצת יותר קטן. · תקן לקמפל תחת --disable-backend-צור, --disable-backend-מרחוק, ואת --disable-backend-inmemory. · אין להסיר שום מקורות מובנה "לְטַהֵר" אפילו תחת --make-מתחזק במצב כמו זה הפסקות מיתוג עץ הרחק-mode מתחזק עם: להפוך distclean; Configure ./ · להגדיר: אפשר יותר אזהרות GCC - "-Woverloaded-וירטואלית" עבור כל הגירסאות, "-Wstrict-null-סנטינל" עבור 4.0+, "-Wlogical-אופ-ההצהרות -Wmissing" עבור 4.3+. יש לציין "-Wmissing-בהצהרות" תפס כי consistency2 לא מתנהל. · כלפי פנים, לתקן המקומות הבודדים שבהם אנו עוברים std :: מחרוזת לפי ערך לעבור דרך ההפניה const במקום (למעט מקרים שבהם אנו זקוקים לעותק לשינוי בכל מקרה) כמו בהשוואות מופעים כי הפניה const הוא מעט מהר ומייצר פחות קוד עם Std נספר ההתייחסות של GCC :: יישום מחרוזת - עם אי-התייחסות נספרת יישום, פניית const צריכה להיות הרבה יותר מהר. (כרטיס # 140) תיעוד: · להתקין: אנחנו כבר לא סדיר לבנות מבחן עם GCC 2.95.4 ואנו מעלים את הגרסה המינימלית GCC נדרש 3.1 עבור 1.1.x. Xapian · מסמך מה עובר maxitems = 0 לשאול :: get_mset () עושה. · Docs / queryparser.html: להוסיף דוגמאות של שימוש בקידומת על ביטוי או subexpression. · תקציב Doxygen תגובות עבור משתמש Metadata פונקציות: מסד נתונים :: Get_metadata () לזרוק unimplementedError אבל writitingatata :: set_metadata () יכול. · מסמך מסד נתונים :: metadata_keys_begin () מחזירה כי iterator סוף אם backend לא תומך metadata. · פריצה: עדכון רשימת חבילות דביאן / אובונטו הדרושות לסביבת פיתוח. קוד באגים: · תקן לבנות עם באגים - באגים. הוסיפו עוד כמה טענות.


Xapian ואומגה תוכנה קשורה

Magarch Letterbox.

מסגרת קוד פתוח לארכיון ואחזור כמויות גדולות של מסמכים סטטיים ...

473

הורד

Wdb.

WDB הוא מערכת מסד נתונים שנועד לאחסן נתונים מטאורולוגיים, הידרולוגיים ואוקיאנוגרפיה (MHO). ...

178

הורד

Openpsa

חבילת תוכנה מבוססת אינטרנט עבור ייעוץ. ...

147

הורד