Unicode :: Map8.

Unicode :: Map8 הוא שולחן מיפוי בין 8 סיביות תווים Unicode.
הורד עכשיו

Unicode :: Map8. דירוג וסיכום

פרסומת

  • Rating:
  • רישיון:
  • Perl Artistic License
  • מחיר:
  • FREE
  • שם המפרסם:
  • Gisle Aas
  • אתר האינטרנט של המוציא לאור:
  • http://search.cpan.org/~gaas/

Unicode :: Map8. תגים


Unicode :: Map8. תיאור

Unicode :: Map8 טבלת מיפוי בין 8 סיביות תווים ו Unicode. Unicode :: Map8 טבלת מיפוי בין 8 סיביות תווים ו Unicode.SYNOPSIS דורש Unicode :: Map8; no_map $ שלי = Unicode :: Map8-> חדשות ( "ISO646-NO") || לָמוּת; $ שלי l1_map = Unicode :: Map8-> חדשות ( "לטינית 1") || לָמוּת; שלי $ USTR = $ no_map-> to16 ( "V} מחדש Norske tegn ב | r {resn"); שלי $ lstr = $ l1_map-> to8 ($ USTR); להדפיס $ lstr; להדפיס $ no_map-> טואו ( "V} מחדש Norske tegn ב | r {resn") -> ערכות תווים utf8The Unicode :: Map8 בכיתה ליישם טבלאות מיפוי יעיל בין 8 סיביות אופי סטים 16 ביט כמו Unicode. הטבלאות יעילים הן מבחינת שטח שהוקצה ומהירות התרגום. 16 סיביות מחרוזות ההנחה היא בשיטות הבאות order.The בייט רשת השימוש זמינים: $ מ = Unicode :: Map8-> חדשות () הבנאי אובייקט יוצר מקרים חדשים של המעמד Unicode :: Map8. הייתי לוקח ויכוח פומבי המציינים אז שם של ערכת תווים 8 סיביות לאתחל מיפויים מ. הטיעון יכול להיות גם שם של קובץ מיפוי. אם charset / קובץ לא ניתן לאתר, ואז חוזר בנאי undef.If תשמיט את הטענה, אז שולחן מיפוי ריק בנוי. לאחר מכן, עליך להוסיף זוגות מיפוי אליו באמצעות addpair (שיטה) כמתואר להלן $ m-> addpair (U8 $, u16 $);. מוסיף זוג המיפוי החדש לאובייקט מיפוי. זה לוקח שתי טענות. הראשון הוא ערך קוד סט 8 סיביות תו ואת השני הוא ערך הקוד המתאים בערכת התווים 16 הסיבית. כך גם קודים ניתן להשתמש מספר פעמים (אבל שימוש באותו זוג אין שום השפעה). ההגדרה הראשונה קוד הוא אחד כי הוא used.Consider בדוגמה הבאה: $ M-> addpair (0x20, 0x0020); M- $> addpair (0x20, 0x00A0); M- $> addpair (0xA0, 0x00A0); זה אומר כי אופי 0x20 ו 0xA0 ב charset 8 סיביות ממפה לעצמם בקבוצה 16 סיביות, אבל בסופו של ערכת תווים 16 סיביות 0x0A0 מפות כדי 0x20 $ מ '. -> default_to8 ($ U8) קבע את הקוד של תו ברירת המחדל לשימוש כאשר המיפוי מ- 16 סיביות למחרוזות 8 סיביות. אם אין זוג מיפוי מוגדר עבור דמות אז ברירת המחדל היא מחליפה ידי to8 () ו recode8 (). $ M-> default_to16 (u16 $) קבע את הקוד של תו ברירת המחדל לשימוש כאשר מיפוי מ 8 סיביות ל 16 מחרוזות -בתים. אם אין זוג מיפוי מוגדר עבור דמות אז ברירת המחדל הזה משמש to16 (), tou () ו recode8 () $ m-> nostrict;. כל undefined מיפויים מוחלפים עם מיפוי זהות. אופי מוגדר בדרך כלל הם פשוט מורידים (או חליף עם ברירת המחדל אם מוגדר) בעת ההמרה בין ערכות תווי $ m-> to8 ($ USTR);. ממירת מחרוזת תו 16 סיבית למחרוזת המתאימה בערכת התווים 8 הסיבית. $ m-> to16 ($ str); ממירה מחרוזת תו 8 סיביות למחרוזת המתאים בערכת התווים 16 סיביות $ m-> טואו ($ str);. Same to16 () אבל להחזיר Unicode :: אובייקט String במקום מחרוזת UCS2 רגיל $ m-> recode8 (m2 $, $ str);. מפה את str מחרוזת $ מ ערכת תווים 8-ביט אחד ($ מ ') עוד אחד (m2 $). מכיוון שאנו מניחים שאנחנו יודעים את המיפויים לקראת 16 סיביות הנפוצים קידוד נוכל להשתמש בזה כדי להמיר בין כל מערכות תווים 8 סיביות. $ M-> to_char16 ($ U8) מפות קוד תו 8-ביט בודד ל 16 קוד -בתים. אם התו 8 הסיבי הוא ממופה אז NOCHAR מתמיד מוחזר. ברירת המחדל היא לא בשימוש שיטת התקשרות אינו מופעל. $ M-> to_char8 (u16 $) מפות קוד תו בודד 16 סיביות ל קוד 8 סיביות. אם התו 16 הסיבי הוא ממופה אז NOCHAR מתמיד מוחזר. ברירת המחדל הוא לא בשימוש שיטת ההתקשרות לא invoked.The בא שיטות התקשרות זמינות. אתה יכול לעקוף שיטות אלה על ידי יצירת תת של Unicode :: Map8. $ M-> unmapped_to8When מיפוי מחרוזת 8 סיביות אופי ואין מיפוי מוגדר (ולא ברירת המחדל גם), אז שיטה זו נקראת כמוצא האחרון. זה נקרא עם טיעון שלם בודד המהווה את הקוד של תו 16 הסיבי הממופה. צפוי לחזור מחרוזת תשולב במחרוזת 8 הסיבית. גרסת ברירת המחדל של שיטה זו תמיד מחזירה string.Example ריק: חבילת MyMapper; @ ISA = QW (Unicode :: Map8); תת unmapped_to8 {שלי ($ עצמיים, $ הקוד) = @_; דורשים Unicode :: CharName; ""; } $ M-> unmapped_to16Likewise כאשר מיפוי מחרוזת תווים 16 סיביות ולא מיפוי מוגדר אז שיטה זו נקראת. זה אמור להחזיר מחרוזת 16 סיבית עם הבתים כדי בייט ברשת. גרסת ברירת המחדל של שיטה זו תמיד מחזירה מחרוזת ריקה. דרישות: · פרל


Unicode :: Map8. תוכנה קשורה