HTML Parser.הספרייה כדי לנתח תוכן HTML | |
הורד עכשיו |
HTML Parser. דירוג וסיכום
פרסומת
- רישיון:
- LGPL
- מחיר:
- FREE
- שם המפרסם:
- Derrick Oswald
- אתר האינטרנט של המוציא לאור:
- מערכות הפעלה:
- Mac OS X
- גודל הקובץ:
- 323 KB
HTML Parser. תגים
HTML Parser. תיאור
הספרייה לנתח תוכן HTML HTML Parser הוא קוד חינם קוד פתוח Java הספרייה המשמש לנתח HTML באופנה ליניארית או מקוננת. משמש בעיקר עבור טרנספורמציה או מיצוי, תכונות HTML מסננים, מבקרים, תגים מותאמים אישית וקל לשימוש Javabeans. זהו מהיר, חזק, נבדק היטב חבילה.האחרונהExtraction מקיף את כל תוכניות אחזור מידע שאינם אמורים לשמר את דף המקור. מכסה זה משתמש כמו: · מיצוי טקסט, לשימוש כמו קלט עבור טקסט מנוע החיפוש מסדי נתונים לדוגמה · קישור מיצוי, עבור זוחל באמצעות דפי אינטרנט או קציר כתובת דוא"ל Scraping, עבור קלט נתונים פרוגרמטיים מדפי אינטרנט · מיצוי משאבים, איסוף תמונות או צליל · קצה חזית דפדפן, השלב הראשוני של תצוגת הדף · בדיקת קישורים, הבטחת קישורים תקפים · ניטור אתרים, בדיקת הבדלי עמודים מעבר לפשוטטיסטים הם מספר מתקנים ב- HTMLABARSER CODEBASE כדי לעזור עם מיצוי, כולל מסננים, מבקרים ו JavaBeans. טרנספורמציה כוללת את כל העיבוד שבו הקלט והפלט הם דפי HTML. כמה דוגמאות הן: · כתובת האתר מחדש, שינוי חלק או כל הקישורים בדף · לכידת אתר, העברת תוכן מהאינטרנט לדיסק מקומי · צנזורה, הסרת מילים וביטויים של דפים, ניקוי HTML, תיקון דפים שגויים הסרת מודעות, מלקות כתובות אתר התייחסות לפרסום · המרה ל- XML, העברת דפי אינטרנט קיימים לדרישות XML: · ג 'אווה מה חדש במהדורה זו: · פרויקט HTMLArparser עודכן עם רישיון חדש, חדש לבנות סביבה, מאגר חדש ואתר אינטרנט חדש. כדי לזהות את השינוי הרדיקלי הזה, הגירסה הוחזרה ל -2.0. · בתגובה לבקשות מקהילת אפאצ'י, השתנתה הרישיון של HTMLPRSER מ - GNU ספריה או רישיון ציבורי כללי פחות, לרישיון ציבורי נפוץ יותר של Apache (http://opensource.org/licens/cpl1.0.txt) . · מאגר HTMLApperser השתנה מ CVS כדי חתרנות (http://subversion.tigris.org/). · לתמוך באינטגרציה אוטומטית בפרויקטים אחרים, סביבת הבנייה השתנתה מ- Ant ל- Maven 2 (http://maven.apache.org/). זה סיפק הזדמנות לעדכן את אתר האינטרנט (http://htmlparser.org).
HTML Parser. תוכנה קשורה