XML til ASCII Conversion

En sjef fordel med XML er at det tillater deg å merke data og utgang (eller transform) element innhold til ett av en rekke formater, inkludert ren tekst (ASCII). Selv om dette kan gjøres programmatisk, er XSL transformasjon utviklet spesielt for dette formålet. De viktigste utfordringene i å skape en feilfri konvertering er todelt: å få riktige data fra XML-kodet dokument; og håndtering av spesialtegn.

XML Schema

XML er per definisjon strukturert informasjon. Mange XML-dokumenter definere en formell skjema som beskriver hvordan XML-elementer kan brukes. I praksis fungerer skjemaet som et veikart til XML-dokument. Så det første trinnet er å analysere skjema og kartlegge dine elementer til deres ASCII kolleger. Dette kan være en enkel sak å trekke ut data direkte fra et element innhold. Vær imidlertid oppmerksom på at et element attributter kan også inneholde viktige data, for eksempel en database rekordmange som må inkluderes i konverteringen.

implisitt Schema

Når ingen formell Skjemaet er anordnet, er strukturen av XML-dokumentet likevel underforstått. Dette gjør det mulig å rekonstruere skjemaet. En god strategi i dette tilfellet er å undersøke de elementer i dokumentet ditt eksempel og skrive ut et skjema som håndterer alle forekomster i dokumentet.

tegnsett

Det er mange tegnsett for å dekke de spesialiserte tegn som brukes på forskjellige språk rundt om i verden. ASCII tegnsett spesifikt refererer tekst for det engelske språket. Ifølge Richard Ishida av World Wide Web Consortium, "Unicode tegnsett inneholder tegn for de fleste av de levende språk og alfabeter i verden." (Http://www.w3.org/International/getting-started/characters.) For å unngå potensielle problemer, er en god praksis å bruke Unicode UTF-8 tegnsett når du gjør dine konverteringer.

Entities

XML definerer et lite sett med tegn, kalt forhåndsdefinerte enheter. Disse enhetene inkluderer tegnene for tegnet og semikolon, som har spesifikke bruksområder i XML og er derfor begrenset. For å komme rundt dette, må du unnslippe disse tegnene. For eksempel må du bruke "& amp;" å representere-tegnet i XML. Vær oppmerksom på disse og andre spesielle rømte tegn i dataene.