Enkonduko en la aŭtomatan daten-prilaboradon

Kodado de datenaj tipoj: Aranĝitaj ("formatigitaj") tekstoj

Tipografia aranĝo de tekstoj koncernas la uzon de diversaj signograndecoj kaj litertipoj (serifaj, sen-serifaj; grasaj, oblikvaj, kursivaj) kaj la dismeton al paragrafoj, kolumnoj, tabeloj ktp.

Ekzistas multaj metodoj por stori tiajn aranĝojn; neniu metodo povas nomiĝi vera normo. Distingendas du klasoj de metodoj: tipografiaj metodoj kaj markaj (enhavaj) metodoj. Tipografiaj metodoj precize preskribas kiel aranĝi la tekstpartojn; enhavaj metodoj nur markas, al kiu enhava speco apartenas la tekstpartoj (titolo, tekstokorpo, piednoto, ktp.) kaj lasas al iu programo la decidon, kiel aranĝi ilin. Ekzemplo de tia marka lingvo estas HTML, uzata en la TTT-aj hipertekstoj.

La manko de normigita stormetodo kaŭzas, ke aranĝitaj tekstoj ofte estas dependaj de la programo, per kiu ili estis produktitaj. Se tiu programo ne plu estas disponebla, povas esti, ke la teksto fariĝas senvalora.

Formatigitaj tekstoj kodas krom la signo-vicoj ankaŭ la informon, en kiu grandeco kaj per kiu tiparo (grasa, kursiva, ktp.) la signoj estu presentataj.

Por reprezenti formatigitajn tekstojn ekzistas du bazaj metodoj:

  1. Markado: la teksto enhavas markajn elementojn, kiuj indikas, kiuj estas la roloj de la tekst-pecoj; ili eĉ povas indiki, kiel prezenti la signojn. Ekzemploj:
    1. HTML
    2. Tekstprilaboraj programoj kiaj WordPerfect, Word ktp. kodas la markajn elementojn per ne-preseblaj signoj (reg-signoj). Kaj tiuj signoj kaj la kodado de etno-lingvaj signoj kaj ne-latinaj signaroj estas proprietaj, tio estas specifaj por la koncerna programo.
  2. Tipografia kodado (paĝo-deskripto): Ĝi preskribas ekzakte, kie kaj kiel ĉiu signoj estu presita sur la paperon.
    La plej konata el la tipografiaj formatoj nomiĝas PostScript. Modernaj presiloj kapablas rekte interpreti ĝin, tio signifas, ke eblas sendi al ili PostScript-ajn dosierojn, kiujn ili senpere komprenas kaj presas.
    PostScript nun estas, precipe por Uniksaj komputiloj, la plej ofte uzata formato por komunikado inter komputiloj kaj presiloj: Se oni generas pres-taskon el aplika programo, ofte la presota dosiero estas transformata al la formato PostScript kaj tiel sendata al la presilo. Se oni elektas la instrukcion "presu al dosiero", plej ofte rezultas dosiero en PostScript (ĉe Microsoft-aplikoj kun la sufikso "prn", ĉe WordPerfect ofte kun la sufikso "dsk"). Tiajn PostScript-dosierojn eblas rigardi per la programo ghostscript kaj post kontrolo sendi al la presilo.
    Alia daten-aranĝo por tipografie koditaj tekstoj estas PDF, nun multe uzata, ĉar firmao Adobe senkoste disdonas vidigilojn por PDF. PDF esence estas plu-evoluigaĵo de PostScript, kapabla kodi ekzemple kolorajn bildojn.

Specimenaj demandoj