Artículo para el Foro por el grupo D

2008-01-16 12:38:33
XML, sigla en inglés de Extended Markup Language («lenguaje de marcas extensible»), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.Su desarrollo se comenzó en 1996 y la primera versión salió a la luz el 10 de febrero de 1998. La primera definición que apareció fue: Sistema para definir validar y compartir formatos de documentos en la web. Durante el año 1998 XML tuvo un crecimiento exponencial, con apariciones en medios de comunicación, menciones en páginas web, soporte software, etcCaracterísticas generales.

  • Directamente utilizable en Internet
  • Soporte para una amplia variedad de aplicaciones para transferencia de datos
  • Compatible con SGML
  • Posibilidad de crear sencillos procesadores de XML
  • Documentos XML legibles y medianamente claros (depende de la definición)
  • Diseño rápido del lenguaje
  • Simple, pero perfectamente formalizado
  • Documentos XML fáciles de crear

Es importante mencionar, por último, las ventajas que ha supuesto la creación del XML:

  • Es extensible, lo que quiere decir que una vez diseñado un lenguaje y puesto en producción, igual es posible extenderlo con la adición de nuevas etiquetas de manera de que los antiguos consumidores de la vieja versión todavía puedan entender el nuevo formato.
  • El analizador es un componente estándar, no es necesario crear un analizador específico para cada lenguaje. Esto posibilita el empleo de uno de los tantos disponibles. De esta manera se evitan bugs y se acelera el desarrollo de la aplicación.
  • Si un tercero decide usar un documento creado en XML, es sencillo entender su estructura y procesarlo. Mejora la compatibilidad entre aplicaciones

Las consecuencias inmediatas del sistema que tratamos son la aparición de la Web 2.0, o el desarrollo de sistema como por ejemplo el TEI.

Fuentes

XML y Literatura = TEI

Las siglas del Consorcio TEI (2000) corresponden a Text Encoding Initiative; lanzado en 1987 por la Association for Computers and the Humanities (ACH), The Association for Computational Linguistics (ACL) y The Association for Literary and Linguistic Computing (ALLC), y con la participación de investigadores de todas las disciplinas de las humanidades, intentaba producir un estándar basado en la comunidad para la codificación y el intercambio de textos, independiente de hardware y software.

El esquema de codificación de TEI está diseñado para ser práctico y puede aplicarse gradualmente: los usuarios pueden elegir codificar tanto o tan poco como quieran. Además es muy modular: el diseñador de la DTD puede elegir cómo combinar las tagsets disponibles, y los elementos individuales pueden ser renombrados, omitidos o modificados, sometidos a restricciones, quedando sujetos sólo a simples restricciones de arquitectura.

Un texto electrónico ajustado a TEI está codificado generalmente como un elemento <TEI.2>, que contiene dos elementos: <teiHeader> y <text>, todo ello precedido de una declaración de tipo de documento, referencia explícita al archivo externo que contiene la DTD que se aplicará al texto por el parser SGML o XML. El encabezado <teiHeader> contiene información similar a la de la portada de un texto impreso, pero relativa al documento electrónico, que identifica el texto electrónico y puede también documentar las prácticas de codificación seguidas en su creación. El texto <text> contiene el texto propiamente dicho, y puede ser individual o compuesto. Están divididos en materia inicial (front matter), cuerpo (body) y materia final (back matter), etiquetados respectivamente <front>, <body> (o <group>), y <back>.

Con ello podemos ver como la nueva tecnología está creando diferentes métodos de trabajo a la hora de trabajar con ordenadores y literatur. De una forma sencilla, sin mucha complicación, podemos realizar distintos escritos.

Recursos:

Twelve years since the first XML

XML abbreviation stands for Extensible Markup Language,which describes a class of data objects called XML documents and partially describes the behavior of computer programs which process them.

It was developed by what is called a XML Working Group which was formed under the auspices of the WWW Consortium in 1996.

Some of the design goals for XML are:

  1. It shall be straightforwardly usable over the Internet.
  2. It shall support a wide variety of applications.
  3. It shall be compatible with SGML.
  4. It shall be easy to write programs which process XML documents.
  5. The XML design should be prepared quickly.
  6. XML documents shall be easy to create.
  7. Terseness in XML markup is of minimal importance.

This points helps us to understand better the XML 1.0., but we can’t forget that now 2.0 Web does already exist, and construct computer programs to process it.

By construction, XML documents are conforming SGML (Standard Generalized Markup Language ) documents.Each XML document has both a logical and a physical structure. Physically, the document is composed of units called entities. An entity may refer to other entities to cause their inclusion in the document. A document begins in a “root” or document entity. Logically, the document is composed of declarations, elements, comments, character references, and processing instructions, all of which are indicated in the document by explicit markup.

Sources: