XML es el acrónimo de Extensible Markup Language, traducido como “Lenguaje de Marcado Extensible” o “Lenguaje de Marcas Extensibles”, es un metalenguaje de marcado que define un conjunto de reglas para la codificación de documentos, se puede aplicar en el análisis de datos o en la lectura de textos creados por computadoras o por personas.
Este metalenguaje fue desarrollado por el W3C en 1998 y, al igual que el HTML, funciona con apertura <x> y cierre de etiquetas </x>, pero a diferencia de este, XML es personalizable ya que proviene del lenguaje SGML y permite definir la gramática de lenguajes específicos para estructurar documentos grandes.
A diferencia de otros lenguajes, XML da soporte a bases de datos, siendo útil cuando varias aplicaciones deben comunicarse entre sí o integrar información y/o se puede utilizar como estándar de intercambio de información estructurada entre diferentes plataformas en bases de datos, editores de texto, hojas de cálculo, etc. De es metalenguaje deriva el RSS
Un archivo XML se divide en dos partes:
- Prolog consiste en metadatos administrativos, como declaración XML, instrucción de procesamiento opcional, declaración de tipo de documento y comentarios.
- Body se compone de dos partes: estructural y de contenido
Aplicación en el periodismo
El XML ha estado presente desde que el periodismo comenzó a integrarse con el mundo digital El periodismo actual necesita una variedad de programas y aplicaciones para la búsqueda de información y la realización de noticias en sistemas digitales.
El marcado de texto, además de describir semánticamente los contenidos, características y entorno de cada documento, se puede describir también la estructura de cada documento, por distinta que sea. Pero también se puede aprovechar la definición de esa estructura, la distinción de las partes del documento, para asignar una descripción semántica a cada una de esas partes: en este caso, a cada documento, pieza, objeto o seudopieza, e incluso a fragmentos muy pequeños dentro del texto, si es preciso. (Rodíguez, 2007, p.176)
Ej:
<noticia>
<personaje nombre=”Raúl González Blanco”>
Raúl </personaje> sufre una <lesión> rotura de ligamento </lesión>
</noticia>
El marcado semántico, por lo tanto, puede ser considerado también desde el punto de vista de la estructura de un documento, es decir, sobre a qué parte o partes de la estructura de un documento se le aplica. Visto así, pueden utilizarse tres posibilidades o modelos para la asignación física de la información semántica respecto a la estructura del texto que se pretende describir. (Rodíguez, 2007, p.176)
Hoy, los periodistas, y el público en general, tienen un arma poderosa para que cualquier información de cualquier ámbito, que venga de cualquier sitio web, llegue sin mucho esfuerzo y el XML sirve para representar documentos de manera estructurada en la web, de modo que esa información pueda ser almacenada, sintetizada, transmitida, procesada, visualizada e impresa por diversos tipos de aplicaciones y dispositivos, su uso puede ser tanto en la clasificación sencilla en documentos, así como en algo mucho más avanzado como la creación de nuevos lenguajes con XML que facilitan el trabajo con metadatos y marcado de contenidos en los documentos periodísticos y facilitan su búsqueda y manipulación.
Ejemplos en el periodismo
En el periodismo de datos: con XML puede definirse un lenguaje propio para documentos con metadatos periodísticos, que incluyan un elemento con el metadato del título y el autor del documento (Rodríguez, 2007, p.201)
Fuentes
https://rockcontent.com/es/blog/que-es-xml/
https://uvaciberperiodismo.wordpress.com/2019/04/11/los-archivos-xml/
Rodríguez, D. (2007). Aplicaciones de XML para la documentación periodística : efectos sobre los centros de documentación de prensa. Recuperado de https://e-archivo.uc3m.es/handle/10016/658
Antón, A. (2013). El periodismo de datos y la web semántica. Recuperado de https://revistas.ucm.es/index.php/CIYC/article/download/41718/39756/0