
Processament de fitxers XML

Sovint ens pot interessar emmagatzemar objectes sencers per poder-los recuperar en qualsevol moment. Aquí veurem bàsicament dues maneres diferents d’aconseguir fer-los persistents.

  1. Podem seriar-los usant les eines específiques que Java té per convertir qualsevol objecte en una sèrie de bytes.
  2. També podem convertir els objectes persistents en una jerarquia XML capaç d’emmagatzemar les dades bàsiques i les relacions establertes entre objectes.

En el primer cas, ja hem vist com fer servir la interfície Serializable. Recordem que per tal que un objecte pugui ser seriat cal que la seva classe i tot el seu contingut implementin la interfície Serializable. Es tracta d’una interfície sense mètodes, perquè l’únic objectiu de la interfície és actuar de marcador per indicar a la màquina virtual quines classes es poden seriar i quines no.

Ara veurem com convertir els objectes persistents en una jerarquia XML capaç d’emmagatzemar les dades bàsiques i les relacions establertes entre objectes. Quan es volen emmagatzemar dades que hagin de ser llegides per aplicacions executades en múltiples plataformes serà necessari recórrer a formats més estandarditzats, com ara els llenguatges de marques.

Els documents XML aconsegueixen estructurar la informació intercalant un seguit de marques anomenades etiquetes. En XML, una etiqueta pot contenir altres etiquetes o bé informació textual. D’aquesta manera, aconseguirem subdividir la informació estructurant-la de forma que pugui ser fàcilment interpretada.

El llenguatge XML (eXtended Markup Language) té molta utilitat:

No obstant això, des d’un punt de vista a “alt nivell” XML no és un fitxer de text qualsevol. Calen eines específiques (llibreries) per accedir i manipular aquest tipus d’arxius de manera potent, flexible i eficient. Així:

Analitzadors sintàctics o parsers

Les eines que llegeixen el llenguatge XML i comproven si el document és vàlid sintàcticament s’anomenen analitzadors sintàctics o parsers. Un parser XML és un mòdul, biblioteca o programa encarregat de transformar el fitxer de text en un model intern que optimitza el seu accés. Per XML ha un gran nombre de parsers o analitzadors sintàctics disponibles per dos dels models més coneguts: DOM i SAX, encara que existeixen molts altres.

Una classificació de les eines per a l’accés a fitxers XML és la següent:

A continuació es descriu l’accés a dades amb les tecnologies més esteses: DOM, SAX i JAXB.


La llibrería DOM

DOM és un analitzador jeràrquic que guarda totes les dades de XML en memòria dins una estructura jeràrquica. És ideal per a aplicacions que requereixin una consulta contínua de les dades.

El format de l’estructura on s’emmagatzema la informació a la memòria RAM ha estat especificat per l’organisme internacional W3C (World Wide Web Consortium) i s’acostuma a conèixer com a DOM (Document Object Model). És una estructura que HTML i Javascript han popularitzat molt i es tracta d’una especificació que Java materialitza en forma d’interfícies. La principal s’anomena Document i representa tot un document XML.

L’estàndard W3C defineix l’especificació de la classe DocumentBuilder amb el propòsit de poder instanciar estructures DOM a partir d’un XML. La classe DocumentBuilder és una classe abstracta, i per tal que es pugui adaptar a les diferents plataformes, pot necessitar fonts de dades o requeriments diversos. Recordeu que les classes abstractes no es poden instanciar de forma directa. Per aquest motiu, el consorci W3C especifica també la classe DocumentBuilderFactory.

Les instruccions necessàries per llegir un fitxer XML i crear un objecte Document serien les següents:

DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(new File("fitxer.xml"));

DocumentBuilder també instancia objectes Document buits que podran ser manipulats a posteriori.

DocumentBuilderFactory dbfac = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = dbfac.newDocumentBuilder();
Document doc = docBuilder.newDocument();

L’escriptura de la informació continguda al DOM es pot seqüenciar en forma de text fent servir una altra utilitat de Java anomenada Transformer. Es tracta d’una utilitat que permet realitzar fàcilment conversions entre diferents representacions d’informació jeràrquica. És capaç, per exemple, de passar la informació continguda en un objecte Document a un fitxer de text en format XML. També seria capaç de fer l’operació inversa, però el mateix DocumentBuilder ja s’encarrega d’això.

Transformer és també una classe abstracta i requereix d’una factory per poder ser instanciada. La classe Transformer pot treballar amb multitud de contenidors d’informació perquè en realitat treballa amb un parell de tipus adaptadors (classes que fan compatibles jerarquies diferents) que s’anomenen Source i Result. Les classes que implementin aquestes interfícies s’encarregaran de fer compatible un tipus de contenidor específic al requeriment de la classe Transformer.

El codi bàsic per realitzar una transformació de DOM a fitxer de text XML seria el següent:

// Creació d'una instancia Transformer
Transformer transformer = TransformerFactory.newInstance().newTransformer();
// Creació dels adaptadors Source i Results a partir d'un Document i un File.
StreamResult result = new StreamResult(file);
DOMSource source = new DOMSource(doc);
transformer.transform(source, result);

Els programes Java que utilitzen DOM necessiten aquestes interfícies:

Tipus de nodes

A continuació es mostra una llista d’alguns tipus de nodes importants:

Tipus Descripció
Attr Representa un atribut en un objecte Element
CDATASection escapa dels blocs de text que contenen caràcters que, d’altra manera, es considerarien com a marcatge
Comment Representa el contingut d’un comentari
Document Representa tot el document HTML o XML
DocumentFragment un objecte Document lleuger o mínim que s’utilitza per representar parts d’un document XML més grans que un sol node
Element Són branques bàsiques d’un arbre DOM; la majoria de nodes excepte el text són elements
Node El tipus de dades principal per a tot el DOM i cadascun dels seus elements
NodeList Una col·lecció ordenada d’objectes tipus Node
Text Representa el contingut textual (anomenat dades de caràcters en XML) d’un Element o Attr

En resum, la tecnologia DOM (Document Object Model) és una interfície de programació que permet analitzar i manipular dinàmicament i de manera global el contingut, l’estil i l’estructura d’un document. Per treballar amb un document XML primer s’emmagatzema en memòria en forma d’arbre amb nodes pare, nodes fill i nodes finals que són aquells que no tenen descendents.

Un cop creada en memòria aquesta estructura, els mètodes de DOM permeten recórrer els diferents nodes de l’arbre i analitzar a quin tipus particular pertanyen. En funció del tipus de node, la interfície ofereix una sèrie de funcionalitats o altres per poder treballar amb la informació que contenen.

DOM ofereix una manera d’accedir a documents XML tant per ser llegit com per ser modificat. El seu únic inconvenient és que a l’arbre DOM es crea tot en memòria principal, de manera que si el document XML és molt gran, la creació i manipulació de DOM seria intractable. Per poder treballar amb DOM en Java necessitem les classes i interfícies que componen el paquet org.w3c.dom i el paquet javax.xml.parsers. Aquestes classes ofereixen mètodes per carregar documents des d’una font de dades.

Conté dues classes fonamentals:

DOM no defineix cap mecanisme per generar un fitxer XML a partir d’un arbre DOM. Per això farem servir el paquet javax.xml.transform que permet especificar una font i un resultat.

Estructura DOM

L’estructura DOM pren la forma d’un arbre, on cada part de XML s’hi trobarà representada en forma de node. En funció de la posició en el document XML, parlarem de diferents tipus de nodes. El node principal que representa tot un XML sencer s’anomena document, i les diverses etiquetes, inclosa l’etiqueta arrel, es coneixen com a nodes element. El contingut textual d’una etiqueta s’instancia com a node de tipus TextElement i els atributs com a nodes de tipus Attribute.

Cada node específic disposa de mètodes per accedir a les seves dades concretes (nom, valor, nodes fills, node pare, etc.).

El DOM resultant obtingut des d’un XML acaba sent un còpia exacta del fitxer, però disposat de diferent manera. Tant al XML com al DOM hi haurà informació no visible, com ara els retorns de carro, que cal tenir en compte per tal de saber processar correctament el contingut i evitar sorpreses poc comprensibles.

La interfície Document contempla un conjunt de mètodes per seleccionar diferents parts de l’arbre a partir del nom de l’etiqueta o d’un atribut identificador. Les parts de l’arbre es retornen com a objectes Element, els quals representen un node i tots els seus fills. D’aquesta manera, podrem anar explorant parts de l’arbre sense necessitat d’haver de passar per tots el nodes.

Els objectes Element disposen de mètodes per afegir nous fills (appendChild) o assignar el valor a un atribut (setAtributte). També permeten la consulta del valor dels atributs (getAttributte) o la navegació pels nodes de l’arbre (getParentNode, per obtenir el pare; getFirstChild | getLastChild, per obtenir el primer darrer fill, o getNextSibling per navegar de germà en germà).

L’objecte Document farà de factory per a qualsevol node del document. La creació de nous elements (etiquetes) implicarà l’ús de createElement. Si volem crear contingut textual caldrà cridar el mètode createTextNode, i si el que volem són comentaris cridarem createComment.

La creació de nodes no implica la ubicació d’aquest dins l’arbre. És a dir, a més de crear-los caldrà assignar-los a un pare usant appendChild.

Analitzar un document amb DOM Parser

A continuació es mostren els passos que s’utilitzen per analitzar un document amb DOM Parser.

import org.w3c.dom.*;
import javax.xml.parsers.*;
import java.io.*;

Create a DocumentBuilder

DocumentBuilderFactory factory =DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();

Create a Document from a File or Stream

StringBuilder xmlStringBuilder = new StringBuilder();
xmlStringBuilder.append("<?xml version="1.0"?> <class> </class>");
ByteArrayInputStream input = new ByteArrayInputStream( xmlStringBuilder.toString().getBytes("UTF-8"));
Document doc = builder.parse(input);

Extract the root element

Element root = document.getDocumentElement();

Examine attributes

// Returns specific attribute
// Returns a Map (table) of names/values

Examine sub-elements

// Returns a list of subelements of specified name
// Returns a list of all child nodes

Examples DOM

Example: Parsing a document using DOM

Here is the input xml file we need to parse:

<?xml version="1.0"?>
  <student rollno="393">
  <student rollno="493">
  <student rollno="593">
    <firstname>Jose Luis</firstname>

Here is the code we execute:

package net.xeill.elpuig;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

public class DOMParserDemo {
  public static void main(String[] args) {
    try {
      File inputFile = new File("input.txt");

      DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
      DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
      Document document = documentBuilder.parse(inputFile);


      System.out.println("Root Element: " + document.getDocumentElement().getNodeName());

      NodeList nodeList = document.getElementsByTagName("student");

      for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);

        System.out.println("\nCurrent Element: " + node.getNodeName());
        if (node.getNodeType() == Node.ELEMENT_NODE) {
          Element element = (Element) node;
          System.out.println("Student roll no: " + element.getAttribute("rollno"));
          System.out.println("First name: " + element.getElementsByTagName("firstname").item(0).getTextContent());
          System.out.println("Last name: " + element.getElementsByTagName("lastname").item(0).getTextContent());
          System.out.println("Nickname: " + element.getElementsByTagName("nickname").item(0).getTextContent());
          System.out.println("Marks: " + element.getElementsByTagName("marks").item(0).getTextContent());

    } catch (Exception e) {

This would produce the following result:

Root Element: class

Current Element: student
Student roll no: 393
First name: Gerard
Last name: Paulino
Nickname: gpaulino
Marks: 85

Current Element: student
Student roll no: 493
First name: Adrià
Last name: Lora
Nickname: alora
Marks: 95

Current Element: student
Student roll no: 593
First name: Jose Luis
Last name: Polonio
Nickname: jpolonio
Marks: 90

Example: DOM Parser - Query XML Document

Here is the input xml file we need to query:

<?xml version="1.0"?>
    <supercars company="Ferrari">
        <carname type="formula one">Ferrari 101</carname>
        <carname type="sports car">Ferrari 201</carname>
        <carname type="sports car">Ferrari 301</carname>
    <supercars company="Lamborgini">
        <carname>Lamborgini 001</carname>
        <carname>Lamborgini 002</carname>
        <carname>Lamborgini 003</carname>
    <luxurycars company="Benteley">
        <carname>Benteley 1</carname>
        <carname>Benteley 2</carname>
        <carname>Benteley 3</carname>
package net.xeill.elpuig;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

public class QueryXMLFileDemo {
  public static void main(String[] args) {
    try {
      File inputFile = new File("cars.xml");

      DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
      DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
      Document document = documentBuilder.parse(inputFile);


      System.out.println("Root Element: " + document.getDocumentElement().getNodeName());

      NodeList nodeList = document.getElementsByTagName("supercars");

      for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);

        System.out.println("\nCurrent Element: " + node.getNodeName());
        if (node.getNodeType() == Node.ELEMENT_NODE) {
          Element element = (Element) node;
          System.out.println("Company: " + element.getAttribute("company"));

          NodeList carNameList = element.getElementsByTagName("carname");

          for (int j = 0; j < carNameList.getLength(); j++) {
            Node c = carNameList.item(j);

            if (c.getNodeType() == Node.ELEMENT_NODE) {
              Element car = (Element) c;
              System.out.println("car name: "+car.getTextContent());
              System.out.println("car type: "+car.getAttribute("type"));

    } catch (Exception e) {

This would produce the following result:

Root Element: cars

Current Element: supercars
Company: Ferrari
car name: Ferrari 101
car type: formula one
car name: Ferrari 201
car type: sports car
car name: Ferrari 301
car type: sports car

Current Element: supercars
Company: Lamborgini
car name: Lamborgini 001
car type:
car name: Lamborgini 002
car type:
car name: Lamborgini 003
car type:

Example: DOM Parser - Create XML Document

Here is the XML we need to create:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<CFGS familia="Informatica">
<cicle id="ASIX">Administració de Sistemes Informàtics i Xarxes</cicle>
<cicle id="DAM">Desenvolupament d'Aplicacions Multiplataforma</cicle>
package net.xeill.elpuig;

import org.w3c.dom.*;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;

public class CreateXMLFileDemo {
  public static void main(String[] args) {
    try {

      DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
      DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
      Document document = documentBuilder.newDocument();

      // Root element
      Element rootElement = document.createElement("FP");

      // grau element
      Element grauSuperior = document.createElement("CFGS");

      // Setting attribute to element
      Attr attr = document.createAttribute("familia");

      // Create element
      Element nouElement = document.createElement("cicle");
      Attr attrType = document.createAttribute("id");
      nouElement.appendChild(document.createTextNode("Administració de Sistemes Informàtics i Xarxes"));


      // Another element
      Element altreElement = document.createElement("cicle");
      Attr attrTypo = document.createAttribute("id");
      altreElement.appendChild(document.createTextNode("Desenvolupament d'Aplicacions Multiplataforma"));


      // Write the content into xml file
      TransformerFactory transformerFactory = TransformerFactory.newInstance();
      Transformer transformer = transformerFactory.newTransformer();

      DOMSource source = new DOMSource(document);
      StreamResult result = new StreamResult(new File("cicles.xml"));

      transformer.transform(source, result);

      // Output to console (testing)
      StreamResult consoleResult = new StreamResult(System.out);
      transformer.transform(source, consoleResult);

    } catch (Exception e) {

Example: DOM Parser - Modify XML Document

Here is the input XML file named luxury.xml we need to modify:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
   <supercars company="Ferrari">
      <carname type="formula one">Ferrari 101</carname>
      <carname type="sports">Ferrari 202</carname>
   <luxurycars company="Benteley">
      <carname>Benteley 1</carname>
      <carname>Benteley 2</carname>
      <carname>Benteley 3</carname>
package net.xeill.elpuig;

import org.w3c.dom.*;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;

public class ModifyXMLFileDemo {
  public static void main(String[] args) {
    try {

      File inputFile = new File("luxury.xml");

      DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
      DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
      Document document = documentBuilder.parse(inputFile);

      Node cars = document.getFirstChild();
      Node supercar = document.getElementsByTagName("supercars").item(0);

      // update supercar attribute
      NamedNodeMap namedNodeMap = supercar.getAttributes();
      Node nodeAttr = namedNodeMap.getNamedItem("company");

      // Loop the supercar child node
      NodeList nodeList = supercar.getChildNodes();

      for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);
        if (node.getNodeType() == Node.ELEMENT_NODE) {
          Element element = (Element) node;
          if ("carname".equals(element.getNodeName())) {
            if ("Ferrari 101".equals(element.getTextContent())) {
              element.setTextContent("Lamborgini 101");
            if ("Ferrari 201".equals(element.getTextContent())) {
              element.setTextContent("Lamborgini 202");

      // Loop the cars childNodes
      NodeList childNodes = cars.getChildNodes();
      for (int i = 0; i < childNodes.getLength(); i++) {
        Node node = childNodes.item(i);
        if ("luxurycars".equals(node.getNodeName())) {

      // Write the content to console (testing)
      TransformerFactory transformerFactory = TransformerFactory.newInstance();
      Transformer transformer = transformerFactory.newTransformer();
      DOMSource domSource = new DOMSource(document);

      System.out.println("-----------Modified File-----------");
      StreamResult consoleResult = new StreamResult(System.out);
      transformer.transform(domSource, consoleResult);

    } catch (Exception e) {

-----------Modified File-----------
<?xml version="1.0" encoding="UTF-8" standalone="no"?><cars>
    <supercars company="Lamborgini">
        <carname type="formula one">Lamborgini 101</carname>
        <carname type="sports">Ferrari 202</carname>


Example: Using methods to DOM parsing

<?xml version="1.0" encoding="UTF-8"?>
<Llibre publicat_en="1922">
<Autor>Hermann Hesse</Autor>
<Llibre publicat_en="1985">
<Titol>El perfum</Titol>
<Autor>Patrick Süskind</Autor>
<Llibre publicat_en="1947">
<Titol>Diari d'Anna Frank</Titol>
<Autor>Anne Frank</Autor>
package net.xeill.elpuig;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;

public class GestorDOMExample {

  // Objecte Document que emmagatzema el DOM de l'XML seleccionat
  Document document;

  public int loadFileIntoDOM(File file) {
    try {
      document = null;
      // Es crea un objecte DocumentBuilderFactory
      DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
      // Indica que el model DOM no ha de contemplar els comentaris que tingui el XML
      // Ignora els espais en blanc que tingui el document
      // ATENCIÓ: Si no es fa això els espais en blanc apareixen com a nodes.
      // Es crea un objecte DocumentBuilder per carregar-hi l'estructura
      // d'arbre DOM a partir del XML seleccionat.
      DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
      // Interpreta (parsea) el document XML (file) i genera el DOM equivalent
      document = documentBuilder.parse(file);
      // Ara document apunta a l'arbre DOM preparat per a ser recorregut
      return 0;
    } catch (Exception e) {
      return -1;

  public int addBookToDOM(String titol, String autor, String any) {
    try {
      // Es creen els nodes en l'estructura DOM apuntada per la variable document
      // Es crea el node de tipus Element amb nom títol (<titol>)
      Node nodeTitol = document.createElement("Titol");
      // Es crea un node de tipus Text amb el titol del llibre
      Node nodeTitolText = document.createTextNode(titol);
      // S'afegeix el Node de Text amb el titol com a fill de l'Element Titol

      // Fem el mateix per a autor
      Node nodeAutor = document.createElement("Autor");
      Node nodeAutorText = document.createTextNode(autor);

      // Es crea un Node de tipus Element (<Llibre>)
      Node nodeLlibre = document.createElement("Llibre");
      // Al nou llibre se li afegeix un atribut publicat_en
      ((Element) nodeLlibre).setAttribute("publicat_en", any);
      // S'afegeix a llibre un Node de tipus Text amb un \n per a que en obrir-lo amb un
      // editor de text cada node apareixi en un línia diferent
      // S'afegeix a llibre el node Titol
      // S'afegeix a llibre el node Autor
      // Finalment s'obté el primer node del document i s'afegeix com a fill seu el node
      // llibre que ja té penjant tots els seus fills i atributs creats abans
      Node nodeArrel = document.getChildNodes().item(0);
      // Una altra forma de cacular el node arrel.
      // Node nodeArrel = document.getFirstChild();
      return 0;
    } catch (Exception e) {
      return -1;

  public String getDOMInfo() {
    String[] nodeData = null;
    String result = "";
    Node node;
    // Obté el primer node del DOM
    Node rootNode = document.getFirstChild();
    // Obté una llista de nodes amb tots els nodes fill
    NodeList nodeList = rootNode.getChildNodes();
    // Processa els nodes fills
    for (int i = 0; i < nodeList.getLength(); i++) {
      node = nodeList.item(i);
      // En executar pas a pas aquest codi , s'observa com els nodes que
      // troba són de tipus 1 (ELEMENT_NODE) i de tipus 3 (TEXT_NODE).
      // Això és perquè en DOM tot element que té un node fill TEXT encara que estigui en BLANC
      if (node.getNodeType() == Node.ELEMENT_NODE) {
        // És un Node llibre que cal processar si és de tipus ELEMENT
        nodeData = processBook(node);

        result += "\n" + "Publicat l'any: " + nodeData[0];
        result += "\n" + "L'autor és: " + nodeData[1];
        result += "\n" + "El títol és: " + nodeData[2];
        result += "\n" + "--------------------";
    return result;

  protected String[] processBook(Node node) {
    String[] data = new String[3];
    Node tempNode = null;
    int counter = 1;
    // Obté el primer atribut de la llista d'atributs que té el node
    // (en el nostre exemple només hi ha un atribut)
    data[0] = node.getAttributes().item(0).getNodeValue();
    // Obté els fills del Llibre (títol i autor)
    NodeList nodeList = node.getChildNodes();
    for (int i = 0; i < nodeList.getLength(); i++) {
      tempNode = nodeList.item(i);
      // S'ha de comprovar que el tipus de Node que es vol tractar per que és
      // possible que hi hagi nodes de tipus TEXT que continguin
      // retorns de carro en canviar de línia en XML
      // En aquest exemple, quan es detecta un node que no és de tipus ELEMENT_NODE
      // és perquè és de tipus TEXT_NODE i conté els retorns de carro \n que
      // s'inclouen en el fitxer de text en crear el XML
      if (tempNode.getNodeType() == Node.ELEMENT_NODE) {
        // IMPORTANT: per a obtenir el text amb el títol i l'autor s'accedeix al
        // TEXT_NODE fill del nodeActual i s'agafa el seu valor
        data[counter] = tempNode.getChildNodes().item(0).getNodeValue();
    return data;

  public int saveDOMAsFile(File file) {

    // Write the content into an XML file
    try {
      // Prepare the transformation
      TransformerFactory transformerFactory = TransformerFactory.newInstance();
      Transformer transformer = transformerFactory.newTransformer();
      DOMSource domSource = new DOMSource(document);
      StreamResult streamResult = new StreamResult(file);
      // Execute the transform
      transformer.transform(domSource, streamResult);

      // Output to console (testing)
      System.out.println("\n## DOM saved as file in: "+file.getPath()+"\n");
      StreamResult consoleResult = new StreamResult(System.out);
      transformer.transform(domSource, consoleResult);

      return 0;
    } catch (Exception e) {
      return -1;

  public static void main(String[] args) {
    File inputFile = new File("booksInput.xml");
    File outpuFile = new File("booksOutput.xml");

    GestorDOMExample books = new GestorDOMExample();

    books.addBookToDOM("Parse XML files", "John Doe", "2021");

    System.out.println("## Printing DOM information:");


Al executar el programa la sortida de consola és la següent:

## Printing DOM information:

Publicat l'any: 1922
L'autor és: Siddharta
El títol és: Hermann Hesse
Publicat l'any: 1985
L'autor és: El perfum
El títol és: Patrick Süskind
Publicat l'any: 1947
L'autor és: Diari d'Anna Frank
El títol és: Anne Frank
Publicat l'any: 2021
L'autor és: Parse XML files
El títol és: John Doe

## DOM saved as file in: booksOutput.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?><Llibres>
    <Llibre publicat_en="1922">
        <Autor>Hermann Hesse</Autor>
    <Llibre publicat_en="1985">
        <Titol>El perfum</Titol>
        <Autor>Patrick Süskind</Autor>
    <Llibre publicat_en="1947">
        <Titol>Diari d'Anna Frank</Titol>
        <Autor>Anne Frank</Autor>
<Llibre publicat_en="2021">
<Titol>Parse XML files</Titol>
<Autor>John Doe</Autor></Llibre></Llibres>


Exercici 1

Utilitzar el codi de l’exemple per crea-ne una classe anomenada AlumnesDOM1.java que crei un fitxer XML amb Alumnes, que guardi els elements de cada Alumne que conté els nodes <DNI>, <Nom>, <Cognom1>, <Cognom2>, <Ciutat> i <Assignatures> en el node arrel anomenat Alumnes, així com el valor de l’atribut Edat de cada <Alumne>.

El node <Assignatures> té el següent format:

   <Assignatura>Accès a Dades</Assignatura>
   <Assignatura>Programació de mòbils</Assignatura>

El xml hauria de quedar així:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
          <Assignatura> Mates </Assignatura>
          <Assignatura> Català </Assignatura>

Exercici 2

Adaptar el codi de l’exemple pel cas de l’exercici d’accés aleatori. S’ha de treballar amb les dades inserides en aquell exercici, ID, cognom, departament i sou. Es demana implementar la classe EmpleatsDOM1.java codi per crear un fitxer XML anomenat empleats.xml.

Exercici 3

Implementar un altre classe anomenada EmpleatsDOM2.java per llegir aquest XML creat i ensenyar els registres per pantalla (especificant les dades, per exemple “ID: XX,Cognom: XXXX, Departament: XX, Sou: XXXX”).

La llibrería SAX

SAX és un analitzador sintàctic, al contrari de DOM que requereix memòria i temps sobretot si el fitxer XML a processar és bastant gran i complex, SAX analitza el fitxer a la vegada que el llegeix. Una alternativa en aquests casos son els analitzadors seqüencials, que permeten extreure el contingut a mida que es van descobrint les etiquetes d’obertura i tancament (analitzadors sintàctics). Són analitzadors molt ràpids, però presenten el problema que cada cop que es necessita accedir a una part del contingut cal rellegir tot el document de dalt a baix.

En Java, l’analitzador sintàctic més popular s’anomena SAX, que és l’acrònim de Simple API for XML. Els analitzadors sintàctics són capaços d’aïllar les dades XML en una sola lectura seqüencial detectant les etiquetes d’obertura i tancament. Són molt ràpids, però han de llegir tot el document a cada consulta.

Doncs, SAX és una altra tecnologia per poder accedir a XML des de llenguatges de programació i encara que SAX tingui el mateix objectiu que DOM, aquesta tecnologia aborda el problema des d’una òptica diferent. En general es fa servir SAX quan la informació emmagatzemada en els documents XML és clara, està ben estructurada i no necessita ser modificada.

Les principals característiques de SAX són:

SAX segueix els següents passos bàsics:

  1. Se li diu al parser SAX quin fitxer vol que sigui llegit de manera seqüencial.
  2. El document XML és traduït a una sèrie d’esdeveniments.
  3. Els esdeveniments generats poden controlar-se amb mètodes de control anomenats callbacks.
  4. Per implementar els callbacks n’hi ha prou amb implementar la interfície ContentHandler (la seva implementació per defecte és DafaultHandler).

El procés es pot resumir de la següent manera:

  1. SAX obre un fitxer XML i posa un punter a l’inici del mateix.
  2. Quan comença a llegir el fitxer, el punter va avançant seqüencialment.
  3. Quan SAX detecta un element propi del XML llavors llança un esdeveniment. Un esdeveniment pot ser causat per:

Quan SAX retorna que ha detectat un esdeveniment, llavors aquest esdeveniment pot ser manejat amb la classe DefaultHandler (callbacks). Aquesta classe pot ser estesa i els mètodes d’aquesta classe poden ser redefinits (sobrecarregats) pel programador per aconseguir l’efecte desitjat quan SAX detecta els esdeveniments. Per exemple, es pot redefinir el mètode public void startElement(), que és el que s’invoca quan SAX detecta un esdeveniment de començament d’un element. Com a exemple, la redefinició d’aquest mètode pot consistir en comprovar el nom del nou element detectat, i si és un en concret llavors treure per pantalla un missatge amb el seu contingut.

Quan SAX detecta un esdeveniment d’error o un final de document llavors s’acaba el recorregut.


És millor DOM quan:

És millor SAX quan:

Examples SAX

Parse XML Document using SAX Parser

Fitxer input.txt

<?xml version="1.0"?>
  <student rollno="393">
  <student rollno="493">
  <student rollno="593">
    <firstname>Jose Luis</firstname>

Fitxer SAXParserDemo.java

package net.xeill.elpuig;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class SAXParserDemo {
  public static void main(String[] args) {
    try {
      File inputFile = new File("input.txt");
      SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
      SAXParser saxParser = saxParserFactory.newSAXParser();
      StudentHandler studentHandler = new StudentHandler();
      saxParser.parse(inputFile, studentHandler);
    } catch (Exception e) {

Fitxer StudentHandler.java

package net.xeill.elpuig;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class StudentHandler extends DefaultHandler {

  boolean bFirstName = false;
  boolean bLastName = false;
  boolean bNickname = false;
  boolean bMarks = false;

  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    super.startElement(uri, localName, qName, attributes);

    if (qName.equalsIgnoreCase("student")) {
      String rollNo = attributes.getValue("rollno");
      System.out.println("Roll No: "+rollNo);
    } else if (qName.equalsIgnoreCase("firstname")) {
      bFirstName = true;
    } else if (qName.equalsIgnoreCase("lastname")) {
      bLastName = true;
    } else if (qName.equalsIgnoreCase("nickname")) {
      bNickname = true;
    } else if (qName.equalsIgnoreCase("marks")) {
      bMarks = true;

  public void endElement(String uri, String localName, String qName) throws SAXException {
    super.endElement(uri, localName, qName);

    if (qName.equalsIgnoreCase("student")) {
      System.out.println("End element: "+ qName);

  public void characters(char[] ch, int start, int length) throws SAXException {
    super.characters(ch, start, length);

    if (bFirstName) {
      System.out.println("First name: "+ new String(ch, start, length));
      bFirstName = false;
    } else if  (bLastName) {
      System.out.println("Last name: "+ new String(ch, start, length));
      bLastName = false;
    } else if  (bNickname) {
      System.out.println("Nickname: "+ new String(ch, start, length));
      bNickname = false;
    } else if  (bMarks) {
      System.out.println("Marks: "+ new String(ch, start, length));
      bMarks = false;

La sortida de consola és la següent:

Roll No: 393
First name: Gerard
Last name: Paulino
Nickname: gpaulino
Marks: 85
End element: student
Roll No: 493
First name: Adrià
Last name: Lora
Nickname: alora
Marks: 95
End element: student
Roll No: 593
First name: Jose Luis
Last name: Polonio
Nickname: jpolonio
Marks: 90
End element: student

Open and loop XML using SAX Parser

Obrir i recórrer XML amb SAX des de Java

<?xml version="1.0" encoding="UTF-8"?>
<Llibre publicat_en="1922">
<Autor>Hermann Hesse</Autor>
<Llibre publicat_en="1985">
<Titol>El perfum</Titol>
<Autor>Patrick Süskind</Autor>
<Llibre publicat_en="1947">
<Titol>Diari d'Anna Frank</Titol>
<Autor>Anne Frank</Autor>


package net.xeill.elpuig;

import java.io.File;

public class SAXBooksMain {
  public static void main(String[] args) {
    File file = new File("llibres.xml");
    BooksSAXParser booksSAXParser = new BooksSAXParser();

Obrir un document mitjançant SAX

openXMLWithSAX(File file)

Per obrir un document XML des de Java amb SAX s’utilitzen les classes:

Com es pot entendre seguint els comentaris del codi, primerament es creen els objectes factory i parser. Aquesta part és similar a com es fa amb DOM. Una diferència amb DOM és que a SAX es crea una instància de la classe HandlerLlibres. Aquesta classe estén DefaultHandler i redefineix els mètodes (callbacks) que atenen els esdeveniments.

En resum, la preparació de SAX requereix inicialitzar les variables, que seran usades quan s’iniciï el procés de recorregut del fitxer XML:

package net.xeill.elpuig;

import org.xml.sax.SAXException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

public class BooksSAXParser {

  BookHandler bookHandler;
  SAXParser saxParser;
  File xmlFile;

  public int openXMLWithSAX(File file) {
    // Es crea un objecte SAXParser per interpretar el document XML
    try {
      SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
      saxParser = saxParserFactory.newSAXParser();
      // Es crea una instancia del Handler que serà el que recorri el document XML secuencialment
      bookHandler = new BookHandler();
      xmlFile = file;
      return 0;
    } catch (Exception e) {
      return -1;

  public String getSAXInfo() {
    // Es dona la sortida al parser per a que comenci a gestionar el document XML que
    // li passem com a paràmetre. Es recorrerà secuencialment el document XML i quan es
    // detecti un començament o un fi d'element o text llavors s'el tractarà (segons la implementació del handler)
    try {
      saxParser.parse(xmlFile, bookHandler);
      return bookHandler.getResultText();
    } catch (Exception e) {
      return "Error processant el document XML";

Recorrer un document mitjançant SAX


El mètode parse() llança SAX pel fitxer XML seleccionat i amb el controlador desitjat (es podrien implementar tantes extensions de DefaultHandler com controladors diferents es volguéssin utilitzar).

Aquest mètode rep com a paràmetre el parser inicialitzat (saxParser), la instància de la classe que manejarà els esdeveniments (bookHandler) i el File amb el fitxer XML que recorrerà (xmlFile).

En aquest mètode l’excepció que es captura és SAXException que es defineix en el paquet org.xml.sax.SAXException.

Per recórrer un document XML un cop inicialitzat el parser l’únic que es necessita és llançar el parser. Evidentment, abans cal haver definit la classe que estén DefaultHandler. Aquesta classe té la lògica de com actuar quan es troba algun element XML durant el recorregut amb SAX (callbacks).

Ara veurem el codi de la classe BookHandler que és el codi que gestiona com interpretar els elements d’un document XML.

package net.xeill.elpuig;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class BookHandler extends DefaultHandler {

  int lastElement = 0;
  String resultText = "";

  public String getResultText() {
    return resultText;

  // A continuació es sobrecarreguen els esdeveniments de la classe DefaultHandler per recuperar el document XML
  // En la implementació d'aquests esdeveniments s'indica què es fa quan es trobi el començament d'un element (startElement)
  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
    super.startElement(uri, localName, qName, attributes);

    if (qName.equals("Llibre")) {
      resultText += "\r" + "Publicat l'any: " + attributes.getValue(attributes.getQName(0)) + "\n";
      lastElement = 1;
    } else if (qName.equals("Titol")) {
      resultText += "El títol és: ";
      lastElement = 2;
    } else if (qName.equals("Autor")) {
      resultText += "\r" + "L'autor és: ";
      lastElement = 3;

  // Quan en aquest exemple detectem un final d'element <Llibre> es posa una línia a la sortida
  public void endElement(String uri, String localName, String qName) throws SAXException {
    super.endElement(uri, localName, qName);
    if (qName.equals("Llibre")) {
      resultText += "-------------------------";

  // Quan es detecta una cadena de text posterior a un dels elements <Titol> o <Autor> llavors guarda aquest
  // text en la variable corresponent
  public void characters(char[] ch, int start, int length) throws SAXException {
    super.characters(ch, start, length);
    if (lastElement == 2) {
      resultText += new String(ch, start, length);
    } else if (lastElement == 3) {
      resultText += new String(ch, start, length);

Aquesta classe estén el mètode startElement, endElement i characters.

Aquests mètodes callbacks s’invoquen quan, durant el recorregut del document XML, es detecta un esdeveniment de començament d’element, final d’element o cadena de caràcters. En l’exemple, cada mètode realitza el següent:

Si s’aplica el codi anterior al contingut al document XML anterior el resultat seria el següent:

Publicat l'any: 1922
El títol és: Siddharta
L'autor és: Hermann Hesse
Publicat l'any: 1985
El títol és: El perfum
L'autor és: Patrick Süskind
Publicat l'any: 1947
El títol és: Diari d'Anna Frank
L'autor és: Anne Frank

Exercicis SAX

Exercici 4

Donat el xml obtingut en el primer exercici de DOM implementar la classe AlumnesSAX.java, utilitzant el parser SAX per ensenyar la informació dels alumnes (Nom i Edat) per pantalla.

Exercici 5

Fer el mateix per al fitxer que vau crear en l’exercici 2 de DOM implementar la classe EmpleatsSAX.java.

La llibrería JAXB

JAXB stands for Java architecture for XML binding.

It is used to convert XML to Java Object and Java Object to XML.

JAXB defines an API for reading and writing Java Objects to and from XML documents.

Unlike SAX and DOM, we don’t need to be aware of XML parsing techniques.

There are two operations you can perform using JAXB

We will create a java program to marshal and unmarshal.

JAXB marshalling

In this example we are going to show how to use the JAXB marshal functionalities. JAXB offers the possibility to convert Java Objects into XML structures and vice versa.

As example, we are going to create a list of museums and store it in a specific XML file, each museum contains information like its name, about permanent and special exhibitions, city where is located, etc.

We have to create a maven project with IntelliJ and use the following pom.xml:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">






Create a Museum class and indicate JAXB which Java elements we want to store in our XML file:

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;

@XmlRootElement(name = "MUSEUM")
public class Museum {

    String name;
    String city;
    Boolean childrenAllowed;

    @XmlElement(name = "NAME")
    public void setName(String name) {
        this.name = name;

    public String getName() { return name; }

    @XmlElement(name = "CITY")
    public void setCity(String city) {
        this.city = city;

    public String getCity() {
        return city;

    @XmlAttribute(name = "children_allowed")
    public void setChildrenAllowed(Boolean childrenAllowed) {
        this.childrenAllowed = childrenAllowed;

    public Boolean getChildrenAllowed() {
        return childrenAllowed;

In the code shown above, we can see three JAXB annotations:

  1. @XmlRootElement(name="MUSEUM") : indicates the root node in the xml structure, the name is the name that will appear in the xml, if no name is specified, the class name will be used.
  2. @XmlElement(name="NAME"): indicates a child node.
  3. @XmlElement(name="CITY"): indicates a child node.
  4. @XmlAttribute(name ="children_allowed"): indicates an attribute of the root node.

Next step is to marshal this object and generate the XML with the desired structure, create a Main class with the following content:

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;

public class Main {
    public static void main(String[] args) {
        Museum simpleMuseum = new Museum();
        simpleMuseum.setName("Museum of Modern Art");
        simpleMuseum.setCity("New York");

        JAXBContext jaxbContext;
        try {
            jaxbContext = JAXBContext.newInstance(Museum.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();

            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);

            jaxbMarshaller.marshal(simpleMuseum, new File("simple.xml"));
            jaxbMarshaller.marshal(simpleMuseum, System.out);

        } catch (JAXBException e) {
            throw new RuntimeException(e);

The code is self explained and shows how a JAXB Marshaller can be used to generate an XML from a Java object. If the JAXB_FORMATTED_PROPERTY is set to true, this indicates JAXB to generate an XML with a proper indentation. The marshal method uses an object and an output file where to store the generated XML as parameters. The generated XML would be:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <CITY>New York</CITY>
    <NAME>Museum of Modern Art</NAME>

How to store a list of museums

We now know how to generate an XML from a Java Object, now we are going to show how to work with Lists of Objects. Create a maven project and use the following Main class:


package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;

public class Main {
    public static void main(String[] args) {
        Museum simpleMuseum = new Museum();
        simpleMuseum.setName("Museum of Modern Art");
        simpleMuseum.setCity("New York");

        Museum anotherMuseum = new Museum();
        anotherMuseum.setName("Dali's Museum");

        Museums museumsList = new Museums();

        JAXBContext jaxbContext;
        try {
            jaxbContext = JAXBContext.newInstance(Museums.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();

            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);

            jaxbMarshaller.marshal(museumsList, new File("simple.xml"));
            jaxbMarshaller.marshal(museumsList, System.out);

        } catch (JAXBException e) {
            throw new RuntimeException(e);

It is important to notice that JAXB is not able to manage directly Lists as root element, so we need to create a new class with the list that we want to store in order to indicate JAXB what kind of XML structure it has to generate. In this example this class is called Museums and contains a List of Museum:


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;

@XmlRootElement(name = "MUSEUMS")
public class Museums {
    List<Museum> museums;

    public List<Museum> getMuseums() { return museums; }

    @XmlElement(name = "MUSEUM")
    public void setMuseums(List<Museum> museums) { this.museums = museums; }

    public void add(Museum museum) {
        if (this.museums == null) {
            this.museums = new ArrayList<Museum>();

The generated XML would be:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
        <CITY>New York</CITY>
        <NAME>Museum of Modern Art</NAME>
        <NAME>Dali's Museum</NAME>

Use the same Museum class used in the previous example.

How to store complex Java types as children nodes using an adapter:

Until now, we just generated XML that contained elements of the type String, so we are going to see what actions are needed in order to allow JAXB to store other types that are not configured per default. In Java 8, one of the new features is the new Date API; this API offers many new possibilities and enhances the old one. One of the new classes coming with this API is the java.time.LocalDate. JAXB does not know how to manage this class, so we have to create an adapter in order to explain JAXB how to marshal and unmarshal it:


package net.xeill.elpuig;

import java.time.LocalDate;
import javax.xml.bind.annotation.adapters.XmlAdapter;

public class LocalDateAdapter extends XmlAdapter<String, LocalDate> {
  public LocalDate unmarshal(String sDate) throws Exception {
    return LocalDate.parse(sDate);

  public String marshal(LocalDate date) throws Exception {
    return date.toString();

We just implement the marshal and unmarshal methods of the interface XmlAdapter with the proper types and results and afterwards, we indicate JAXB where to use it:


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import javax.xml.bind.annotation.adapters.XmlJavaTypeAdapter;
import java.time.LocalDate;

@XmlRootElement(name = "PERMANENT_EXHIBITION")
public class Exhibition {

    String name;
    LocalDate from;

    public String getName() {
        return name;

    @XmlElement(name = "NAME")
    public void setName(String name) {
        this.name = name;

    public LocalDate getFrom() {
        return from;

    @XmlElement(name = "FROM")
    public void setFrom(LocalDate from) {
        this.from = from;


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;

@XmlRootElement(name = "MUSEUM")
public class Museum {

    String name;
    String city;
    Boolean childrenAllowed;
    Exhibition exhibition;

    public String getName() { return name; }

    @XmlElement(name = "NAME")
    public void setName(String name) {
        this.name = name;

    public String getCity() {
        return city;

    @XmlElement(name = "CITY")
    public void setCity(String city) {
        this.city = city;

    @XmlAttribute(name = "children_allowed")
    public void setChildrenAllowed(Boolean childrenAllowed) {
        this.childrenAllowed = childrenAllowed;

    public Boolean getChildrenAllowed() {
        return childrenAllowed;

    public Exhibition getExhibition() {
        return exhibition;

    @XmlElement(name = "PERMANENT_EXHIBITION")
    public void setExhibition(Exhibition exhibition) {
        this.exhibition = exhibition;


package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;
import java.time.LocalDate;
import java.time.Month;

public class Main {
    public static void main(String[] args) {

        Museum museum = new Museum();
        museum.setName("Museum of Modern Art");
        museum.setCity("New York");

        Exhibition exhibition = new Exhibition();
        exhibition.setFrom(LocalDate.of(2030, Month.APRIL, 1));


        JAXBContext jaxbContext;
        try {
            jaxbContext = JAXBContext.newInstance(Museum.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();

            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);

            jaxbMarshaller.marshal(museum, new File("simple.xml"));
            jaxbMarshaller.marshal(museum, System.out);

        } catch (JAXBException e) {
            throw new RuntimeException(e);


The XML result would be:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<MUSEUM children_allowed="false">
    <CITY>New York</CITY>
    <NAME>Museum of Modern Art</NAME>

Summarizing, we know how to generate XML from Java Objects, we know also how to use lists within these Java Objects and also as root element of the XML, we saw how to adapt complex types in order that JAXB can work with them and we also made as well.

The example bellow contains all the features explained in this article: A List of Museums containing names, cities, permanent and special exhibitions with dates using LocalDate is stored in an XML file.

Exercici MuseumJAXBComplete

Implement MuseumJAXBComplete with all the classes needed to produce the same XML file as below.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <MUSEUM children_allowed="true">
        <CITY>Madrid, Spain</CITY>
            <NAME>Permanent Exhibition - Prado Museum</NAME>
            <NAME>Game of Bowls (1908), by Henri Matisse</NAME>
    <MUSEUM children_allowed="true">
        <CITY>Madrid, Spain</CITY>
        <NAME>Reina Sofia</NAME>
            <NAME>Permanent Exhibition - Reina Sofia Museum</NAME>


package net.xeill.elpuig;

import java.time.LocalDate;
import javax.xml.bind.annotation.adapters.XmlAdapter;

public class LocalDateAdapter extends XmlAdapter<String, LocalDate> {
    public LocalDate unmarshal(String sDate) throws Exception {
        return LocalDate.parse(sDate);

    public String marshal(LocalDate date) throws Exception {
        return date.toString();


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlTransient;
import javax.xml.bind.annotation.adapters.XmlJavaTypeAdapter;
import java.time.LocalDate;

public class Exhibition {

    String name;
    LocalDate from;
    LocalDate to;

    public String getName() {
        return name;

    @XmlElement(name = "NAME")
    public void setName(String name) {
        this.name = name;

    public LocalDate getFrom() {
        return from;

    @XmlElement(name = "FROM")
    public void setFrom(LocalDate from) {
        this.from = from;

    public LocalDate getTo() {
        return to;

    @XmlElement(name = "TO")
    public void setTo(LocalDate to) {
        this.to = to;


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlType;
import java.time.LocalDate;
import java.util.ArrayList;

@XmlType(propOrder = {"name", "artists", "from", "to"})
public class PermanentExhibition extends Exhibition {

    private ArrayList<String> artists;

    public PermanentExhibition() { }

    public PermanentExhibition(String name) {
        this.name = name;

    public PermanentExhibition(String name, LocalDate from) {
        this.name = name;
        this.from = from;

    public ArrayList<String> getArtists() {
        return artists;

    @XmlElement(name = "ARTIST")
    public void setArtists(ArrayList<String> artists) {
        this.artists = artists;

    public void addArtist(String name) {
        if (this.artists == null) {
            this.artists = new ArrayList<String>();




package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlType;

@XmlType(propOrder = {"name", "artist", "from", "to"})
public class SpecialExhibition extends Exhibition {
    private String artist;

    public SpecialExhibition() { }

    public SpecialExhibition(String name, String artist) {
        this.name = name;
        this.artist = artist;

    public String getArtist() {
        return artist;

    @XmlElement(name = "ARTIST")
    public void setArtist(String artist) {
        this.artist = artist;



package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;

@XmlRootElement(name = "MUSEUM")
public class Museum {

    String name;
    String city;
    Boolean childrenAllowed;
    PermanentExhibition permanentExhibition;
    SpecialExhibition specialExhibition;

    public Museum() { }

    public Museum(String name, String city, Boolean childrenAllowed) {
        this.name = name;
        this.city = city;
        this.childrenAllowed = childrenAllowed;

    public String getName() { return name; }

    @XmlElement(name = "NAME")
    public void setName(String name) {
        this.name = name;

    public String getCity() {
        return city;

    @XmlElement(name = "CITY")
    public void setCity(String city) {
        this.city = city;

    @XmlAttribute(name = "children_allowed")
    public void setChildrenAllowed(Boolean childrenAllowed) {
        this.childrenAllowed = childrenAllowed;

    public Boolean getChildrenAllowed() {
        return childrenAllowed;

    public PermanentExhibition getPermanentExhibition() {
        return permanentExhibition;

    @XmlElement(name = "PERMANENT_EXHIBITION")
    public void setPermanentExhibition(PermanentExhibition permanentExhibition) {
        this.permanentExhibition = permanentExhibition;

    public SpecialExhibition getSpecialExhibition() {
        return specialExhibition;

    @XmlElement(name = "SPECIAL_EXHIBITION")
    public void setSpecialExhibition(SpecialExhibition specialExhibition) {
        this.specialExhibition = specialExhibition;


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;

@XmlRootElement(name = "MUSEUMS")
public class Museums {
    List<Museum> museums;

    public List<Museum> getMuseums() { return museums; }

    @XmlElement(name = "MUSEUM")
    public void setMuseums(List<Museum> museums) { this.museums = museums; }

    public void add(Museum museum) {
        if (this.museums == null) {
            this.museums = new ArrayList<Museum>();


package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;
import java.time.LocalDate;
import java.time.Month;

public class Main {
    public static void main(String[] args) {
        Museum museum = new Museum("Prado", "Madrid, Spain", true);

        PermanentExhibition permanentExhibition = new PermanentExhibition("Permanent Exhibition - Prado Museum");
        permanentExhibition.setFrom(LocalDate.of(1500, Month.JANUARY, 1));
        permanentExhibition.setTo(LocalDate.of(2000, Month.DECEMBER, 31));

        SpecialExhibition specialExhibition = new SpecialExhibition("Game of Bowls (1908), by Henri Matisse", "Matisse");
        specialExhibition.setFrom(LocalDate.of(1908, Month.JANUARY, 1));
        specialExhibition.setTo(LocalDate.of(1908, Month.DECEMBER, 31));

        Museum anotherMuseum = new Museum("Reina Sofia", "Madrid, Spain", true);
        PermanentExhibition anotherPermanentExhibition = new PermanentExhibition("Permanent Exhibition - Reina Sofia Museum");
        anotherPermanentExhibition.setFrom(LocalDate.of(1900, Month.JANUARY, 1));
        anotherPermanentExhibition.setTo(LocalDate.of(2014, Month.DECEMBER, 31));

        Museums listMuseums = new Museums();

        try {
            JAXBContext jaxbContext = JAXBContext.newInstance(Museums.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();
            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);
            jaxbMarshaller.marshal(listMuseums, new File("complex.xml"));
            jaxbMarshaller.marshal(listMuseums, System.out);
        } catch (Exception e) {

JAXB unmarshalling

We are going to see how to do the complementary operation: unmarshal XML files into Java Objects and what should be taken into consideration while doing this operation.

For this purpose we are going to use the same example about museums. We are going to unmarshall an xml containing information about a list of museums with its main exhibitions and artists exposed.

The code shown bellow unmarshalls a given xml file into java objects. The classes of these objects should contain a set of attributes and annotations:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <MUSEUM children_allowed="false">
        <NAME>Reina Sofia Museum</NAME>
            <NAME>Permanent Exhibition - Reina Sofia Museum</NAME>
        <NAME>Louvre Museum</NAME>
            <NAME>Permanent Exhibition - Louvre Museum</NAME>
            <ARTIST>Leonardo da Vinci</ARTIST>


package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Unmarshaller;
import java.io.File;

public class Main {
    public static void main(String[] args) {

        try {
            File file = new File("museums.xml");
            JAXBContext jaxbContext = JAXBContext.newInstance(Museums.class);
            Unmarshaller jaxbUnmarshaller = jaxbContext.createUnmarshaller();
            Museums museums = (Museums) jaxbUnmarshaller.unmarshal(file);

        } catch (JAXBException e) {
            throw new RuntimeException(e);


The output produced would be something like:

Name: Prado Museum
City: Madrid
Permanent Exhibition - Prado Museum
Game of Bowls (1908), by Henri Matisse

Name: Reina Sofia Museum
City: Madrid
ATTENTION! Children are not allowed in this museum
Permanent Exhibition - Reina Sofia Museum

Name: British Museum
City: London
Permanent Exhibition - British Museum

Name: MOMA
City: New York
Permanent Exhibition - MOMA

Name: Louvre Museum
City: Paris
Permanent Exhibition - Louvre Museum

But this depends in the current Java code handling the Museums class.

The method createUnmarshaller from the class JAXBContext creates an instance of the type Unmarshaller that allows us to proceed with our tasks. If the class Museums and its members are properly configured using the right JAXB annotations and field members, everything should work fine.

The Museums class contains a List of Museum items:


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;

@XmlRootElement(name = "MUSEUMS")
public class Museums {
    List<Museum> museums;

    public List<Museum> getMuseums() { return museums; }

    @XmlElement(name = "MUSEUM")
    public void setMuseums(List<Museum> museums) { this.museums = museums; }

    public void add(Museum museum) {
        if (this.museums == null) {
            this.museums = new ArrayList<Museum>();

    public String toString() {
        String result = "";

        for (Museum m : museums) {
            result += m.toString();
            result += "\n";

        return result;

And the Museum class contains fields that can be XML elements like the name or the city or XML attributes like the children allowance. These fields can be of any JAXB supported type:


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;

@XmlRootElement(name = "MUSEUM")
public class Museum {

    String name;
    String city;
    Boolean childrenAllowed;
    PermanentExhibition permanentExhibition;
    SpecialExhibition specialExhibition;

    public Museum() { }

    public Museum(String name, String city, Boolean childrenAllowed) {
        this.name = name;
        this.city = city;
        this.childrenAllowed = childrenAllowed;

    public String getName() { return name; }

    @XmlElement(name = "NAME")
    public void setName(String name) {
        this.name = name;

    public String getCity() {
        return city;

    @XmlElement(name = "CITY")
    public void setCity(String city) {
        this.city = city;

    @XmlAttribute(name = "children_allowed")
    public void setChildrenAllowed(Boolean childrenAllowed) {
        this.childrenAllowed = childrenAllowed;

    public Boolean getChildrenAllowed() {
        return childrenAllowed;

    public PermanentExhibition getPermanentExhibition() {
        return permanentExhibition;

    @XmlElement(name = "PERMANENT_EXHIBITION")
    public void setPermanentExhibition(PermanentExhibition permanentExhibition) {
        this.permanentExhibition = permanentExhibition;

    public SpecialExhibition getSpecialExhibition() {
        return specialExhibition;

    @XmlElement(name = "SPECIAL_EXHIBITION")
    public void setSpecialExhibition(SpecialExhibition specialExhibition) {
        this.specialExhibition = specialExhibition;

    public String toString() {
        String result =  "Name: " + name + "\n" +
                "City: " + city + "\n";

        if (childrenAllowed != null) {
            result += !childrenAllowed ? "ATTENTION! Children are not allowed in this museum \n" : "";
        result += (permanentExhibition != null) ? permanentExhibition.getName() + "\n" : "";
        result += (specialExhibition != null) ? specialExhibition.getName() + "\n" : "";

        return result;

In case we want to use a field of a non supported type we have to implement ourselves an Adapter that indicates JAXB how to manage this kind of objects. This adapter extends the XmlAdapter class and implements its marshal and unmarshal methods:


package net.xeill.elpuig;

import javax.xml.bind.annotation.adapters.XmlAdapter;
import java.time.LocalDate;

public class LocalDateAdapter extends XmlAdapter<String, LocalDate> {
    public LocalDate unmarshal(String sDate) throws Exception {
        return LocalDate.parse(sDate);

    public String marshal(LocalDate date) throws Exception {
        return date.toString();

Main annotations used

We are going to see some important points related to the configuration of the used classes and the annotations used to configure JAXB:

@XmlAttribute( name = "children_allowed" )
public void setChildrenAllowed(Boolean childrenAllowed) {
    this.childrenAllowed = childrenAllowed;

And this is how we can unmarshal an XML file into Java Objects.

JAXB offers several ways to marshal and unmarshal collections. In our example, we just created a Museums class that contains a List of Museum items, so JAXB can manage directly this class by simply using the annotations explained above. It is also possible to achieve something similar by using the annotations @XmlElementWrapper or @XmlList, but under my point of view, these ones are more complicated, offer less options and ties you in several ways in your class modelling.

Exercici JAXBJavaToXML

Implement and complete the classes necessary to produce the same XML file as below.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<continent xmlns:ns2="net.xeill.elpuig.jaxb.Continent">


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlRootElement;

@XmlRootElement(namespace = "net.xeill.elpuig.jaxb.Continent")
public class State {

    private String stateName;
    long statePopulation;

    public State() { }

    public State(String stateName, long statePopulation) {
        this.stateName = stateName;
        this.statePopulation = statePopulation;

    public String getStateName() {
        return stateName;

    public void setStateName(String stateName) {
        this.stateName = stateName;

    public long getStatePopulation() {
        return statePopulation;

    public void setStatePopulation(long statePopulation) {
        this.statePopulation = statePopulation;


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlElementWrapper;
import javax.xml.bind.annotation.XmlRootElement;
import javax.xml.bind.annotation.XmlType;
import java.util.ArrayList;

@XmlType(propOrder = {"continentName", "continentPopulation", "listOfStates"})
public class Continent {

    private String continentName;
    private double continentPopulation;

    private ArrayList<State> listOfStates;

    public Continent() { }

    public String getContinentName() {
        return continentName;

    public void setContinentName(String continentName) {
        this.continentName = continentName;

    public double getContinentPopulation() {
        return continentPopulation;

    public void setContinentPopulation(double continentPopulation) {
        this.continentPopulation = continentPopulation;

    public ArrayList<State> getListOfStates() {
        return listOfStates;

    // XmlElementWrapper Generates a wrapper element around XML representation
    @XmlElementWrapper(name = "stateList")
    // XmlElement sets the name of the entities in collection
    @XmlElement(name = "state")
    public void setListOfStates(ArrayList<State> listOfStates) {
        this.listOfStates = listOfStates;


package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;
import java.util.ArrayList;

public class Main {
    public static void main(String[] args) {
        Continent continentEurope = new Continent();

        // Creating listOfStates
        ArrayList<State> stateList = new ArrayList<State>();
        State scotlandState = new State("Scotland", 5295000);

        State cataloniaState = new State("Catalonia", 7512982);


        try {
            JAXBContext jaxbContext = JAXBContext.newInstance(Continent.class);
            Marshaller jaxbMarshaller = jaxbContext.createMarshaller();
            jaxbMarshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, Boolean.TRUE);

            File XMLFile = new File("continent.xml");

            jaxbMarshaller.marshal(continentEurope, XMLFile);
            jaxbMarshaller.marshal(continentEurope, System.out);

        } catch (JAXBException e) {

Exercici JAXBXMLToJava

Implement and complete the classes necessary to produce the same result due to unmarshalling the XML file produced in the last exercise.

Continent Name: Europe
Continent Population: 7.42452E8
State:1 Scotland
State:2 Catalonia
package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Unmarshaller;
import java.io.File;
import java.util.ArrayList;

public class Main {
    public static void main(String[] args) {
        try {
            JAXBContext jaxbContext = JAXBContext.newInstance(Continent.class);
            Unmarshaller unmarshaller = jaxbContext.createUnmarshaller();
            File XMLFile = new File("continent.xml");

            // This will create the Java object
            Continent continentEurope = (Continent) unmarshaller.unmarshal(XMLFile);

            System.out.println("Continent Name: " + continentEurope.getContinentName());
            System.out.println("Continent Population: " + continentEurope.getContinentPopulation());

            ArrayList<State> listOfStates = continentEurope.getListOfStates();

            for (int i = 0; i < listOfStates.size(); i++) {
                System.out.println("State:"+(i+1)+" "+listOfStates.get(i).getStateName());

        } catch (JAXBException e) {
            throw new RuntimeException(e);

Exercici JAXBCountryToXML

Implement the classes necessary to produce the same XML file as below.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<country importance="1">


package net.xeill.elpuig;

import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import javax.xml.bind.annotation.XmlType;
import javax.xml.bind.annotation.adapters.XmlJavaTypeAdapter;
import java.time.LocalDate;

@XmlType(propOrder = {"name", "capital", "foundationDate", "continent", "population"})
public class Country {
    private String name, capital, continent;
    private LocalDate foundationDate;
    private int importance, population;

    public String getName() {
        return name;

    @XmlElement(name = "name")
    public void setName(String name) {
        this.name = name;

    public String getCapital() {
        return capital;

    @XmlElement(name = "capital")
    public void setCapital(String capital) {
        this.capital = capital;

    public String getContinent() {
        return continent;

    @XmlElement(name = "continent")
    public void setContinent(String continent) {
        this.continent = continent;

    public LocalDate getFoundationDate() {
        return foundationDate;

    @XmlElement(name = "foundation_date")
    public void setFoundationDate(LocalDate foundationDate) {
        this.foundationDate = foundationDate;

    public int getImportance() {
        return importance;

    @XmlAttribute(name = "importance")
    public void setImportance(int importance) {
        this.importance = importance;

    public int getPopulation() {
        return population;

    @XmlElement(name = "population")
    public void setPopulation(int population) {
        this.population = population;


package net.xeill.elpuig;

import java.time.LocalDate;
import javax.xml.bind.annotation.adapters.XmlAdapter;

public class LocalDateAdapter extends XmlAdapter<String, LocalDate> {
    public LocalDate unmarshal(String sDate) throws Exception {
        return LocalDate.parse(sDate);

    public String marshal(LocalDate date) throws Exception {
        return date.toString();


package net.xeill.elpuig;

import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;
import java.time.LocalDate;

public class Main {
    public static void main(String[] args) {

        Country country = new Country();
        country.setFoundationDate(LocalDate.of(1469, 10, 4));

        try {
            JAXBContext jaxbContext = JAXBContext.newInstance(Country.class);
            Marshaller marshaller = jaxbContext.createMarshaller();
            marshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);
            marshaller.marshal(country, new File("country.xml"));
            marshaller.marshal(country, System.out);
        } catch (JAXBException e) {
            throw new RuntimeException(e);

