Computación I

Estructuras de Datos: listas enlazadas

Objetivos: Definir el concepto de estructura de datos y mostrar cómo se puede implementar una pila por medio de una lista enlazada..

Temas:

Implementación de tipos de datos abstractos.
Estructuras de datos.
Listas enlazadas.
Implementación de una pila usando listas enlazadas.
Implementación de una cola.
- Extracción del primer eslabón de una lista enlazada.
- Recorrer los eslabones de una lista enlazada.
- Agregar un eslabón al final de una lista enlazada.
- Implementación eficiente de una cola con listas enlazadas.
- Eliminación del caso de borde en que la lista esta vacía.
El tipo de datos abstracto arreglo asociativo con llaves enteras.
- Representación de un arreglo asociativo usando listas enlazadas.
- Búsqueda de una llave en la lista enlazada.
- Eliminación de un eslabón en la lista enlazada.
- Análisis del tiempo de ejecución de las operaciones.

Implementación de tipos de datos abstractos

Los tipos de datos son los enteros, reales, valores booleanos y todos los objetos. Un tipo de datos es abstracto cuando los programadores pueden trabajar con él conociendo sólo sus operaciones. Uno puede abstraerse de su implementación y utilizarlos exitosamente. Por ejemplo, en este curso hemos usado las pilas, colas y arreglos asociativos sin conocer su implementación, y por lo tanto son tipos de datos abstractos.

La abstracción es importante para poder disminuir la complejidad de los problemas que se enfrentan. Sin embargo, también es útil conocer aspectos de la implementación de los tipos de datos con los que se trabaja y por ello estudiamos como se representaban los números reales. Esto nos permite entender mejor sus limitaciones, como el número finito de decimales que puede almacenar.

En este capítulo estudiaremos las técnicas que se usan para implementar los tipos de datos abstractos como las pilas, colas, arreglos asociativos y otros. Es decir definiremos (implementaremos) estas clases.

Estructuras de datos

Cuando se implementa una clase es necesario preocuparse de:

Elegir una representación para los objetos de la clase. Esta representación consiste en un conjunto de variable de instancia que almacenarán todos los datos que se requiere memorizar para poder realizar las operaciones.
Implementar las operaciones de las clase.

Veremos que existen patrones de organización para las variables de instancia. Estos patrones se denominan estructuras de datos.

La estructura de datos de uso más frecuente es el arreglo. Las pilas, colas y arreglos asociativos se implementan fácilmente por medio de arreglos nativos. Sin embargo, el resultado presenta serias deficiencias que resolveremos por medio de dos nuevas estructuras de datos: las listas enlazadas y los árboles.

Ejemplo: Implementación de una pila de enteros

El problema reside en donde almacenar los elementos de la pila. Lo más fácil es almacenarlos en un arreglo:

    class Pila extends Program {
      int a[];
      int tope;
      int max;
      Pila() {
        max= 100;
        a= new int[max];
        tope= 0;
      }
      void push(int x) {
        if (tope>=max)
          fatalError("desborde de pila"); 
        a[tope]= x;
        tope++;
      }
      int popInt() {
        if (tope==0)
          fatalError("pila vacia"); 
        tope--;
        return a[tope];
      }
      boolean isEmpty() {
        return tope==0;
      }
    }

En donde a es el arreglo y tope es el lugar en donde se almacenará el próximo entero que se coloque en la pila.

El problema de esta implementación es que si se llena el arreglo, hay que terminar el programa con un mensaje de error. Es decir la pila queda limitada a 100 elementos o el tamaño que se elija.

Una mejor implementación de una pila debería hacer crecer automáticamente el arreglo cuando se excede su tamaño. Por ejemplo se podría hacer crecer el tamaño en un factor 2. Ahora el problema es que si en algún momento se agrega un millón de elementos en la pila, la pila ocupará para siempre un millón enteros de la memoria del computador, incluso si sólo contiene unos cuantos enteros.

Listas enlazadas

Una lista enlazada es una estructura de datos que se visualiza como una cadena de eslabones que termina con una referencia nula. Cada eslabón se representa por medio de las siguientes variables de instancia:

    class Eslabon {
      ...
      Eslabon prox;
    }

Lo que caracteriza al eslabón como una estructura de datos recursiva es que entre las variables de instancia se encuentra una referencia a un objeto del mismo tipo.

Junto con poseer una referencia del próximo eslabón en la cadena, se colocan variables de instancia para almacenar datos concerniente al problema que se pretende resolver. Por ejemplo, para implementar la pila se puede colocar un entero en cada eslabón de la cadena:

    class Eslabon {
      int x;
      Eslabon prox;
      Eslabon(int x, Eslabon prox) {
        this.x= x;
        this.prox= prox;
      }
    }

Típicamente los eslabones no tienen métodos asociados. Por conveniencia tienen un constructor.

Implementación de una pila usando listas enlazadas

La idea es formar una lista enlazada de eslabones que contienen los elementos de la pila. En la clase pila se almacena la referencia al eslabón que contiene el tope de la pila:

    class Pila extends Program {
      Eslabon primero= null;
      void push(int x) {
        primero= new Eslabon(x, primero);
      }
      int popInt() {
        if (primero==null)
          fatalError("pila vacia");
        int tope= primero.x;
        primero= primero.prox;
        return tope;
      }
    }

Implementación de una cola

La clase Queue que ha sido usada en el curso puede encolar enteros, reales, valores booleanos, strings o incluso cualquier objeto. Ahora veremos una versión simplicada que sólo permite almacenar strings:

Ejemplo	Significado	Declaración
StringQueue q= new StringQueue();	Construye una cola de strings vacía	StringQueue()
q.put("hola");	Agrega el string "hola" al final	void put(String s)
String s= q.getString()	extrae y entrega el primer elemento de la cola	String getString()
int l= q.size()	entrega la cantidad de elementos de la cola	int size()

Se puede usar un arreglo para almacenar los elementos de la cola, pero se presentan las mismas deficiencias de la pila implementada con arreglos.

La estructura de datos más conveniente para implementar una cola es la lista enlazada, al igual que la pila. La siguiente figura muestra la estructura de una cola en la que se han encolado los strings "hola", "que" y "tal":

La estructura de los eslabones queda representada por medio de la siguiente clase:

    class EslabonCola {
      String s;
      EslabonCola prox;
      EslabonCola(String s, EslabonCola prox) {
        this.s= s;
        this.prox= prox;
      }
    }

Y la estructura de una cola consiste en una referencia del primer eslabón de la cola:

    class StringQueue extends Program {
      EslabonCola primero;
      ... // Los métodos getString, put y size
    }

La variable de instancia primero referencia el eslabón que contiene el primer string de la cola.

Extracción del primer eslabón de una lista enlazada

Para implementar la operación getString es necesario obtener el string contenido en el primer eslabón y luego extraer de la lista enlazada ese eslabón:

    String getString() {
      String s= primero.s;
      primero= primero.prox;
      return s;
    }

La siguiente figura muestra la modificación que se hace en los enlaces para sacar el primer eslabón de la cadena:

Observe que si la cola tenía exactamente un eslabón, después de extraerlo de la cola, la lista enlazada queda sin eslabones.

Recorrer los eslabones de una lista enlazada

El tamaño de la cola está dado por la cantidad de eslabones de la cola. Por lo tanto hay que contar los eslabones:

    int size() {
      int cont= 0;
      EslabonCola e= primero;
      while (e!=null) {
        e= e.prox;
        cont= cont+1;
      }
      return cont;
    }

Agregar un eslabón al final de una lista enlazada

Para implementar la operación put es necesario agregar un nuevo eslabón al final de la lista enlazada. En este eslabón se coloca el string que se agrega a la cola. Esto no es trivial porque la estructura de la cola no contiene ningún puntero hacia el final de la cola. Por lo tanto hay que recorrer la pila hasta encontrar el último eslabón:

    void put(String s) {
      if (primero==null)
        primero= new EslabonCola(s, null);
      else {
        EslabonCola e= primero;
        while (e.prox!=null)
          e= e.prox;
        e.prox= new EslabonCola(s, null);
      }
    }

Observe que el caso en que la cola está vacía es un caso de borde, porque en ese caso el eslabón debe ser referenciado por la variable de instancia primero. La figura muestra las modificaciones realizadas en las referencias:

Análisis del tiempo de ejecución de cada operación:

Extraer el primer string de la cola: O(1).
Agregar un string al final de la cola: O(n), n= tamaño de la cola.

En la próxima clase se verán mejoras a la eficiencia de esta implementación.

Implementación eficiente de una cola con listas enlazadas

La eficiencia se logra colocando en la estructura de la cola una referencia del último eslabón de la lista enlazada:

    class StringQueue extends Program {
      EslabonCola primero;
      EslabonCola ultimo;
      ... // Los métodos getString, put y size
    }

Con esta referencia es posible llegar directamente al último eslabón sin tener que visitar todos los eslabones de la lista enlazada:

    void put(String s) {
      EslabonCola e= new EslabonCola(s, null);
      if (primero==null)
        primero= ultimo= e;
      else {
        ultimo.prox= e;
        ultimo= e;
      }
    }

Análisis del tiempo de ejecución de cada operación:

Extraer el primer string de la cola: O(1).
Agregar un string al final de la cola: O(1).

Con esta implementación encolar un string en la cola es igual de eficiente que extraer el primer elemento.

Eliminación del caso de borde en que la lista esta vacía

El truco consiste en hacer que la lista nunca esté vacía. Para ello se crea un primer eslabón falso. Este eslabón no contiene nigún string de la cola. Sólo esta ahí para evitar que la lista enlazada quede sin eslabones:

    class StringQueue extends Program {
      EslabonCola primero;
      EslabonCola ultimo;
      StringQueue() {
        primero= ultimo= new EslabonCola(null, null); // eslabón falso
      }
      String getString() {
        if (primero.prox==null)
          fatalError("Cola vacía");
        String s= primero.prox.s;
        primero.prox= primero.prox.prox;
        return s;
      }
      int size() {
        int cont= 0;
        EslabonCola e= primero.e;
        while (e!=null) {
          e= e.prox;
          cont++;
        }
        return cont;
      }
      void put(String s) {
        ultimo.prox= new EslabonCola(s, null);
        ultimo= ultimo.prox;
      }
    }

Observe que esto no significa que la cola no pueda estar vacía. La cola está vacía cuando la lista enlazada contiene exactamente un eslabón (el eslabón falso).

El tipo de datos abstracto arreglo asociativo con llaves enteras

En esta clase implementaremos un subconjunto del tipo de datos Map que utilizamos durante el primer semestre. Este tipo de datos asocia enteros con un objeto cualquiera. Sus operaciones son:

Ejemplo	Significado	Declaración
Map m= new Map();	Construye un arreglo asociativo con llaves enteras, inicialmente vacío	Map()
m.put(2, "hola");	Asocia el entero 2 con el string "hola"	void put(int ll, String s)
String s= (String)m.get(2);	entrega el objeto asociado a la llave 2 ("hola"). Si la llave no posee valor asociado se produce un error.	String getString(int ll)
if (m.isMapped(2)) ...	entrega verdadero si la llave 2 tiene un valor asociado.	boolean isMapped(int ll)
m.remove(2)	elimina la asociación (2,...) del arreglo asociativo.	void remove(int ll)

Por simplicidad, esta versión restringida de Map está restringida sólo a valores de tipo String. Más tarde veremos como enriquecer esta clase para cualquier tipo de valores (pero no cualquier llave). Por lo tanto las siguientes operaciones no estarán implementadas:

    m.put(1, 3);    // no implementada
    m.put(1, 3.14); // no implementada

Representación de un arreglo asociativo usando listas enlazadas

Se usa un eslabón por cada par (llave, valor asociado) presente en el arreglo asociativo. En cada eslabón se almacena la llave, el valor asociado y la referencia del próximo eslabón en la lista enlazada.

En la figura se observa la estructura de una arreglo asociativo que posee las asociaciones (2, "hola"), (5, "que") y (3, "tal").

En el objeto que representa el arreglo asociativo se coloca una referencia del primer eslabón de la lista enlazada. Por conveniencia, se incluye un eslabón falso para que la lista nunca esté vacía. En este caso no es útil tener una referencia del último eslabón, porque ninguna operación requiere agregar algún eslabón al final de la lista enlazada.

Observe que el orden en que se organiza la lista enlazada es irrelevante. El eslabón que contiene la llave 2 podría haber quedado perfectamente después del eslabón de la llave 5 sin alterar el contenido formal del arreglo asociativo. El orden en que quedarán almacenadas las llaves depende únicamente del orden en que se hagan las asociaciones.

Por lo tanto, la estructura de representación de la clase Map y la clase EslabónM es la siguiente:

    class Map extends Program {
      EslabonM primero= new EslabonM(0, null, null);
      ... la implementación de la operaciones de Map ...
    }
    class EslabonM {
      int llave;
      String val;
      EslabonM proximo;
      EslabomM(int llave, String val, EslabomM proximo) {
        this.llave= llave;
        this.val= val;
        this.proximo= proximo;
      }
    }

Búsqueda de una llave en la lista enlazada

Para implementar la operación get se usa el patrón de recorrido de la lista enlazada. Al hacer la búsqueda de la llave no se necesita visitar el eslabón falso por lo tanto el recorrido de los eslabones comienza por el segundo eslabón:

    String getString(int llave) {
      EslabonM e= primero.proximo;
      while (e!=null) {
        if (e.llave==llave)
          return e.val;
        e= e.proximo;
      }
      fatalError("No se encontro la llave "+i); // termina la ejecución!
      return null; // para que pase la compilacion
    }

La búsqueda termina cuando se encuentra la llave especifica o cuando se acaba la lista enlazada. En este último caso el programa termina con un mensaje de error.

También se necesita hacer este mismo recorrido con la operación put. Si la llave existe se modifica el valor en el mismo eslabón. Si la llave no existía previamente en la lista enlazada, se crea un nuevo eslabón para esa llave y se agrega por conveniencia justo después del eslabón falso:

    void put(int llave, String val) {
      EslabonM e= primero.proximo;
      while (e!=null) {
        if (e.llave==llave) { // la llave existe
          e.val= val;         // cambiamos su valor
          return;             // y retornamos
        }
        e= e.proximo;
      }
      // la llave no existía previamente
      // Creamos un nuevo eslabon y lo agregamos entre el eslabon
      // falso y el segundo eslabon
      e= new EslabonM(llave, val, primero.proximo);
      primero.proximo= e;
    }

La siguiente figura muestra el caso en que la llave ya existía previamente en el arreglo asociativo:

Ejercicio: Verifique que las dos operaciones funcionan correctamente cuando el arreglo asociativo se encuentra vacío (cuando la lista enlazada sólo contiene el eslabón falso).

Eliminación de un eslabón en la lista enlazada

La operación remove elimina una asociación en el arreglo asociativo. Esto equivale a eliminar el eslabón que contiene la llave especificada.

El primer intento de implementación que viene a la mente consiste en usar el patrón de recorrido de los eslabones para buscar la llave que se desea eliminar. Sin embargo, este patrón no sirve porque cuando se encuentre la llave, la variable de instancia prox que hay que modificar se encuentra en el eslabón visitado en la iteración anterior. Pero este eslabón ya se visitó y no es posible volverlo a recorrer si comenzar por el primer eslabón.

Para resolver el problema, modificamos ligeramente el patrón de recorrido de modo de mantener en la variable anterior el eslabón visitado en la iteración anterior. La siguiente figura muestra cómo realizar la eliminación del eslabón utilizando la variable anterior:

El código para eliminar una llave del arreglo asociativo es entonces:

    void remove(int llave) {
      EslabonM anterior= primero;
      EslabonM proximo= primer.proximo;
      while (proximo!=null && proximo.llave!=llave) {
        anterior= proximo;
        proximo= proximo.proximo;
      }
      if (proximo==null) // la llave no existe en el arreglo asociativo
        return;
      // la llave si existe, por lo que se elimina el eslabon
      // referenciado por proximo
      anterior.proximo= proximo.proximo;
    }

La eliminación es una operación frecuente con las listas enlazadas, por lo que este trozo de código constituye un patrón de programación. Estúdielo cuidadosamente.

Análisis del tiempo de ejecución de las operaciones

Sea n el número de asociaciones que contiene un arreglo asociativo implementado usando listas enlazadas. El tiempo que toma cada una de las operaciones es el siguiente:

Tiempo de get: O(n).
Tiempo de put: O(n).
Tiempo de remove: O(n).

Estos tiempos son válidos tanto para el caso peor como para el caso promedio.

Observe que construir un arreglo asociativo de n llaves toma tiempo O(n*n), lo que sabemos es muy ineficiente de acuerdo a lo estudiado con los algoritmos de ordenamiento.

En la próxima clase veremos una implementación eficiente de un arreglo asociativo que permite construir un arreglo con n asociaciones en tiempo O(n*log n) en el caso promedio. Esta implementación estará basada en un nueva estructura de datos: el árbol de búsqueda binaria.

Resumen

Todas las operaciones que hemos realizado con listas enlazadas se pueden resumir en los siguientes patrones de programación: