Diagrama de Tallos y Hojas

El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener simultáneamente una distribución de frecuencias de la variable y su representación gráfica. Para construirlo basta separar en cada dato el último dígito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formará el tallo).

Esta representación de los datos es semejante a la de un histograma pero además de ser fáciles de elaborar, presentan más información que estos.

Ejemplos

  • Horarios de trenes
  • Edad de 20 personas
  • Comparar dos distribuciones

 

Horarios de trenes

Basándome en un articulo de Juan C. Dürsteler en InfoVis.net, tomamos como ejemplo un horario de trenes confeccionado a partir de un díptico de la línea Castelldefels-Barcelona/Sants recogido en la estación de Renfe. Originalmente el horario ocupa una tabla de 10 filas y 9 columnas más una columna "viuda" con el tren de las 22:38. Un total de 91 campos con formato hh.mm cada uno, 455caracteres.

Díptico original Trayecto Castelldefels -> Barcelona-Sants 

En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de separación | y losminutos de la salida de cada tren a la derecha. La frecuencia de los trenes se deduce fácilmente de la longitud de las filas y es, además, muy fácil ver en que minutos de cada hora pasan típicamente los mismos.

Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf

 

05 | 03
06 | 02 18 37 48 55
07 | 02 07 20 25 32 37 50
08 | 02 05 20 24 32 37 51
09 | 02 07 24 32 37                             
10 | 02 07 32 37                                        
11 | 02 07 32 37                                        
12 | 02 07 32 37                                        
13 | 02 07 20 32 37 50                          
14 | 02 07 20 32 37 50            
15 | 02 07 20 32 37 50
16 | 02 07 20 32 37 50
17 | 02 07 20 32 37 50
18 | 02 07 20 32 37 50
19 | 02 07 20 32 37 50
20 | 02 07 20 32 37 50
21 | 02 07 20 32 37
22 | 38

 

Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se puede reducir aún más el tamaño del gráfico, sin perder información  y ganando en claridad.

Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido

 

                                   05 | 03
                                   06 | 02 18 37 48 55
                                   07 | 02 07 20 25 32 37 50
                                   08 | 02 05 20 24 32 37 51
                                   09 | 02 07 24 32 37
                             10 11 12 | 02 07 32 37
              13 14 15 16 17 18 19 20 | 02 07 20 32 37 50
                                   21 | 02 07 20 32 37
                                   22 | 38

 

Al final tenemos 59 campos de 2 dígitos, 118 caracteres más los separadores, es decir 4 veces menos dígitos que con el horario original, menos espacio y más claridad. 

Esto nos da idea de que una disposición apropiada de los datos puede ser doblemente informativa y que la representación gráfica puede contribuir enormemente a la percepción de patrones y a la comprensión de la naturaleza de los fenómenos.

 

Edad de 20 personas

Supongamos la siguiente distribución de frecuencias

 

36  25  37  24  39  20  36  45  31  31
39 24 29 23 41 40 33 24 34 40

 

que representan la edad de un colectivo de N = 20 personas y que vamos a representar mediante un diagrama de Tallos y Hojas. 
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4. 
A continuación efectuamos un recuento y vamos «añadiendo» cada hoja a su tallo

Por último reordenamos las hojas y hemos terminado el diagrama

 

 

 

Comparar dos distribuciones

Podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribución

 

                        35  38  32  28  30  29  27  19  48  40
39 24 24 34 26 41 29 48 28 22

De ella podemos elaborar sus diagrama de Tallos y Hojas y compararla con la anterior.