La Web Chilena

La mitad del tamaño de la Web Chilena
se concentra en menos del 5% de los dominios .cl

Durante Mayo del 2000, junto a Carlos Castillo, realizamos un análisis detallado de la Web Chilena en base a las más de 700 mil páginas recolectadas en cerca de 20 mil dominios .cl por el recolector del buscador TodoCL (www.todocl.cl). Este estudio está disponible en el sitio ya mencionado, y aparte de muchos datos estadísticos, encontramos varios fenómenos interesantes. Hablamos de algunos de ellos a continuación.

Contenido y Estructura

Sólo aproximadamente la mitad de los dominios explorados tenía en realidad un sitio Web. El resto de los nombres de dominio están registrados, pero no se usan. De los que sí se usan, sólo el 48% tiene más de una página. Es decir, menos del 25% de los dominios tienen algo más que "sólo estar presentes en Internet". Esto muestra una triste realidad: las empresas aún no usan la Web. De hecho, la mayoría de las páginas Web se concentran en los primeros tres niveles, lo que indique que la organización jerárquica del contenido es poco profunda. Con respecto al idioma, alrededor de un 7% está en inglés y el resto en castellano (otros idiomas es menos del 1%). Sólo estos datos muestran la heterogeneidad y sesgo de la Web Chilena.

Al igual que en el estudio de la estructura de la Web mundial de la que hablábamos en mi columna pasada, la Web Chilena tiene una estructura similar. En este caso preferimos analizar la conectividad a nivel de dominios y no a nivel de páginas individuales. Para ello seleccionamos alrededor de 6 mil dominios. El núcleo fuertement conexo de la Web Chilena lo compone el 25% de los sitios, siendo los 10 dominios más referenciados los de la tabla adjunta (esto indica su popularidad a nivel de Webmasters).

     
uchile.cl 406
elmercurio.cl+mercurio.cl 291
chilnet.cl 267
tercera.cl+latercera.cl 252
brujula.cl 182
puc.cl 169
meteochile.cl 158
bcentral.cl 147
udec.cl 128
sii.cl 127
     

El resto de los sitios se distribuye en sitios alcanzables desde el núcleo (OUT, 45%) pero no viceversa, sitios desde los cuáles se alcanza el núcleo (IN, 15%) pero no al revés, y el resto que son islas o tentáculos que salen de IN, entran en OUT o permiten ir de IN a OUT sin pasar por MAIN (17%). El diagrama anterior muestra esta estructura.

Preferencias de los Usuarios

En base a la estructura anterior se analizaron las preferencias de sitios de dos grupos de usuarios. El primero, los 3.100 sitios de mil dominios clasificados por los editores del Open Directory Project (dmoz.org), que representan un cierto nivel de calidad. El segundo, 18 mil enlaces seguidos por los usuarios de TodoCL que pertenecen a 2.500 dominios distintos. La figura adjunta muestra en qué partes de la estructura de la Web Chilena están los sitios escogidos en ambos casos, donde MAIN-IN (5%) indica las páginas de MAIN que se pueden alcanzar directamente de IN, y análogamente para MAIN-OUT (8%). MAIN-MAIN (2%) indica la intersección de las dos anteriores y MAIN-NORM (11%) el conjunto restante. Notar que los colores corresponden a los del diagrama anterior.

Como se puede observar, los editores prefieren MAIN-NORM, mientras que los usuarios de TodoCL prefieren MAIN-OUT, que en general son directorios que apuntan a muchos sitios y por ende aparecen con mayor frecuencia en las respuestas. Aunque los algoritmos de jerarquización basados en enlaces pueden resolver el problema anterior (como en Google), esto también supone el problema que los sitios nuevos aparecen con menor frecuencia. Este es el efecto de la tiranía de la mayoría: mucha gente usa Yahoo! porque la mayoría usa Yahoo! y si hay algún sitio nuevo mejor, si no tiene publicidad, es difícil que sea conocido. Este mismo efecto se puede observar en programas de televisión o en el uso de software (tarea para la casa). Estos resultados también indican que los sitios a los que uno llega usando un directorio como La Brújula (brujula.cl) o un buscador como TodoCL son distintos y por tanto son herramientas complementarias (además depende de qué queremos encontrar, un sitio o una página específica).


Si tiene preguntas o sugerencias, envíe e-mail a rbaeza@dcc.uchile.cl