La Web y el Principio del Mínimo Esfuerzo

"... una persona resolverá sus problemas de manera de minimizar el trabajo total que debe realizar 
para resolver al mismo tiempo sus problemas inmediatos y sus probables problemas futuros."
George K. Zipf, Human Behavior and the Principle of Least Effort, 1949.


 

El principio del mínimo esfuerzo, enunciado en la obra de G. Zipf, permite explicar muchos resultados del comportamiento humano, y por ende se ha llamado la Ley de Zipf. Este mes exploramos esta ley empírica y su relación con la Web.

El Principio del Mínimo Esfuerzo

George Kipling Zipf era un lingüista de Harvard y publicó su libro un año antes de su deceso, a la prematura edad de 40 años. El descubrimiento inicial de Zipf fue que si uno contaba el número de veces que se usaba cada palabra en distintos textos en inglés, y las ordenaba de más frecuente a menos frecuente, se cumplía que la frecuencia de la palabra i-esima, multiplicada pori, era igual a una constante C, y la constante C dependía del texto escogido. Actualmente, es necesario elevar i a un exponente t mayor que 1 para muchos textos existentes, en particular de la Web. Graficando esta curva usando una escala logarítmica en ambos ejes, ella se convierte en una recta con pendiente negativa t.

Zipf prefirió explicar estos resultados empíricos como una condición humana, donde siempre es más fácil escribir una palabra conocida que usar una menos conocida. Fenómenos similares aparecen en otros ámbitos como el número de citas bibliográficas a un artículo dado o las poblaciones de ciudades. Diversos autores, entre ellos Mandelbrot y Miller, argumentaron más tarde que en realidad la ley de Zipf representa la consecuencia de las leyes de las probabilidades en procesos asociados a codificación de información donde hay mucho de azar. Sin querer tomar partido en esta disputa científica, cierta o no cierta, la ley de Zipf aparece frecuentemente en la práctica y refleja bien la actitud natural de minimizar el esfuerzo, exceptuando los casos extremos, que serían en el ejemplo inicial, usar muy pocas palabras o usar muchas. Tal vez esta ley sólo explica la diversidad humana, la que se inclina más por la pereza que por la erudición. De hecho, que t sea ahora alrededor de 1.8 para textos en inglés, indica un mayor sesgo en esa diversidad, y una degradación en el tiempo de la riqueza del vocabulario que usamos al escribir.

La Web como un Proceso Humano

La Web es el producto del trabajo colaborativo de millones de personas. Si hay algún fenómeno donde el principio del mínimo esfuerzo aparecería si existiera, es la Web. Aparte de la distribución de palabras en la Web, las siguientes medidas siguen una curva de Zipf:

Lo anterior se propaga a otras medidas, como tráfico en la red, uso de proxies, etc. ¿Es todo esto una casualidad producto del azar o un fenómeno del comportamiento humano?. La respuesta aún no es clara, pero la evidencia empírica no deja de sorprenderme.


Si tiene preguntas o sugerencias, envíe e-mail a rbaeza@dcc.uchile.cl