Next: Bases de Datos
Up: Función de Evaluación
Previous: Estilos de juego
  Índice General
La dificultad en realizar una función de evaluación no está por
lo general en su parte básica, sino que más bien en la parte que
abarca aspectos más técnicos del juego los cuales son difíciles de
percibir para jugadores aficionados pero que en jugadores expertos
están asimilados. En todo caso, la sola percepción de estos
patrones no es suficiente para garantizar una diferencia en nivel
ajedrecístico, debe existir también una capacidad de asociar
acciones a ejecutar posteriores al reconocimiento del patrón en
cuestión y que serán distintas respecto de la fase del juego y
también respecto al valor que toman otras características de la
partida. Esta gran combinación de factores hace que la confección
de funciones de evaluación de gran calidad sea una tarea bastante
compleja. Otra observación importante es que la ventaja de tener
una función de evaluación más sofisticada no es a priori tan
"decisiva" como el hecho de tener un nivel de búsqueda en
profundidad por sobre el rival dado que las diferencias en
"percepción" se darán sólo si el patrón de diferencia se
presenta durante el juego, e incluso si ocurre esto, puede que las
diferencias de percepción sean mínimas y por esto no decisivas.
Estas últimas características hicieron que en un principio se
diese una mayor importancia al desarrollo de técnicas de búsquedas
por sobre la investigación en mejoras a la función de evaluación,
si bien curiosamente a principios de los 90 cuando los programas
ya poseían un nivel de búsqueda suficientemente bueno se volviera
a investigar en cómo mejorar la función de evaluación. Esto
resultó ser decisivo para mejorar el conocimiento ajedrecístico de
las máquinas y evitar errores de largo plazo los cuales eran la
principal causa de las derrotas de programas frente a rivales
humanos. Con la colaboración de ajedrecistas profesionales las
funciones de evaluación mejoraron notablemente durante esos años,
logrando sorprender muchas veces la capacidad de los programas de
realizar movimientos "que sólo un humano podría realizar" dadas
las características posicionales y perceptivas de éstos (ver
partida 34 del Anexo B, DeepBlue - Kasparov, movimiento 37).
Comparativamente hablando resulta difícil la labor de determinar
si una función de evaluación de un programa es mejor que otra y
más aún "cuánto" mejor puede ser, dada la complejidad que
comúnmente presentan las funciones de evaluación de buena calidad.
Comparar funciones de evaluación sería algo parecido a comparar la
visión del juego de dos jugadores humanos, distintos en términos
de percepción y emociones. Por ejemplo, las "funciones de
evaluación" de un Mikhail Tahl 7.1 y un Tigran Petrosian 7.2 son tremendamente efectivas
y complejas, pero absolutamente diferentes!. El primero valorizará
en una posición aspectos muy dinámicos como chances de ataques y
líneas abiertas mientras que el segundo tomará aspectos más
posicionales como dominio de casillas, ventaja de espacio, etc.
Ambos tipos de percepción del juego lograron un reconocido nivel
mundial, pero resulta interesante el notar sus tremendas
diferencias.
En máquinas de idénticas características de hardware y con motores de
búsqueda similares habría que realizar un ejercicio en donde
primero se identifiquen los patrones de diferencia entre las
funciones de evaluación de todos los programas y luego realizar
varias partidas entre ellos revisando jugada a jugada los scores
dados por las funciones a la posición en curso y a las que surgen
de la búsqueda en profundidad, observando los resultados y
determinando si las evaluaciones de posición fueron decisivas en
el resultado final de la partida. También podríamos aislar un
patrón de la función de evaluación de un programa (por ejemplo, la
asignación de puntaje de castigo a cierto tipo de estructura de
peones) agregándolo en la función de evaluación de un programa y
omitiéndolo en otro, haciendo jugar a los programas y visualizando
los momentos en donde el factor determinó diferencias en las
evaluaciones de los programas.
Estos ejercicios serían bastante interesantes de realizar, pero
con seguridad la gran cantidad de patrones presentes en el juego y
el hecho de que no es seguro que en una partida se presenten y
sean decisivos puede hacer que la experiencia de comparación sea
una tarea interminable y de resultados no tan exactos. Por esto
prácticamente no se ha mencionado "cuanta" diferencia en rating
tendría una función de evaluación respecto de otra que le sea
"comparable" en parámetros y complejidad, pero si se hace
referencia a la importancia de considerar la mayor cantidad de
patrones posibles en la función (darle mayor conocimiento
ajedrecístico) y darles la adecuada medida de importancia respecto
de la forma de juego que se crea acomoda más al programa.
Next: Bases de Datos
Up: Función de Evaluación
Previous: Estilos de juego
  Índice General
Santiago de Chile, Julio 2003