Modelo HAL (Hiperespacio Análogo al Lenguaje)

HAL (Hiperespacio Análogo al Lenguaje), propuesto por Burgess y Lund (2000), es un modelo espacial de representación del significado en el que los conceptos se representan como puntos en un espacio dimensional. El modelo léxico semántico HAL utiliza la co-ocurrencia global de la palabra en una selección muy grande de texto para calcular la distancia entre las palabras que co-ocurren en el espacio.

La semejanza semántica entre conceptos es representada por la distancia entre los puntos correspondientes en el espacio. Operativamente, la metodología que se utiliza involucra seguir las co-ocurrencias lexicales dentro de una ventana móvil de 10 palabras, que se desliza a través de un corpus del texto. El corpus incluye aproximadamente 300 millones de palabras tomadas de USENET Newgroups (un sistema mundial de discusión en Internet). Así, el vocabulario de HAL consiste en los 70.000 símbolos más frecuentemente usados en ese corpus. Esta metodología produce una matriz de 70.000 × 70.000 valores de co-ocurrencia.

La base teórica en psicología cognitiva de esta metodología se inspira en los trabajos de Ratcliff y McKoon (1988). Ellos propusieron un modelo alternativo a los que hemos visto para explicar el priming semántico. Sugirieron que cuando dos palabras son presentadas sucesivamente en forma muy rápida, su combinación crea una Clave Compuesta que es usada para ser comparada con otras combinaciones anteriormente almacenadas en la memoria a largo plazo. Como las palabras semánticamente relacionadas coexisten más frecuentemente que las palabras no relacionadas, la familiaridad entre las palabras identificadas y su representación en la memoria aumenta la velocidad de procesamiento, en comparación con pares de palabras no relacionadas anteriormente. Este modelo explica el efecto de priming significativo para relaciones asociativas no necesariamente semánticas. Por otra parte, estos autores sugieren que este efecto constituye un proceso relativamente tardío, pues para construir la Clave Compuesta deben haber sido procesados tanto el prime como la palabra objeto. 

Una propiedad importante de HAL es que dos palabras pueden tener significados muy similares porque ocurren en contextos similares sin que necesariamente aparezcan con frecuencia en la misma oración. HAL es un modelo estructural de explicación del significado pero no posee una arquitectura particular de proceso. La mayor parte de la evidencia a favor del modelo consiste en demostraciones cualitativas o en las correlaciones entre índices generados por el modelo y la conducta humana. Por ejemplo, cuando las distancias entre los vectores que representan la palabra son calculados y tratados con MDS (Escalamiento Multidimensional), las soluciones del escalamiento indican que las palabras están agrupadas en categorías sensibles (Burgess & Lund, 2000). Otros experimentos han demostrado que las distancias entre palabras computadas por HAL predicen el priming en la decisión léxica con una aproximación razonable.