Funcionamiento básico de Google
Vamos a tratar de explicar cómo Google realiza la hazaña de procesar y analizar toda la red.
El proceso de búsqueda en Google se realiza –según sus propias imágenes– de la forma siguiente:
Tras una búsqueda, Google genera páginas de resultados SERP, SearchEngine Result Pages, a través de su complejo y secreto algoritmo matemático que toma en cuenta más de doscientos factores.
“Cuando el usuario realiza una búsqueda de una palabra o una frase, un algoritmo examina la información almacenada en la base de datos y devuelve una lista de enlaces a páginas web que parecen coincidir con el término de búsqueda del usuario”, (Ledford 2008: 5).
Hay que recordar que Google es un buscador basado en texto, no semántico –como serán quizás los del futuro– y por ende no entiende lo que reflejan sus resultados. Un internauta puede ingresar en Google “botín”, y le aparecen resultados del afamado banquero, del conocido restaurante, del sinónimo de recompensa o del tipo específico de bota que lleva ese nombre.
Por otro lado, todo indica que el resultado de una búsqueda en Google es una combinación de dos clasificaciones. Por un lado, está el índice de popularidad –“popularity index” en inglés que como veremos en profundidad más adelante, corresponde con el PageRank, un valor matemático único calculado de forma compleja y actualizado con frecuencia.
De esta manera, a través del PageRank, Google clasifica todas las páginas web que tiene indexadas –miles de millones– en una lista, en función de los puntos de PageRank que tienen. Como indican Amy Langville y Carl D. Meyer en su obra “PageRank and beyond, the science of search engine rankings” (2006), esta clasificación, definida por la cantidad de PageRank, es independiente de la búsqueda concreta –en inglés, “query-independent”. Se obtiene a través de un complejo análisis de la estructura de enlaces de todo Internet (Langville y Meyer, 2006:10-13).
La otra parte fundamental para obtener la clasificación final corresponde con un “índice de contenido” –en inglés, context index”, que sí depende de cada búsqueda concreta.
Google realiza una clasificación para cada palabra-clave, que contiene la lista de todas las páginas web relevantes para esa búsqueda y un puntaje para cada una, otorgado por una gran cantidad de factores. Esta clasificación, a su vez, se combina con el PageRank para lograr la clasificación definitiva.