PageRank

En prácticamente todos los eventos acerca de Google, posicionamiento en buscadores o SEO -search engine optimization-, se habla de un enigmático elemento: El PageRank. La barra de PageRank se ha hecho famosa entre los webmasters, que esgrimen con orgullo o se lamentan de la cifra mágica que ella otorga a cada sitio web.

Pero ¿Qué es exactamente el PageRank de una página web? ¿Cómo influye en los resultados de búsqueda de Google? ¿Qué podemos hacer al respecto?

El mismo Google define PageRank como: “El PageRank se basa en la exclusiva naturaleza democrática de la web y usa su extensa estructura de vínculos como un indicador del valor de una página individual. Google interpreta un vínculo desde la página A hacia la página B como un voto de la página A por la página B.”
Pero Google revisa otras cosas aparte del número de votos o de vínculos que una página recibe, puesto que también analiza la página web que emite el voto. Los votos emitidos por páginas que son en sí mismas “importantes” pesan más y ayudan a convertir a otras páginas también en “importantes”.

El PageRank por tanto, cuenta la cantidad de enlaces entrantes, pero además pondera la calidad de esos enlaces. Y todo eso a la vez, para todo Internet.

El concepto de PageRank emana de los mismos fundadores de Google. La idea fue revolucionaria en su momento y podemos pensar que sigue siendo el núcleo duro del ADN del algoritmo de Google.

Como podemos ver el PageRank de una página web

Una manera de saber cuál es el PageRank de una página es la que nos facilita el propio Google a través del medidor de su barra –Google toolbar. Para poder ver cuál es el PageRank de las distintas páginas hay que descargar esa herramienta de navegación y activar la opción del medidor de PageRank.

Una vez instalada la barra de Google, el PageRank se distingue como una pequeña barra horizontal.

PageRank

La imagen muestra el medidor de PageRank para la página web principal de google –www.google.com. Está en 10/10, algo realmente inusual.

Cuando la barra aparece como gris significa que el sitio Web no está indexado. Si la barra completa es blanca significa que posee un valor cero y finalmente, dependiendo del grado de verde que muestra la barra, indicará el nivel de PageRank.

Se considera un buen PageRank a partir de 3/10. Son muy pocos los sitios Web que poseen un PageRank por encima de 6/10. Tan sólo Google y escasísimas páginas logran el 10. En español, el portal universitario universia.es tiene un PageRank de 10, mientras que los principales medios de comunicación tienen entre 6 y 9 (Elmundo.es).

PageRank

El PageRank que muestra una página varía con el tiempo. Sube si esa página recibe de forma adecuada enlaces, y baja si Google detecta algo incorrecto que la afecta. Es mucho más fácil, como veremos, pasar de un PageRank de 0 a uno de 1, que pasar de 1 a 2, y así sucesivamente, puesto que la distancia entre los distintos niveles no es lineal.

Google suele actualizar el valor del PageRank cada cierto tiempo, normalmente cada tres meses. Sin embargo, en los últimos tiempos, ha variado tanto en la regularidad de las actualizaciones -a veces pasan más de tres meses entre una y otra- como en la cantidad de páginas web afectadas por esa actualización, que en ocasiones es selectiva.

Todo indica que a Google no le gusta dar demasiadas pistas sobre el PageRank.

Los fundadores de Google explican el PageRank en detalle en un documento publicado en 1998.
Allí dicen que “uno puede pensar en un enlace como una cita académica. Por tanto, una página web importante como Yahoo! tendrá decenas de miles de enlaces entrantes (o citas) que apuntan a ella” (The PageRank Citation Ranking: Bringing Order to the Web, (Sergei Brin and Larry Page, 1998)

No expondremos aquí las complejísimas operaciones matemáticas que permiten calcular el PageRank de una página. Las explican Amy Langville y Carl D. Meyer, en su obra ya citada, “PageRank and beyond, the science of search engine rankings” (2006), pero bastará indicar que el PageRank original depende de:

  • El número de enlaces entrantes hacia la página web en cuestión.
  • La calidad de esos enlaces entrantes (el PageRank de las páginas que mandan el enlace).
  • El número de otros enlaces salientes hacia otras páginas en las páginas que mandan el enlace. Si la página que enlaza tiene muchos enlaces salientes, “la fuerza” de ese enlace es menor.

Para comprender mejor de qué se trata, podemos comparar el sistema de enlaces con un sistema de riego. El PageRank sería la cantidad total de agua que le llega a un campo –página web- determinado en un momento dado, a través de múltiples cañerías -enlaces.

Si el agua que recibe por una cañería viene de un pantano con numerosas cañerías hacia otros campos, evidentemente llega menos agua. La calidad del agua dependerá de la calidad de los pantanos. Un sitio web, compuesto de numerosas páginas web, tiene también un sistema interno de “riego” y redistribución del PageRank –agua. Por un lado, desde el home se transfiere una cantidad considerable de PageRank a las páginas web internas. Por otro lado, cada página creada es un pequeño afluente, y cuantas más páginas tenga, más agua le llegará a la página principal del sitio web. Eso explica en parte por qué sitios web de, por ejemplo, noticias, tienen un PageRank elevado, puesto que tienen una gran cantidad de páginas y enlaces internos que fluyen hacia el sitio principal. Además cuentan con numerosos enlaces entrantes, al home y muchas de sus páginas.

También podemos pensar en el PageRank como un sistema de referencias y créditos académicos. Cuantos más reciba un autor -una página web- mejor, pero contará quién da la referencia -no es lo mismo una eminencia que otra persona mucho menos reputada- y también contará -o al menos debería contar- la facilidad con la que un experto da buenas referencias sobre la obra de los demás -en otras palabras, si cita a miles de autores o sólo a unos pocos.

¿Cuán importante es el PageRank?

Google dice una y otra vez que los webmasters y gestores de los sitios web no deberían obsesionarse con el PageRank, porque es uno de muchos factores. Hay expertos que afirman que sigue siendo muy importante, mientras que otros afirman que ya no tiene tanto peso.

¿Cuál es la realidad?

La investigación realizada confirma que el PageRank de una página web influye poderosamente en las posiciones de esa página en los resultados de Google. Pero ¿Cuánto exactamente? En la muestra, el 85,8% de las 359 páginas web en primera posición para distintas palabras clave tienen un PageRank de 3 o más. Es decir, 308 páginas de un total de 359.

Podemos concluir por tanto que, diga lo que diga Google, para alcanzar una primera posición en sus resultados para una palabra clave es fundamental gozar de un PageRank elevado -igual o mayor de 3.

Veamos cómo se distribuye el PageRank en las páginas web en la primera posición de nuestro estudio:

RESULTADO: PAGERANK DE LAS PÁGINAS WEB EN 1ª POSICIÓN

ara comprender mejor de qué se trata, podemos comparar el sistema de enlaces con un sistema de riego. El PageRank sería la cantidad total de agua que le llega a un campo –página web- determinado en un momento dado, a través de múltiples cañerías -enlaces.   Si el agua que recibe por una cañería viene de un pantano con numerosas cañerías hacia otros campos, evidentemente llega menos agua. La calidad del agua dependerá de la calidad de los pantanos. Un sitio web, compuesto de numerosas páginas web, tiene también un sistema interno de “riego” y redistribución del PageRank –agua. Por un lado, desde el home se transfiere una cantidad considerable de PageRank a las páginas web internas. Por otro lado, cada página creada es un pequeño afluente, y cuantas más páginas tenga, más agua le llegará a la página principal del sitio web. Eso explica en parte por qué sitios web de, por ejemplo, noticias, tienen un PageRank elevado, puesto que tienen una gran cantidad de páginas y enlaces internos que fluyen hacia el sitio principal. Además cuentan con numerosos enlaces entrantes, al home y muchas de sus páginas.   También podemos pensar en el PageRank como un sistema de referencias y créditos académicos. Cuantos más reciba un autor –una página web- mejor, pero contará quién da la referencia –no es lo mismo una eminencia que otra persona mucho menos reputada- y también contará –o al menos debería contar- la facilidad con la que un experto da buenas referencias sobre la obra de los demás –en otras palabras, si cita a miles de autores o sólo a unos pocos.   ¿Cuán importante es el PageRank?   Google dice una y otra vez que los webmasters y gestores de los sitios web no deberían obsesionarse con el PageRank, porque es uno de muchos factores. Hay expertos que afirman que sigue siendo muy importante, mientras que otros afirman que ya no tiene tanto peso.   ¿Cuál es la realidad?   La investigación realizada confirma que el PageRank de una página web influye poderosamente en las posiciones de esa página en los resultados de Google. Pero ¿Cuánto exactamente? En la muestra, el 85,8% de las 359 páginas web en primera posición para distintas palabras clave tienen un PageRank de 3 o más. Es decir, 308 páginas de un total de 359.   Podemos concluir por tanto que, diga lo que diga Google, para alcanzar una primera posición en sus resultados para una palabra clave es fundamental gozar de un PageRank elevado –igual o mayor de 3.   Veamos cómo se distribuye el PageRank en las páginas web en la primera posición de nuestro estudio:   RESULTADO: PAGERANK DE LAS PÁGINAS WEB EN 1ª POSICIÓN

En la tabla observamos que hay un 27, 6% de las páginas web con un PageRank de 5, un 24,8% con un PageRank de 6 y un 8,9% que cuenta con un PageRank de 7, 8 o 9. Si las sumamos, vemos que un 61,3% de las páginas web tienen un PageRank de 5 o superior. Hay 31 páginas web ganadoras que tienen un PageRank de 2. Sólo trece de ellas tienen un PageRank de 1, y tan sólo siete de ellas –un 1,9% del total- tienen un PageRank de 0. La media de PageRank (en barra) es de 4,6.

Queda claro por tanto que el PageRank sigue teniendo una importancia fundamental a la hora de destacar en los resultados de búsquedas de Google.

La gráfica indica cómo se distribuye el PageRank entre las 359 páginas. El eje vertical muestra la frecuencia –el número de veces que se repite cada valor de PageRank.

PageRank

En la siguiente gráfica con forma de tarta podemos apreciar que indica cómo se distribuye el PageRank entre las 359 páginas. Cada color de la tarta corresponde con un número de PageRank. Más del 60% de las páginas web tienen un PageRank de 5 (rojo) o superior (los cuatro colores posteriores al rojo, en el sentido de las manecillas del reloj).

PageRank

Hemos visto que el PageRank, en su formulación original, se consigue a través de los enlaces entrantes. Si contrastamos los datos del PageRank con los datos acerca de los enlaces entrantes externos, llegamos a una paradoja aparente. Existen 27 páginas que no reciben directamente ningún enlace entrante externo de otros sitios web y sin embargo comprobamos que 20 de ellas tienen un PageRank positivo -tan sólo 7 páginas tienen un PageRank de 0-.

Analicemos este asunto en detalle. En la siguiente tabla podemos ver las páginas que no reciben enlaces entrantes externos, la palabra clave para la que aparecen, respectivamente, en primera posición, y su PageRank.

PageRank

En esta tabla podemos ver los mismos datos que en la anterior, pero hay además una columna adicional que nos indica el número de enlaces entrantes externos que recibe todo el sitio web.

Las páginas web que tienen algo de PageRank sin recibir enlaces entrantes externos están alojadas en sitios web que reciben numerosos enlaces entrantes externos. Vemos por tanto que estas páginas reciben flujos de PageRank internos, que provienen de sus propios sitios web. Observaremos en detalle este criterio más adelante, pero era relevante sacarlo a colación para explicar la aparente paradoja.

También podemos deducir que existen otros factores, además del número de enlaces entrantes a la página y del trasvase interno de enlaces, que afectan el PageRank, ya que, como veremos, la correlación entre el número de enlaces entrantes y PageRank, aunque existe, no es próxima a 1.

Trustrank

Aquí es donde entra el denominado Trustrank, que es un sistema ideado originalmente por la Universidad de Standford y Yahoo! -descrito en este documento– para combatir la basura -spam- en Internet, y poder distinguir entre buenos y malos enlaces. Se trata de elegir una serie de sitios web con buena reputación, y diseñar una forma de darles automáticamente más peso a los enlaces que provengan de ese selecto “club” de sitios web. Con los datos que hemos analizado ya podemos aventurar que Google incluye dentro de su cálculo de PageRank –o en paralelo a él- un componente de TrustRank que depende de la calidad de los sitios web que enlazan una página web determinada. Eso explicaría en parte por qué las páginas de la Wikipedia tienen en su inmensa mayoría, -incluso las que no disfrutan de numerosos enlaces externos- un elevado PageRank y obtienen excelentes posiciones en resultados de búsqueda. Google les da a todas ellas “un empujón” en sus resultados, porque se fía de la Wikipedia, y además por otro lado el sitio web descuella en varios factores estructurales –como veremos más adelante- como son la edad, el número de páginas indexadas y el número total de enlaces que recibe.

BadRank

En el extremo conceptual opuesto del PageRank -le afecta negativamente- nos topamos con el BadRank. Si el PageRank de nuestra página web concreta sube cuando recibe enlaces desde otras páginas web, que nos transfieren parte de su propio PageRank, el BankRank funciona de manera muy distinta. Se basa en los enlaces que nosotros colocamos en nuestra página web, hacia páginas web que Google considera indeseables. El buscador hasta ahora no ha penalizado los enlaces que podamos recibir de piratas, spammers u otros parias de Internet -no es culpa nuestra- pero sí penaliza los enlaces que nosotros colocamos desde nuestra página -que controlamos- hacia esos “indeseables”. Eso es el BadRank, que sin duda disminuye el PageRank de una página web concreta. El BadRank es por tanto consecuencia de enlazar desde nuestra página web hacia “los malos vecindarios” de internet -que a su vez tienen un BadRank elevado. Google nos penaliza por asociar nuestra página web con los malos.

Cuando ponemos un enlace en nuestra página web hacia una página web de elevado BadRank, parte de éste flujo negativo nos vuelve a nosotros. Es probable que Google calcule el BadRank y el PageRank por separado, y luego, de alguna manera, reste aquél a éste -o los divida. La prueba de que el BadRank existe nos la da un considerable número de páginas web que reciben un PageRank de 0, a pesar de disfrutar de numerosos enlaces entrantes externos e internos. De alguna manera ese PageRank positivo se neutraliza con BadRank negativo. Si tuviéramos que reducir todo esto a una formula, podríamos decir que:

PageRank final = PageRank inicial (número y calidad de enlaces)*TrustRank – BadRank

Es decir que a la hora de calcular el PageRank, Google analiza profundamente la calidad de los enlaces que recibe una página web y también de los enlaces que esa página envía a otras páginas web.

PageRank en barra versus PageRank real

Hay que tener también en cuenta que el número del 0 a 10 de PageRank reflejado en el medidor de esta famosa barra de Google no es aritmético, sino exponencial o logarítmico. El Pagerank en barra, como valor entre 0 y 10 es una simplificación que realiza Google del Pagerank real, que es un número muy superior, puesto que tiene un factor exponencial –vamos a asumir que es 8, aunque no lo sabemos a ciencia cierta. Dicho de otra manera, del 1 al 2 de Pagerank en la barra de Google, hay ocho veces más “fuerza”.

Los valores de PageRank real quedarían como siguen:

PageRank

Tabla del autor que muestra el PageRank de la barra de Google y su equivalente real, asumiendo un factor 8

Con esos datos, podemos asociar a cada número de PageRank en barra un número de PageRank real, calculado como la media de la horquilla en cada caso. De esta forma nos quedaría como sigue:

PageRank

Tabla del autor que muestra el valor promedio de PageRank real para cada valor de PageRank de la barra de Google.

Veamos qué ocurre si sustituimos el valor de PageRank en barra por ese valor promedio de PageRank real, en cada uno de los 359 resultados de nuestra investigación.

La media de PageRank real, calculado de esta manera, es de 645.802,3. Como vemos en la tabla anterior, este valor entra dentro de la casilla de PageRank real de 7. Es lógico que así sea, puesto que al tener una base de 8, los PageRank superiores elevan la media –que es de 4,6 para PageRank en barra y 7 para PageRank real.

Correlaciones de la variable PageRank real

Observamos las siguientes correlaciones entre esta nueva variable de PageRank real y algunas otras variables:

PageRank

En la última columna de la derecha observamos la correlación (Pearson) y el valor de Sigma bilateral. La correlación mide la relación entre las dos variables, y oscila en -1 y +1. Esa correlación es significativa para valores pequeños de Sigma bilateral. Cuánto más próximo a 0 sea este parámetro, más clara es la existencia de esa correlación.

Con esos criterios de rigor estadístico, podemos ver que la variable de PageRank real guarda relación positiva con las siguientes variables:

Correlación con la variable PageRank en barra

PageRank PR                                                                Correlación de Pearson      0,257(**)

El Sigma nos da 0, y confirma lo que ya sabemos, puesto que el PageRank en barra ha sido la base de cálculo del PageRank real; sería extraño que no se diera esta correlación.

Correlación con la variable número enlaces entrantes

Número de enlaces entrantes                                        Correlación de Pearson     0,122(*)

El sigma es de 0,021, y por tanto muy próximo a 0. Esta correlación es también lógica puesto que, como sabemos, los enlaces entrantes que recibe una página web desde otras páginas son la base principal del cálculo original del PageRank.

Correlación con la variable edad del sitio web

Edad del sitio web                                                         Correlación de Pearson    0,169(**)

Con un valor de Sigma bilateral próximo a 0, esta correlación nos demuestra que la edad de un sitio web se relaciona positivamente con el PageRank real de una página. A más edad, más PageRank. Ora porque recibe más enlaces entrantes conforme pasa el tiempo, ora porque en el cálculo de PageRank, Google considera no sólo los enlaces entrantes sino también la antigüedad del sitio web, como factor de confianza.

Número de enlaces entrantes

Como hemos indicado anteriormente, el número de enlaces entrantes externos que recibe una página web es la base de su PageRank y el más importante de los factores de posicionamiento denominados externos -en inglés, off-page- fuera de la página web.
Por enlaces entrantes entendemos los enlaces, vínculos o hipertextos de otras páginas web que llevan a la página web que estamos analizando.

El instituto SEOmoz, especializado en técnicas de optimización de buscadores (SEO), realiza un estudio basado en entrevistas a expertos de todo el mundo acerca de los elementos más importantes de los algoritmos de los buscadores. En su último estudio, el 71% de esos expertos considera que la cantidad y calidad de los enlaces entrantes -en inglés External Link Popularity (quantity/quality of external links)- es un factor muy importante en el algoritmo.

Si vamos a nuestra investigación, observamos que el número de enlaces entrantes externos varía entre 0 (es el caso de 27 páginas web, por ejemplo la página web en primera posición para “amedrentar”, hasta la enorme cantidad de enlaces externos -6.139.755- que apuntan a Qué! sitio web de un periódico gratuito y número uno para la búsqueda “que”.

La media es de más ochenta y tres mil -83.243- enlaces entrantes hacia cada página web que ocupa la primera posición, por lo que podemos concluir que a priori se necesitan un elevado número de enlaces entrantes para lograr la primera posición en los resultados de Google para una palabra clave determinada.

En este momento surge una pregunta: ¿Cómo es posible que, si como sabemos, el número de enlaces entrantes a una página web es la base del algoritmo de Google, pueda haber 27 páginas web que consiguen aparecer en primera posición para la búsqueda de alguna palabra clave sin tener ningún enlace entrante?

Para responder a esa pregunta, en la siguiente página podemos encontrar la lista de esas 27 páginas web.

PageRank

Como vemos, la gran mayoría de esas páginas web están alojadas en el sitio web www.wordreference.com lo cual compensa su ausencia de enlaces externos, como veremos más adelante, debido a otros factores del sitio web que mejoran las posiciones de sus páginas.

Por otro lado, la mayoría de estas páginas web aparecen en primeras posiciones para palabras clave poco competitivas.

¿Y qué podemos hacer al respecto?

Ya sabemos la importancia que tiene el PageRank de una página web para que logre obtener posiciones destacadas en Google. Y bien, ¿qué podemos hacer al respecto?

Enlaces, enlaces, enlaces

Por un lado, tenemos la certeza de que cuantos más enlaces reciba nuestra página web, mucho mejor. Más alto será el PageRank, y las posibilidades que tiene esa página de alcanzar posiciones destacadas en los resultados de búsqueda. No obstante, hay que tener en cuenta una serie de criterios.

Para empezar, es fundamental que la página web que nos envía el enlace esté indexada en Google. Si no lo está, ese enlace no cuenta. Pero si la página web está indexada, siempre será positivo, a priori, que nos envíe un enlace hacia nuestra página. Por eso es importante conseguir, de una y mil maneras, todos los enlaces que podamos.
¿Cómo conseguimos enlaces? Lo primero que debemos hacer es solicitárselos a todos nuestros conocidos y amigos. Parece obvio, pero hay quien no lo hace.

¡Pide a todas las personas que conozcas que tengan acceso a alguna página web que te enlacen!

Después de eso, tenemos que lanzar una estrategia coherente de “linkbuilding” -construcción de enlaces en inglés- o lo que es lo mismo, de obtención de enlaces.

  1. Enlaces de directorios. Obtener enlaces de directorios, ya sean de pago o gratuitos, es una vieja -en términos relativos, claro- estrategia de obtención de enlaces. Su eficacia es, hoy por hoy, bastante dudosa. No diré que nula, pero casi, puesto que Google hace tiempo que le ha quitado fuerza a los enlaces de directorios. Las únicas excepciones son enlaces de directorios muy reputados, que le sirven a Google de referencia, porque son directorios editados por humanos -la inclusión en esos directorios no es automática, sino que hay un proceso de selección y verificación. Entre esos directorios destaca, como no, el propio directorio de Google, que es gratuito, si bien es cada vez más difícil lograr ser aceptado ahí. El proceso de verificación tarda meses. Algunos directorios adicionales de prestigio son de pago.
  2. Escribir artículos. Una buena manera de conseguir enlaces es escribir artículos sobre temas interesantes, y agregarles un enlace en alguna parte del texto. Hay una serie de sitios web que reproducen artículos, y que por tanto generan enlaces. También aquí Google ha ido espabilando, y quita fuerza a los enlaces que se generan de esta manera, aunque todavía cuentan algo.
  3. Producir videos, aplicaciones, extensiones u otros contenidos. Con la misma lógica que los artículos, si producimos contenidos interesantes podremos generar enlaces hacia nuestro sitio web, siempre que esos contenidos contengan el hipervínculo apropiado hacia nuestra página web. Es lo que denominan linkbait en inglés, es decir, “anzuelos de enlaces”, que se lanzan con la intención de que su distribución entre una gran cantidad de usuarios genere enlaces hacia nuestra página web.
  4. Gestión de intercambio de enlaces. Raro es el contacto administrativo de un sitio web que no ha recibido un correo electrónico solicitando un intercambio recíproco de enlaces. Se trata de una propuesta de trueque, a menudo automatizada. Tú me enlazas a mí, yo te enlazo a ti y todos tan contentos. Google sin embargo hace tiempo que sabe que se trata de un trueque, y resta valor a los enlaces recíprocos de características semejantes, que “huelen” a intercambio de enlaces.

Cantidad y calidad

Ya hemos visto que cuantos más enlaces generemos, mucho mejor. Sin embargo, debemos ser conscientes de que la calidad también cuenta. Por un lado, los enlaces de mayor calidad nos pasarán más PageRank. Por otro lado, hay enlaces que transmiten autoridad, credibilidad, confianza, porque tienen un elevado TrustRank. Cuando recibimos un enlace de un sitio web con elevada reputación, esto nos transfiere a nosotros también parte de esa reputación positiva.

El texto-ancla es fundamental

Además del número y la calidad de los enlaces, es fundamental prestar atención al texto asociado a esos enlaces, es decir, al texto-ancla -Anchor Text en inglés- que es el texto visible en un enlace de una página web. Es aquel que nos encontramos generalmente en color azul y que se puede pinchar.

Google asociará una página web con el texto-ancla de los enlaces que esa página web recibe. Por ejemplo, si ahora mismo buscamos en Google.es, aparece en posición destacada de los resultados la página web:

https://sede.educacion.gob.es/catalogo-tramites/becas-ayudas-subvenciones/para-estudiar/primaria-secundaria/beca-necesidad-especifica.html

Que es una página web del Ministerio de Educación español que explica los trámites necesarios para obtener becas y ayudas para cursar estudios reglados de enseñanza en niveles obligatorios y postobligatorios en España.

A priori, esa página web tiene escasa relevancia para la búsqueda, porque no detalla los términos de búsqueda “pulsa aquí”. Sin embargo, hay miles de páginas web que enlazan hacia esa página web, y en esos enlaces dice “pulsa aquí”.Google procesa esos enlaces, y asocia la página con el texto de los mismos.

Es lo que permite la realización de “bombas Google”.
¿Qué es una bomba Google o Google bomb?

Es una acción concertada por un número de informáticos que permite colocar ciertas páginas web en los primeros lugares de los resultados de una búsqueda en Google utilizando una palabra clave determinada. Se consigue incluyendo enlaces a la página web objeto del “Google bomb” en el mayor número de páginas distintas posibles, de manera que el texto del enlace sea el criterio de búsqueda –palabra-clave- deseado.

Como tantas otras cosas inherentes a Google, la empresa afirma haber resuelto el problema en enero de 2007. Pero no es así. Hay bombas Google y las habrá, aunque sea ahora más complicado lograrlas.

Por ejemplo, a la hora de escribir estas páginas, en noviembre de 2012, la búsqueda de imágenes en google.com para la palabra clave “completely wrong” en inglés significa “totalmente equivocado” mostraba en las primeras posiciones imágenes del candidato republicano a la presidencia de EEUU, Mitt Romney.

PageRank

Otras bombas Google posteriores a enero de 2007 son:

Durante las fases iniciales del proyecto Chanology, una campaña contra la Iglesia de la Cienciología, se realizó una bomba Google que mostraba el portal principal de Cienciología para la búsqueda “secta peligrosa”.

En Septiembre de 2008, el líder del Partido Nacional de Nueva Zelanda aparecía en los resultados de la palabra “ni idea”.
En enero de 2009, un grupo de blogueros búlgaros consiguió asociar la palabra “fracaso” con el sitio web del gobierno de Bulgaria.

En Julio de 2009, la búsqueda “trou du cul du web” (en español, “el ojete de Internet”) daba como primer resultado el portal oficial del presidente francés, Nicolás Sarkozy. En Septiembre de 2010 aparecía la página de Facebook del presidente como primer resultado para esa misma búsqueda.

En septiembre 2009, la búsqueda “ahmadinejad presidente de iran” en idioma farsi daba una falsa página de Google que decía “quieres decir: ahmadinejad NO es presidente de Irán” y enlazaba a un video que explicaba el fraude electoral de 2009.

En febrero de 2011, activistas contra el aborto lograron que el segundo resultado de la búsqueda “muerte” fuera la página sobre el aborto de la Wikipedia en inglés.

Desde julio de 2012, la palabra “plagiator” (que significa plagiador en rumano) lleva a la página personal de Victor Ponta, primer ministro acusado de plagiar su tesis doctoral.

Vemos por tanto que por mucho que Google refine su algoritmo, hay elementos inherentes que no pueden cambiar. Lo que sí es indudable es que Google en la actualidad puede detectar patrones ilógicos o antinaturales de textos ancla, si por ejemplo procesa repentinamente una gran cantidad de enlaces que tienen exactamente el mismo texto ancla. Es conveniente por tanto, cuando estemos tratando de lograr enlaces hacia nuestra página web, que éstos tengan textos-ancla variados. Pueden ser sinónimos –Google lo procesa adecuadamente- o variaciones del mismo texto, a través de frases distintas.

Por ejemplo, en caso de querer promover la página principal del sitio web de una agencia de viajes especializada en Marruecos, en lugar de conseguir una gran cantidad de enlaces con el texto-ancla “viajes a marruecos”, es preferible conseguir enlaces que contengan distintos textos-ancla: “viajes a marruecos”, “viajes en marruecos”, “viajar por marruecos” “viaja a Marruecos”, “encuentra el mejor viaje a Marruecos”, “los mejores viajes a Marruecos”, “viajes”, “Marruecos”, etc. Google verá con buenos ojos este patrón de textos-ancla, y por el contrario, sospechará si de repente procesa una gran cantidad de enlaces hacia esa página web con exactamente el mismo texto-ancla “viajes a Marruecos”.

Ubicación del enlace dentro de la página

Por otro lado, es importante la ubicación de un enlace dentro de una página web. No cuentan igual los enlaces situados en partes destacadas de una página web que los enlaces situados en la parte final, al pie de página. La parte más noble de una página, ante los ojos de Google es la parte superior izquierda. Igualmente, un enlace que esté dentro de un texto tendrá más validez, a priori, que uno que aparezca aislado, al margen del texto principal de una página web.

Fases, plazos y escalas

Igualmente, Google analiza el factor tiempo en los incrementos de enlaces hacia un sitio web, de forma que sospechará -y penalizará- aquellas páginas web que reciban repentinamente una gran cantidad de enlaces. De esta manera trata de prevenir la compraventa masiva de enlaces. Además de que comprar enlaces está prohibido por Google, comprar un gran número de enlaces de golpe es una idea particularmente mala, porque es probable que Google lo detecte. Igualmente, si Google observa una disminución repentina del número de enlaces hacia un sitio web, sospechará que se trata de alguien que está jugando sucio, y actuará en consecuencia.

Edad de los enlaces

Otro factor importante es la edad de los enlaces. Los “spammers”, que son aquellos sitios web que quieren engañar a Google, crean una gran cantidad de páginas web y enlaces repentinos. Como consecuencia de ello, Google desconfía de las páginas web alojadas en sitios web nuevos -eso lo veremos más adelante- pero además también desconfía de los enlaces nuevos. Por el contrario, favorece los enlaces que tienen una antigüedad superior a un mes, especialmente aquellos que tienen más de seis meses.

De este proceder de Google pueden sacarse varias conclusiones. La primera es que no deben cambiarse los enlaces que apuntan a una página web desde hace tiempo, a no ser que tengamos una muy buena razón para hacerlo. La segunda es que Google funciona siempre con “retraso” respecto a la gestión de enlaces. Si los generamos hoy, veremos los efectos dentro de uno, dos, tres o más meses. Igualmente, si quitamos unos enlaces, la inercia favorable durará un tiempo, y los efectos no serán inmediatos. Finalmente, la tercera conclusión es que debemos evitar la práctica conocida como linkchurning -que se traduciría como revuelco o batido de enlaces- que consiste en hacer y deshacer enlaces automáticamente. De esa forma los enlaces no adquieren antigüedad, y por tanto no gustan a Google.

Distribución de Pagerank de los enlaces

Recomiendo además que los enlaces que recibe una página web provengan de páginas que siguen un patrón de distribución de PageRank lógico. ¿Qué quiere esto decir? Pues que en Internet hay una distribución natural del PageRank entre las distintas páginas web. Por ejemplo, hay muchas más páginas web que tienen un PageRank de 0 o 1 que páginas web que tienen un PageRank de 2 o 3. Y así sucesivamente, habiendo muy pocas de 7, 8, 9 o 10. Si, por ejemplo, una página web recibe una gran cantidad de enlaces con elevado PageRank -5 en adelante-, y muy pocos desde páginas web de PageRank bajo, entonces es probable que los enlaces -o una parte considerable de ellos- hayan sido comprados. Google se “olerá este pastel”. Y le hará de todo menos gracia.

Es necesario, por tanto, generar enlaces que sigan una pauta lógica, desde el punto de vista del PageRank, y evitar generar un número de excesivo de enlaces de PageRank elevado sin un contrapeso de enlaces de PageRank bajo.

Cómo evaluar un enlace potencial

Si por ejemplo alguien propone un intercambio de enlaces, y queremos evaluar la conveniencia de conseguir un enlace desde una página web concreta hacia una de las nuestras, es conveniente repasar lo siguiente:

  1. El PageRank de la página web donde estará el enlace hacia nuestra página web.
  2. El número de enlaces saliente de la página web que nos enlazaría. Cuanto más tenga, menos PagaRank pasará a la nuestra. 
  3. La autoridad y fiabilidad del sitio web principal de la página web desde donde enlazarán hacia nuestra página web.
  4. La relevancia que tengan el sitio web en general y el contenido específico de la página web que nos enlanzaría, respecto al tema de nuestra página web. Si hablan de lo mismo, interesa más.
  5. La parte de la página donde aparecería el enlace hacia nuestra página web.
  6. La calidad de los enlaces próximos a ese lugar.
  7. El texto contextual que estará vinculado con el enlace.