Google - Su historia y su algoritmo

TAREA 5 – ALGORITMO DE GOOGLE

Para la realización de esta tarea, tenemos que explicar la historia de Google y su famoso algoritmo de búsqueda. Así pues, vamos a empezar.
La primer página web que visito es la propia de Google, donde en un apartado titulado “Our story” la propia empresa nos explica “su historia”. Leyendo esta página, podemos ver que Google marca su propio inicio en 1995, en la Universidad de Stanford, cuando se conocieron sus dos fundadores, Larry Page y Sergey Brin. El primero estaba de visita en dicha universidad, decidiendo sobre si estudiar allí o no y el segundo fue el encargado de enseñarle el campus.
Un año después, trabajando desde sus dormitorios, ambos crearon un motor de búsqueda que utilizaba enlaces para determinar la importancia de cada página en la Web. Dicho motor fue nombrado Backrub y posteriormente fue rebautizado como Google.
En 1998 se funda Google Inc, después de la inversión de 100000 dólares por parte de Andy Bechtolsheim. Además fundaron su primera oficina física en un garaje a las afueras de Menlo Park (California), propiedad de Susan Wojcicki.
Hasta aquí llega el recorrido histórico de la propia página web de Google. No obstante, en otras noticias se puede ampliar un poco más el recorrido histórico y podemos saber que es en el año 1999 donde Google se traslada a su ubicación actual, el “Googleplex”. Acabamos este breve recorrido histórico en el año 2004, fecha donde Google cotizó por primera vez en la bolsa Nasdaq.
En los últimos años Google ha dejado de ser únicamente un buscador y ha creado gestores de correo “Gmail”, aplicaciones como Google Maps, Google Earth o ha desarrollado varias aplicaciones para el sistema “Android”.
A continuación voy a explicar como funciona el algoritmo que utiliza Google en su famoso buscador. 
Partiremos de un supuesto teórico en el que tenemos cuatro páginas web. La página 1 enlaza a la página 2. La página 2 enlaza a la página 3. La página 3 enlaza con las páginas 1 y 4. La página 4 no enlaza con nadie. A continuación dicha información es codificada en una matriz. En dicha matriz, cada elemento que enlaza a otra página tiene un valor de 1. Si enlaza a varias, en este caso a dos, se divide 1 por el número de páginas enlazadas (½). Si no enlaza a ninguna página se le asigna el valor de 0. Para completar dicha matriz, como la página 1 no puede enlazarse a sí misma (ni ella ni ninguna) tendrá también un valor de 0.





Una vez tenemos esto, vamos a ver como funciona un buscador de internet. Dicho buscador, o en su representación en este articulo, una araña, cae en una página cualquiera e intenta averiguar todas las rutas posibles que hay en este circuito. Las posibilidades de moverse las tenemos en la matriz anterior. Vemos que los itinerarios entre dos números cuyos valores en la matriz sean 0 serán callejones sin salida, mientras que si cae en una pareja con valor 1, el 100% de las veces realizará ese recorrido. Por otra parte si cae en la página 3, el 50% de las veces la “araña” irá a la web 1 y el otro 50% a la web 4. También hay que tener en cuenta el caso de la web número 4, que no tiene conexión a ninguna otra, por lo que se programa a la “araña” para que pueda ir a cualquiera de las otras páginas, por lo que modificamos nuestra matriz.


Luego hay que tener en cuenta que internet la usan personas, por lo que no irán siempre, el 100% de los casos, de la web 1 a la web 2, por lo que tenemos que ajustar el valor de la matriz por un factor entre 0 y 1 (0 representa que nunca van de 1 a 2, 1 que siempre harán ese recorrido y 0,85, por ejemplo, que este camino se hará en el 85% de los casos). También hay que hacer cálculos con el porcentaje del 15% de casos que no irían de 1 a 2. A continuación simplificamos y nos queda la matriz siguiente.
Seguidamente hemos de multiplicar la matriz por los valores x1, x2, x3 y x4, según el peso que tengan esas páginas en “nuestro” internet. Pasamos a continuación al resultado de este calculo como vemos aquí.

En nuestro ejemplo la web más importante es la número 3, seguida de la 1 y 4 (están igualadas) y en último lugar, la número 2. Google hace esto con todo internet, uno de los peros es que no se sabe como Google acaba de asignar estos valores a x1, x2, x3 y x4. Con estos valores, Google coloca en las páginas web en orden descendente según el resultado final.

Comentaris

Publica un comentari a l'entrada

Entrades populars d'aquest blog

La geometría en el baloncesto

Comparativa de bebidas energéticas

Redacción artículo