martes, 2 de octubre de 2012

FUNCIONAMIENTO DE GOOGLE

Google es un motor de búsqueda en la internet., Supongamos que el internet sea una gran ciudad en donde hay miles de establecimientos en donde puedas encontrar de todo (productos, servicios etc.) Lo que hace Google es ayudarte a buscar los "establecimientos" más reconocidos e importantes para que encuentres la información, producto(s) etc. que estas buscando pero de "mayor" calidad. Hay otros motores de búsqueda como Yahoo y Bing pero ninguno como Google ya que Google utiliza varios programas y cálculos para que los resultados sean más completos y la información más fresca sobre lo que estés buscando.
Google nunca ha entendido la web como un conjunto de documentos de texto, si no como un conjunto de relaciones entre documentos de texto y cada una de éstas relaciones constituye verdaderamente la esencia de Google. En este artículo de HelloGoogle veremos cómo se desarrolla todo el proceso de búsqueda:Cuando escribimos una búsqueda en www.google.com nuestra petición viaja por el hiperespacio hasta el servidor web de Google. Google recibe más de 1000 peticiones de búsqueda cada segundo de todos los días del año.  El servidor web de Google está formado por una red de más de 10.000 equipos trabajando en paralelo.  Cada servidor de la red de Google es extremadamente sencillo y económico: PCs con procesadores X86, disco duro IDE y demás prestaciones estándar.  El bajo coste del hardware es la base del modelo de negocio de Google y lo que le permite ofrecer la mayoría de sus servicios de manera gratuita. Cada servidor falla una vez cada tres años. Cada día fallan dos servidores. Si se produce cualquier problema de hardware, el software de Google lo hace imperceptible para sus usuarios. Google no ha sufrido un fallo general desde el año 2000. 
A continuación se envía la consulta a los servidores de índices de Google. Cada índice está formado por una relación entre una palabra y la dirección del servidor de documentos de Google donde se almacenan las páginas que contienen dicha palabra.  Cada servidor de índices contiene sólo una parte de las webs de Internet y son necesarios varios servidores trabajando en paralelo para calcular el resultado de la búsqueda. 
Con la información de los índices se accede a los servidores de documentos de Google que contienen una copia de cada web indexada. Google contiene más de 4000 millones de páginas, por cada página almacena 10KB de información, lo que supone 40 Terabytes de información. Google dispone de 50 mirrows (replicas) por cada servidor.Por último se aplica el algoritmo de PageRank para ordenar los resultados de la búsqueda por relevancia. El algoritmo de PR calcula la relevancia de una web gracias a 2 billones de ecuaciones con más de 500 millones de variables. Con toda esta información se crea y muestra al usuario la conocida página de resultados SERP, merece la pena mencionar que Google completa todo este proceso de búsqueda en menos de 1 segundo. 
Comentario:
Google es una gran herramienta, que nos facilita la búsqueda de mucha información, ya que es el buscador con más información que existe y buscar la información sería más fácil si uno supiera como buscarla.

No hay comentarios:

Publicar un comentario