Google es un motor de búsqueda en la internet., Supongamos
que el internet sea una gran ciudad en donde hay miles
de establecimientos en donde puedas encontrar de todo (productos,
servicios etc.) Lo que hace Google es ayudarte a buscar los
"establecimientos" más reconocidos e importantes para que encuentres
la información, producto(s) etc. que estas buscando pero de
"mayor" calidad. Hay
otros motores de búsqueda como Yahoo y Bing pero ninguno como Google
ya que Google utiliza varios programas y cálculos para que los resultados sean
más completos y la información más fresca sobre lo que estés buscando.
Google nunca ha entendido la web como un
conjunto de documentos de texto, si no como un conjunto de relaciones entre
documentos de texto y cada una de éstas relaciones constituye verdaderamente la
esencia de Google. En este artículo de HelloGoogle veremos cómo se desarrolla
todo el proceso de búsqueda:Cuando escribimos una búsqueda en www.google.com
nuestra petición viaja por el hiperespacio hasta el servidor web de Google.
Google recibe más de 1000 peticiones de búsqueda cada segundo de todos los días
del año. El servidor web de
Google está formado por una red de más de
10.000 equipos trabajando en paralelo. Cada
servidor de la red de
Google es extremadamente sencillo y económico: PCs con procesadores X86, disco
duro IDE y demás prestaciones estándar.
El bajo coste del hardware es la base del modelo de negocio de Google y
lo que le permite ofrecer la mayoría de sus servicios de manera gratuita. Cada servidor falla una vez cada tres
años. Cada día fallan dos
servidores. Si se produce
cualquier problema de hardware, el software de Google lo hace imperceptible
para sus usuarios. Google no ha sufrido un fallo general desde el año 2000.
A continuación se envía la consulta a los servidores de índices de
Google. Cada índice está formado por una relación entre una palabra y la
dirección del servidor de documentos de Google donde se almacenan las páginas
que contienen dicha palabra. Cada
servidor de índices contiene sólo una parte de las webs de Internet y son
necesarios varios servidores trabajando en paralelo para calcular el resultado
de la búsqueda.
Con la información de los índices se accede a los servidores de documentos de Google que contienen una copia de cada web indexada. Google contiene más de 4000 millones de páginas, por cada página almacena 10KB de información, lo que supone 40 Terabytes de información. Google dispone de 50 mirrows (replicas) por cada servidor.Por último se aplica el algoritmo de PageRank para ordenar los resultados de la búsqueda por relevancia. El algoritmo de PR calcula la relevancia de una web gracias a 2 billones de ecuaciones con más de 500 millones de variables. Con toda esta información se crea y muestra al usuario la conocida página de resultados SERP, merece la pena mencionar que Google completa todo este proceso de búsqueda en menos de 1 segundo.
Con la información de los índices se accede a los servidores de documentos de Google que contienen una copia de cada web indexada. Google contiene más de 4000 millones de páginas, por cada página almacena 10KB de información, lo que supone 40 Terabytes de información. Google dispone de 50 mirrows (replicas) por cada servidor.Por último se aplica el algoritmo de PageRank para ordenar los resultados de la búsqueda por relevancia. El algoritmo de PR calcula la relevancia de una web gracias a 2 billones de ecuaciones con más de 500 millones de variables. Con toda esta información se crea y muestra al usuario la conocida página de resultados SERP, merece la pena mencionar que Google completa todo este proceso de búsqueda en menos de 1 segundo.
Comentario:
Google
es una gran herramienta, que nos facilita la búsqueda de mucha información, ya
que es el buscador con más información que existe y buscar la información sería
más fácil si uno supiera como buscarla.
No hay comentarios:
Publicar un comentario