Você usa todo dia o Google para fazer um mundo de pesquisas, mas você sabe como funciona um mecanismo de busca?
Um mecanismo de busca consiste de seis componentes principais:
1. Crawler ou spider ou robot
Crawler (rastejador), spider (aranha) ou robot (robô), como é chamado, é um componente que interage diretamente com a web e que possui como função descobrir novos documentos e páginas na Internet, de forma a torná-los consultáveis. Esses robôs, de maneira automática e recursiva, visitam as páginas na web, fazem uma leitura delas, copiam, e, seguem os hyperlinks que encontram.
Em um determinado intervalo de tempo, os rastejadores voltam e re-visitam as páginas, garantindo assim que, quando seu conteúdo é atualizado, ele seja incorporado ao índice de documentos do mecanismo de busca.
2. Índice de documentos
O document index, ou índice de documentos, é tipo um repositório que possui a finalidade de guardar todas as páginas e seus respectivos endereços que foram encontrados, capturados e enviados pelos crawlers.
Os arquivos (páginas e URL´s) são compactados, estruturados e catalogados na base de dados, de forma a possibilitar sua localização conforme os parâmetros da consulta efetuada pelo usuário.
3. Cachê de documentos
O document cache, ou cachê de documentos, é um componente que armazena as páginas no formato original que foram encontrados. O cachê de documentos auxilia a visualização das páginas, quando elas não estão disponíveis no momento.
4. Processador de consultas
O query processor, ou processador de consultas, coordena a execução das consultas dos usuários. O processador comunica-se com os demais componentes do mecanismo e efetua três tarefas:
- Distribui as consultas enviadas pelo usuário;
- Obtêm a lista de arquivos relevantes para a consulta;
- Reúne os resultados encontrados pelos demais componentes.
5. Sistema de ranking de documentos
Conforme a consulta do usuário, o document ranking, ou ranqueamento de documentos, efetua o ranking dos documentos encontrados no índice de acordo com sua relevância e importância.
6. Software de interface, interrogação e recuperação
A interface de apresentação ao usuário exerce duas funções:
- Recebe os termos das consultas dos usuários;
- Exibe os resultados encontrados pelo mecanismo de busca.
Pronto! Agora que você sabe como funcionam os buscadores, é só trabalhar os sites para serem otimizados para eles. #SEO