O que é “o caminho certo” para pesquisar em um site?

5

Estou falando do tipo de pesquisa que sugere automaticamente sua consulta enquanto você digita, da maneira como o Google faz, da maneira como a Wikipédia faz, da maneira como o Stack Exchange sugere outras perguntas enquanto digita o título etc. tem uma implementação de pesquisa horrível , para aqueles de nós que se lembram. Não teve auto-sugestão, foi desligado pelo menor erro de digitação ou erro de ortografia e raramente deu resultados pertinentes.

Como programador web amador, estou tentando descobrir como implementar uma pesquisa e uma sugestão automática eficazes e de alto desempenho, como a Wikipedia tem agora, e como a SE tem, e como muitos outros sites têm .

Como você pode obter esse tipo de desempenho e flexibilidade incrivelmente rápidos? Será que todo mundo apenas o apoia, ou existem princípios, diretrizes, bibliotecas úteis ou outros recursos para ajudá-lo a fazer o que é certo no estilo da "Internet do Futuro"?

    
por temporary_user_name 24.01.2013 / 09:09
fonte

1 resposta

6
Para começar, você precisará de um mecanismo de pesquisa de texto completo, como o Apache Solr ou o Sphinx (há mais e alguns bancos de dados têm recursos de texto completo também, mas eu conheço esses dois e eles são gratuitos e funcionam muito bem). Se tiver pesquisa de faceta (como o Solr) isso ajudará muito (para certos tipos de consultas). Isso cobrirá a maior parte dos problemas de indexação e desempenho.

A partir daí, você precisa analisar seus dados e as necessidades de pesquisa de seus clientes e criar uma boa configuração de campos, tipos de campo, ponderações de campo e problemas específicos de pesquisa de texto, como o uso de vários idiomas ou o tratamento de caracteres, dividindo palavras compostas em palavras simples (muito importante para a pesquisa alemã, podemos encadear palavras arbitrariamente aqui).

Além disso, você pode fazer muitas estatísticas, como contar palavras ou frases pesquisadas por seus usuários e compará-las com as estatísticas de seus dados de índice (por exemplo, para descobrir quais sinônimos são relevantes para você)

    
por 24.01.2013 / 09:24
fonte