Berlin Buzzwords – Day 1 – Efficient scoring in Lucene

Die Suche nach effizientem Scoring ist Thema dieses Vortrags.

  • Motivation ist User Experience mit kurzen Antwortzeiten und Kostenersparnis
  • Ein Ansatz ist die Benutzung von Stop-Worten, z.B. The, der, …
  • Um wenige Datensätze zu scoren sind Conjunctions (Verknüpfung mit und) eine effiziente Möglichkeit.
  • Bei Disjunctions (OR-Verknüpfung) müssen viele Datensätze gescored werden und damit ist es langsam.
  • Beim Maxscore Algoritmus werden die maximalen Scores vorberechnet beim auslesen kumuliert. Dabei werden Grenzwerte der einzelnen Teile des Terms miteinbezogen. Er ist besonders effektiv bei großen Resultsets und Terms die oft abgefragt werden.
  • https://issues.apache.org/jira/browse/LUCENE-4100
GD Star Rating
loading...

Kommentar verfassen