Berlin Buzzwords – Day 2 – Scaling Massive ElasticSearch Clusters

Die selbe Fragestellung wie im Vortrag davor: Wie kann ich ElasticSearch gut skalieren…

  • Herausforderung: 50 Mio Datensätze, Echtzeitsuche, weniger als 200 ms Latency und mehr als 1000 Queries pro Sekunde
  • Mehrer Indexes, Shards and Replicas pro Node
  • Verteilung der Shards via Routing auf IP-Basis
  • Ergebnis: Eine Shard pro Node + Replikas
  • Dedizierte Nodes wurden als reine Abfrage-Nodes ohne Daten gewählt
  • Sprachen wurden als Analyzer-Query-Parameter bei den Queries mit gegeben
  • Auch hier wird per Routing die Query auf einzelne Shards geschickt, damit lässt sich ein Performancezuwachs um den Faktor 15 erzielen
  • Performancetesting muss durchgehend durchgeführt und ausgewertet werden, z.B. mit SPM
GD Star Rating
loading...

Kommentar verfassen