Berlin Buzzwords – Day 2 – New Directions in Mahout

Wegen Krankheit ein Überraschungstalk zum neuen Entwicklungen in Mahout:

  • Aktuell ist die Version 0.7
  • Integration von Collections
  • K Nearest Neighbour Algorithmen z.B. für Empfehlungs-Systeme => Finde die Kunden, die ähnliche Interessen haben wie ich
  • Die Performance wurd mit Hilfe der Projektion der Punkte auf eine Element mit einer Dimension kleiner und Treesets erreicht
  • Vorclustern bringt den Vorteil, dass man weiss, weche Mengen nicht betrachtet werden müssen. Dies wird mit Hilfe von k-means erreicht.
  • Centroids und Cluster werden rekursiv bei jedem neuen Punkt berechnet
  • Mit Pig-Vector lassen sich Auswertungen auf Texten (Produktbeschreibung A wirkt bei User B sehr gut) in Mahout integrieren, sobald es fertig ist
  • http://www.cloudera.com/blog/2011/11/recommendation-with-apache-mahout-in-cdh3/
GD Star Rating
loading...

Kommentar verfassen