Infinite Scale Clusterarchitektur
Lead Developer und Architekt
Immer wachsende Datenmengen brachten die intelligente Suchlösung von Empolis an ihre Grenzen, da diese in den frühen 2000er Jahren nicht auf eine beliebige Skalierung ausgelegt war.
Daher wurde von mir eine komplett neue Architektur für die kommenden Big Data Herausforderungen entworfen und implementiert.
Inspiriert von dem im selben Jahr erschienenen Dynamo Paper wurde die Architektur konsequent auf Hochverfügbarkeit, Performanz und beliebige Skalierbarkeit ausgelegt.
Neben der Hashring basierten Persistenz wurden ein skalierendes verteiltes Jobmanagent für Batch Verarbeitungen, Map-Reduce, der Lambda-Architektur-Stack für Echtzeitsuchen, etc. implementiert.
Die Verfahren haben ihren Fokus im Bereich der Textanalyse, und intelligentem Retrieval sowie Machine-Learning und sind sehr flexibel mit einer Script-Sprache (Lua) anpassbar.
Aufgaben
- Konzeption einer Infinite-Scale-Clusterarchitektur
- Implementierung mehrere Big-Data Architekturansätze (Map/Reduce, Lambda, NoSQL) in C++ und Java
- Integration linguistischer Verfahren
- Konzeption einer DSL auf Basis von Lua
- Agile Transformation nach Scrum
Eingesetzte Qualifikationen/Technologien/Methoden
- Big Data Architektur
- Konzeption (IT)
- C++, Java, Lua
- Machine Learning, MapReduce
-Verteilte Systeme - Scrum