Zurück zur Übersicht

MarTech.Deep Dive: Unsere Erfahrungen mit Amazon SageMaker Studio Lab und Google Colab

SageMaker Studio Lab vs. Google Colab

Als MarTech Integrator arbeitet DIU mit verschiedenen, interdisziplinären Teams an neuen MarTech Lösungen, unter anderem an AI-gestützten Services. In diesem Zusammenhang haben wir – für alle Data Science-Interessierten – einen Vergleich von Amazon SageMaker Studio Lab und Google Colab gemacht. Unser AI-Team hat an der geschlossenen Beta von Amazon SageMaker Studio Lab teilgenommen. Es gibt zwar schon einige Reviews und Vergleiche, wir wollten jedoch beide Lösungen selbst auf Herz und Nieren testen und euch unsere Eindrücke und Learnings aus erster Hand mitgeben.  

Zwei Tech-Giganten revolutionieren Data Science und AI Engineering 

Google Colab und Amazon SageMaker Studio Lab sind leistungsstarke und kostenlose/günstige Managed Services, die das Arbeiten besonders im Bereich Data Science sowie AI-Engineering revolutioniert und "in die Cloud" gebracht haben. Damit wurde ein einfacher Einstieg und die Skalierung für Data Science-Teams ermöglicht. Wir haben im Rahmen unserer Arbeit mit Jupyter Notebooks beide Plattformen getestet.

Für lange Zeit galten lokal gehostete, browserbasierte Jupyter Notebooks als der Standard im Bereich Data Science und AI Engineering, da durch sie Berechnungen mit visuellen Darstellungen in einer ansprechenden Form verbunden werden können. Nachteilig dabei sind jedoch das lokale Einrichten sowie die Deckelung der Leistungsstärke der Berechnungen durch die eigene lokale Hardware. Seit dem Release von Google Colab im Jahr 2017 kann man gehostete Jupyter Notebooks zugreifen und mithilfe von Googles  Cloud PlatformCPUs und GPUs komplexere und umfangreichere Berechnungen durchführen. Das ist alles kostenlos und man hat die Möglichkeit, diese Notebooks sehr einfach mit anderen zu teilen (vergleichbar mit einem Dokument via Google Drive). 2021 präsentierte Amazon das Pendant dazu: Amazon SageMaker Studio Lab. 

Es gibt einige Vorteile, im Bereich AI bzw. Data Science mit einem Cloud Managed Service zu arbeiten:

  • Das Arbeiten erfordert keinen zusätzlichen lokalen Speicherplatz. Dadurch kann man schneller und effizienter Code aus GitHub, GitLab etc. direkt bearbeiten und testen.  
  • Die zur Verfügung gestellte Ressourcen von Google und Amazon sind überdurchschnittlich gut und benötigt keine Konfiguration, anders als beim lokalen Arbeiten. 
  • Über Managed Services lassen sich Jupyter Notebooks leichter mit Kollegen teilen, sodass man gemeinsam zeitgleich am selben Code arbeiten kann.  
Schneller Einstieg mit Google Colab  

Auf den ersten Blick bietet Google Colab alles, was man benötigt, um schnell, einfach und dynamisch an Projekten zusammenzuarbeiten. Vieles ist bereits vorkonfiguriert und ermöglicht dadurch einen schnellen Start. Deshalb haben auch wir zunächst mit Google Colab angefangen. Dabei haben wir in unserem Team erste Erfahrungen gesammelt und wertvolles Know-how aufgebaut.  

Das nächste Level mit Amazon SageMaker Studio Lab 

 Als unsere Anforderungen stiegen, sind wir zu Amazon SageMaker Studio Lab gewechselt. Während Google Colab eher auf das schnelle Testen, das dynamische Kollaborieren und Entwickeln von neuen Ideen ausgerichtet ist, ermöglichte uns Amazon SageMaker Studio Lab den nächsten Schritt. Wir konnten komplexere Netze für eine AI-gestützte Brand-Detektion entwickeln, rechenintensive Trainings mit umfangreichen und vielfältigen Datasets absolvieren und weitere AWS Services bedienen, ohne dabei sorgenvoll mit einem Auge auf den Cost Explorer zu schauen.  

Unsere Entscheidungskriterien im Überblick 

Google Colab vs Amazon Sage Maker Studio Lab

Unser Fazit: Amazon SageMaker Studio Lab überzeugt uns 

Amazon SageMaker Studio Lab ist kostenlos und im direkten Vergleich zu Google Colabs kostenfreier Version mit einer deutlich stärkeren GPU ausgestattet. Amazon trumpft mit einer stärkeren Tesla T4 gegenüber der Tesla K80 von Google. Starke Rechen-Ressourcen sind für unsere Projekte sehr wichtig, denn dadurch sparen wir wertvolle Zeit für das Testen und Training der Modelle. Amazon SageMaker Studio Lab lässt zudem mehr Konfigurationsmöglichkeiten über ein deutlich besseres User Interface zu. 

Als einziger Nachteil wäre die begrenzte Speichermenge von 15 GB zu bemängeln, die jedoch im Gegensatz zu der von Colab persistent ist und damit nicht jedes Mal beim Start des Service die Entwicklungsumgebung des Notebooks neu konfiguriert werden muss.