Als MarTech Integrator arbeitet DIU mit verschiedenen, interdisziplinären Teams an neuen MarTech Lösungen, unter anderem an AI-gestützten Services. In diesem Zusammenhang haben wir – für alle Data Science-Interessierten – einen Vergleich von Amazon SageMaker Studio Lab und Google Colab gemacht. Unser AI-Team hat an der geschlossenen Beta von Amazon SageMaker Studio Lab teilgenommen. Es gibt zwar schon einige Reviews und Vergleiche, wir wollten jedoch beide Lösungen selbst auf Herz und Nieren testen und euch unsere Eindrücke und Learnings aus erster Hand mitgeben.
Google Colab und Amazon SageMaker Studio Lab sind leistungsstarke und kostenlose/günstige Managed Services, die das Arbeiten besonders im Bereich Data Science sowie AI-Engineering revolutioniert und "in die Cloud" gebracht haben. Damit wurde ein einfacher Einstieg und die Skalierung für Data Science-Teams ermöglicht. Wir haben im Rahmen unserer Arbeit mit Jupyter Notebooks beide Plattformen getestet.
Für lange Zeit galten lokal gehostete, browserbasierte Jupyter Notebooks als der Standard im Bereich Data Science und AI Engineering, da durch sie Berechnungen mit visuellen Darstellungen in einer ansprechenden Form verbunden werden können. Nachteilig dabei sind jedoch das lokale Einrichten sowie die Deckelung der Leistungsstärke der Berechnungen durch die eigene lokale Hardware. Seit dem Release von Google Colab im Jahr 2017 kann man gehostete Jupyter Notebooks zugreifen und mithilfe von Googles Cloud PlatformCPUs und GPUs komplexere und umfangreichere Berechnungen durchführen. Das ist alles kostenlos und man hat die Möglichkeit, diese Notebooks sehr einfach mit anderen zu teilen (vergleichbar mit einem Dokument via Google Drive). 2021 präsentierte Amazon das Pendant dazu: Amazon SageMaker Studio Lab.
Es gibt einige Vorteile, im Bereich AI bzw. Data Science mit einem Cloud Managed Service zu arbeiten:
Auf den ersten Blick bietet Google Colab alles, was man benötigt, um schnell, einfach und dynamisch an Projekten zusammenzuarbeiten. Vieles ist bereits vorkonfiguriert und ermöglicht dadurch einen schnellen Start. Deshalb haben auch wir zunächst mit Google Colab angefangen. Dabei haben wir in unserem Team erste Erfahrungen gesammelt und wertvolles Know-how aufgebaut.
Als unsere Anforderungen stiegen, sind wir zu Amazon SageMaker Studio Lab gewechselt. Während Google Colab eher auf das schnelle Testen, das dynamische Kollaborieren und Entwickeln von neuen Ideen ausgerichtet ist, ermöglichte uns Amazon SageMaker Studio Lab den nächsten Schritt. Wir konnten komplexere Netze für eine AI-gestützte Brand-Detektion entwickeln, rechenintensive Trainings mit umfangreichen und vielfältigen Datasets absolvieren und weitere AWS Services bedienen, ohne dabei sorgenvoll mit einem Auge auf den Cost Explorer zu schauen.
Amazon SageMaker Studio Lab ist kostenlos und im direkten Vergleich zu Google Colabs kostenfreier Version mit einer deutlich stärkeren GPU ausgestattet. Amazon trumpft mit einer stärkeren Tesla T4 gegenüber der Tesla K80 von Google. Starke Rechen-Ressourcen sind für unsere Projekte sehr wichtig, denn dadurch sparen wir wertvolle Zeit für das Testen und Training der Modelle. Amazon SageMaker Studio Lab lässt zudem mehr Konfigurationsmöglichkeiten über ein deutlich besseres User Interface zu.
Als einziger Nachteil wäre die begrenzte Speichermenge von 15 GB zu bemängeln, die jedoch im Gegensatz zu der von Colab persistent ist und damit nicht jedes Mal beim Start des Service die Entwicklungsumgebung des Notebooks neu konfiguriert werden muss.