Menu

Kostenlos Datenpipeline einrichten!

Wussten Sie, dass Sie kostenlos mit AWS Data Science-Pipelines von Anfang bis Ende einrichten können? Viele aufstrebende Data Scientists denken, dass man keine Erfahrungen sammeln kann, bis man einen Job bekommt- aber das stimmt einfach nicht. Verwenden Sie einfach die kostenlose AWS-Ebene und richten Sie Ihre eigene Pipeline ein. Einfach zu gut, um wahr zu sein? Und so funktioniert’s: 1 Gehen Sie zu AWS und registrieren Sie sich für ein kostenloses Konto https://amzn.to/118ocVD 2 Richten Sie ein “Free Storage Bucket” (S3), “managed relational database” (RDS), und “compute instance” (EC2) ein. 3 Automatisieren Sie einen Prozess, der automatisch startet, wenn eine neue Datei im S3-Bucket abgelegt wird (um Ihre Pipeline aufzubauen) • Überprüfen Sie, ob die Datei den richtigen Typ und Namen hat • Extrahieren Sie die Daten, überprüfen Sie, ob das Schema korrekt ist, transformieren Sie sie bei Bedarf und laden Sie sie in eine SQL- oder Redshift-Datenbank • Führen Sie Ihren Python-Code aus, der eine Verbindung zu Ihrer Datenbank herstellt • Trainieren Sie das Modell (oder lade ein vorher trainiertes Modell) • Bewerten Sie die neuen Daten • Übertragen Sie die Ergebnisse in einer neuen Tabelle zurück an die Datenbank. So einfach ist das! Sie haben nun Ihr eigenes Modell implementiert und können über Ihre Erfahrungen sprechen (beispeilsweise in Interviews), indem Sie diesen gesamten Prozess von einem Ende zum anderen mit den von Ihnen gewählten Tools automatisieren, z. B Bamboos, Jenkins, cron, Glue, Airflow, usw…

Sind Sie interessiert? Melden Sie sich bei uns, wir sind offen für ein Gespräch.