In diesem Kurs werden die leistungsstarken Funktionen von Apache Spark für die verteilte Datenverarbeitung und die grundlegenden Techniken für effiziente Datenverwaltung, Versionsverwaltung und Zuverlässigkeit durch die Arbeit mit Delta-Lake-Tabellen untersucht. In diesem Kurs wird auch die Datenerfassung und Orchestrierung mithilfe von Dataflows Gen2- und Data-Factory-Pipelines untersucht. Dieser Kurs umfasst eine Kombination aus Vorträgen und praktischen Übungen, die dich auf die Arbeit mit Lakehouses in Microsoft Fabric vorbereiten.
Modul 1:
Einführung in End-to-End-Analysen mit Microsoft Fabric
Hier erfährst du, wie Microsoft Fabric alle Analyseanforderungen deines Unternehmens auf einer Plattform erfüllen kann. Du erfährst mehr über Microsoft Fabric, die Funktionsweise des Dienstes und lernst, wie du ihn für deine Analysezwecke verwenden kannst.
Modul 2: Erste Schritte mit Lakehouses in Microsoft Fabric
Lakehouses vereinen die Flexibilität von Data Lake Storage mit Data-Warehouse-Analysen. Microsoft Fabric ist eine Lakehouselösung für umfassende Analysen auf einer einzigen SaaS-Plattform.
Modul 3: Verwenden von Apache Spark in Microsoft Fabric
Apache Spark ist eine Kerntechnologie für umfassende Datenanalysen. Microsoft Fabric unterstützt Spark-Cluster, sodass du selbst große Datenmengen in einem Lakehouse analysieren und verarbeiten kannst.
Modul 4: Arbeiten mit Delta-Lake-Tabellen in Microsoft Fabric
Die Tabellen in einem Microsoft-Fabric-Lakehouse basieren auf dem Delta-Lake-Speicherformat, das üblicherweise in Apache Spark verwendet wird. Mithilfe der erweiterten Funktionen von Delta-Tabellen kannst du komplexe Analyse-Lösungen erstellen.
Modul 5: Erfassen von Daten mit Gen2-Dataflows in Microsoft Fabric
Die Datenerfassung ist bei der Analyse von entscheidender Bedeutung. Die Data Factory von Microsoft Fabric bietet Dataflows (Gen2) zum Erstellen und Visualisieren einer mehrstufigen Datenerfassung und -transformation mithilfe von Power Query Online.
Modul 6: Verwenden von Data-Factory-Pipelines in Microsoft Fabric
Microsoft Fabric beinhaltet Data-Factory-Funktionen, einschließlich der Möglichkeit, Pipelines zu erstellen, die Datenerfassungs- und Transformationstasks orchestrieren.
Dieser Kurs besteht aus einem Online-Seminar und wird von einer:m Trainer:in geleitet, der:die die Teilnehmenden live betreut. Theorie und Praxis werden mit Live-Demonstrationen und praktischen Übungen vermittelt. Zum Einsatz kommt die Videokonferenz-Software Zoom.
Die primäre Zielgruppe für diesen Kurs sind Datenexpert:innen, die mit der Datenmodellierung, -extraktion und -analyse vertraut sind. Dieses Training richtet sich an Fachleute, die Wissen über die Lakehouse-Architektur, die Microsoft-Fabric-Plattform und die Möglichkeit der umfassenden Analyse mithilfe dieser Technologien erwerben möchten. Du solltest mit den grundlegenden Datenkonzepten und der Terminologie vertraut sein.
Das Training wird in Zusammenarbeit mit der autorisierten Trainingsorganisation Digicomp Academy AG durchgeführt.
Diese erhebt und verarbeitet Daten in eigener Verantwortung.
Bitte beachte die entsprechende Datenschutzerklärung.