Datenbanken & SQL
Azure
Python
Grundlage Data Engineer
Random Facts
(wirklich Random)
100

Was bedeutet die Abkürzung ERM?

Enity-Relationship Modell

100

IaaS, PaaS und SaaS - was bedeuten diese Abkürzungen?

Infrastructure as a Service

Platform as a Service

Software as a Service

100

Was gibt dieser Code wieder?

name = input("please put your name here ")

print("Hello ", name, "!")

please put your name here

->[Eingabe]

Hello [Eingabe] !

100

Was ist eine Beziehung? Wie viele Arten von Beziehungen gibt es? (bezogen auf Datenbank)

Die Beziehung kann als Verbindung zwischen mehr als einer Tabelle in der Datenbank definiert werden.

Es gibt 4 Arten von Beziehungen:

1 - 1  Eins zu eins Beziehung

1 - n  Eins zu viele Beziehung

n - m Viele zu viele Beziehung

n - 1 Viele zu eins Beziehung

100

Nenne noch mind. 3 andere Cloud Provider, außer MS Azure.

AWS

Google Cloud

IBM

Oracle

Salesforce

SAP

200

In welche Richtung skaliert ein NoSQL-Datenbank? 

horizontal

200

Welche Dienste steckt hinter "Azure SQL"?

- SQL Server auf Azure Virtual Maschine´s

- Azure SQL Managed Instance

- Azure SQL-Datenbank

- Azure SQL Edge

200

Was gibt dieser Code wieder?

x = 9

z = 3

n = 13

print(190  - x + z * n)

220

200

Was bedeutet "BI"?

Abkürzung und eine kurze Beschreibung 

BI = Business Intelligence

BI Tool´s wie Power BI ermöglich uns aus den gewonnenen und präparierten Datensätzen zu visualisieren (divers. Statistiken, KPI´s, etc)

200

Wofür steht SQL?

Structured Query Language

300

Was ist Normalisierung? Wie viele Normalisierungsformen gibt es?

Die Normalisierung wird verwendet, um die Daten so zu organisieren, dass niemals Datenredundanz in der Datenbank auftritt und Anomalien beim Einfügen, Aktualisieren und Löschen vermieden werden.

300

Was bedeutet "Databricks"?

"..Databricks ist eine Datenanalyseplattform, die für Azure optimiert wurde. Die Plattform ermöglicht das Setup mit nur einem Klick und bietet einen interaktiven Arbeitsbereich für Spark - basierte Anwendung.."

300

was gibt dieser Code wieder?

einkaufsliste = {"Apfel", "Brokkoli", "Cherry Tomaten", "Deo", "Elektrische Zahnbürste", "Fenchel Tee", "Granatapfel"}

print(len(einkaufsliste)

7

300

Was bedeutet die Abkürzung ETL?

Extrahieren, Transformieren und Laden

300

Wie viele Standorte hat Capgemini in Deutschland?

14

Berlin, Dortmund, Düsseldorf, Erfurt, Frankfurt, Hamburg, Hannover, Köln, Lahr, Leverkusen, Lübeck, München, Nürnberg, Stuttgart

400

Was zeichnet NoSQL-Datenbanken aus?

nenne mir min. 4 Punkte

  • Die horizontale Skalierbarkeit,
  • das Vermeiden von unnötiger Komplexität,
  • eine hohe Performance und ein hoher Durchsatz,
  • die Nutzung von allgemein gebräuchlicher Hardware,
  • die Vermeidung von relationalen Ansätzen des Datenmappings,
  • die Einfachheit in der Installation und Konfiguration von verteilten Datenbank-Clustern sowie
  • die Unterstützung der aktuellen Hardwaregenerationen.
400

Was bedeutet "Data Factory"?

"Data Factory ist ein Cloudintegrationsdienst. Der Dienst orchestriert die Verschiebung von Daten zwischen verschiedenen Datenspeichern. Er ermöglicht Data Engineers das Erstellen datengesteuerter Workflows in der Cloud zum Orchestrieren und Automatisieren der Datenverschiebung und Datentransformation. Verwenden Sie Data Factory zum Erstellen und Planen datengesteuerter Workflows (sogenannte Pipelines), die Daten aus unterschiedlichen Datenspeichern erfassen können."

400

was gibt dieser Code wieder?


i = 1

while i < 6:

     print(i)

      i += 1

1

2

3

4

5


400

Nenne mir die Methoden und Instrumente des Anforderungsmanagements

  • Interviews: Der Requirements Engineer kann persönliche oder telefonische Interviews mit den Stakeholdern durchführen.
  • Fragebögen: Auch eine schriftliche Befragung ist möglich, um in strukturierter Form Anforderungen zu erheben. So können die Erwartungen einer großen Zahl von Stakeholdern erfasst werden.
  • Workshops: Mithilfe von Kreativitätstechniken können die Stakeholder in Workshops angeleitet werden, Aspekte zu entdecken, die im Projekt berücksichtigt werden müssen, die sie durch einfaches Brainstorming nicht bedacht hätten.
  • Feldbeobachtungen: Der Requirements Engineer beobachtet die Arbeitsabläufe der Stakeholder und dokumentiert diese per Text, Audioaufnahme oder Video.
  • Apprenticing: Der Requirements Engineer erlernt die Tätigkeit des Stakeholders. Diesem werden durch das Erklären seiner Arbeit wichtige Anforderungen das Projekt bewusst.
  • Systemarchäologie: Bei IT-Infrastrukturen, die nicht oder kaum dokumentiert sind, kann der Requirements Engineer mit einer Untersuchung des Systems und einer Dokumentation beginnen. Hierzu kann seine eigene Analyse mit Befragungen von Systemanwendern ergänzt werden.
  • Reuse: Soll ein technisches System erneuert werden, ist es wahrscheinlich, dass Basis-Workflows, an die sich Anwender gewöhnt haben, beibehalten werden sollen. Statt alle Anforderungen neu zu erarbeiten, sollte auf vorhandene Dokumentationen zurückgegriffen werden.
400

Nenne mir die 7 Firmen Philosophie ( Sieben Werte), die Capgemini auslebt. 

Ehrlichkeit / Honesty

Mut / Boldness

Vertrauen / Trust

Freiheit / Freedom

Spaß / Fun

Bescheidenheit / Modesty

Teamgeist / Team spirit

500

Wie viele Aggregatfunktionen sind in SQL verfügbar?

SQL-Aggregatfunktionen ermitteln und berechnen Werte aus mehreren Spalten in einer Tabelle und geben einen einzelnen Wert zurück.

In SQL gibt es 7 Aggregatfunktionen:

  • AVG (): Gibt den Durchschnittswert aus angegebenen Spalten zurück.
  • ANZAHL(): Gibt die Anzahl der Tabellenzeilen zurück.
  • MAX (): Gibt den größten Wert unter den Datensätzen zurück.
  • MINDEST (): Gibt den kleinsten Wert unter den Datensätzen zurück.
  • SUMME(): Gibt die Summe der angegebenen Spaltenwerte zurück.
  • ZUERST(): Gibt den ersten Wert zurück.
  • LETZTE(): Gibt den letzten Wert zurück.
500

Beschreibe Azure Perview

"Microsoft Purview automatisiert die Datenermittlung, indem Datenscans und -Klassifizierungen als Dienst für Ressourcen in Ihren gesamten Datenressourcen bereitgestellt werden. Metadaten und Beschreibungen der gefundenen Datenbestände werden in eine ganzheitliche Karte Ihres Datenbestands integriert. Darüber hinaus gibt es zweckorientierte Apps, die Umgebungen für die Datenermittlung, eine Zugriffsverwaltung und Einblicke in Ihre Datenlandschaft erstellen."

500

was gibt dieser Code wieder?


for x in range(12):

   if x == 9: break

   print(x)

else:

   print("Finally finisched!"

0

1

2

3

4

5

6

7

8


500

Nenne mir das AKID (engl. ACID) Prinzip, welches für die Transaktionsdatenverarbeitung gilt

Atomarität

Konsistenz

Isolation

Dauerhaftigkeit

500

Wie viele Azure Container Registry Tarife gibt es?

Und nenne mind. 5 Vorteile die das Premium Tarif mit sich bringt (im direkter Vergleich zu den anderen Tarifen)

3 Tarife ( Basic, Standard und Premium ) 

Vorteile des Premium Tarif:

Georeplikation ist verfügbar 

Zonenredundanz ist verfügbar

500 Gibibyte an Speicher

50 Mbit/s Uploadbanbreite

100 Mbit/s Downloadbanbreite 

500 webhooks

Verfügbarkeitszonen ist verfügbar

Inhaltsvertrauensstellung ist verfügbar

Private Link mit privaten Endpunkten sind verfügbar

100 Netzwerkregeln für öffentliche IP-Adressen

20.000 Tokens

20.000 Bereichzuordnungen

500 Repositorien pro Bereichzuordnung

M
e
n
u