Ce este Amazon Redshift Data Warehouse System Architecture?

Ce Este Amazon Redshift Data Warehouse System Architecture



Găzduirea și gestionarea datelor în baze de date și depozite de date a fost întotdeauna o sarcină agitată și supărătoare. Este nevoie de multe resurse și putere de calcul pentru a înțelege datele. Amazon Web Services are o soluție unică în acest scop. Are un serviciu numit Amazon Redshift care gestionează în totalitate depozitele de date ale utilizatorilor.

Acest articol va explica în detaliu Amazon Redshift împreună cu arhitectura sa de depozit de date. Toate componentele arhitecturii sistemului de depozit de date Redshift vor fi explicate în detaliu.







Ce este Amazon Redshift?

IT este un serviciu de depozitare de date oferit de Amazon. Gestionează și analizează eficient seturi mari de date pentru analiză și raportare. Este construit pe un model de stocare în coloană. Utilizează clustere de noduri de calcul controlate de un nod lider pentru a oferi procesare de înaltă performanță a datelor.



Preia date din diferite surse și le pune în comun pentru a crea un depozit de date. Oferă diferite funcții, cum ar fi partajarea datelor și analize în timp real. Vizualizați imaginea de mai jos pentru a înțelege caracteristicile și capacitățile Amazon Redshift:







Să ne îndreptăm acum la arhitectura sistemului de depozit de date.

Ce este Amazon Redshift Data Warehouse System Architecture?

Această arhitectură de sistem are trei părți de bază. Aceste părți sunt:



  • Depozitare
  • Accelerare
  • Calcul

Să înțelegem scopurile lor:

Depozitare
Partea de stocare se ocupă de serviciile de stocare pe care le are Redshift. Are propria sa opțiune de serviciu de stocare gestionată, precum și o opțiune de găleată S3.

Accelerare
Partea de accelerare depinde de serviciul de stocare utilizat și de puterea de calcul folosită. Stocarea gestionată prin Redshift este mai rapidă în comparație cu alte opțiuni de stocare

Calcul
Partea de calcul tratează pur și simplu puterea de calcul în uz. Calculul se face cu clustere, iar clusterele au noduri. Nodurile au, la rândul lor, felii.

Pentru a înțelege mai bine toate elementele și componentele acestei arhitecturi, vizualizați imaginea de mai jos:

Să înțelegem componentele sale una câte una.

Care sunt componentele arhitecturale ale Amazon Redshift?

Următoarele sunt componentele arhitecturale ale Amazon Redshift:

  • Clustere
  • Noduri
  • Nod Slices
  • Depozitare
  • Rețeaua internă
  • Baze de date

Să le discutăm unul câte unul:

Clustere
Un cluster este unitatea fundamentală și de bază. Acesta cuprinde un număr de noduri. Dacă un cluster este format din mai multe noduri de calcul, un nod lider suplimentar intervine pentru a coordona activitățile acestor noduri de calcul și a gestiona comunicarea externă.

Noduri

Nodurile din clustere sunt de două tipuri. Acestea sunt:

  • Nodul lider
  • Nod de calcul

Să le înțelegem pe acestea pe rând:

Nodul lider
Gestionează comunicarea cu programele client și coordonează interacțiunile cu nodurile de calcul. Nodul lider joacă un rol vital în executarea interogărilor complexe. Compilează codul pe baza planului de execuție care este distribuit nodurilor de calcul și atribuie porțiuni de date fiecărui nod de calcul individual.

Nod de calcul
Nodurile de calcul sunt coloana vertebrală a arhitecturii Amazon Redshift. Ei realizează atât stocarea, cât și prelucrarea datelor. Acestea au resurse dedicate, cum ar fi memoria și procesorul.

Nod Slices
Nodurile de calcul sunt împărțite în continuare în felii. Aceste felii lucrează împreună pentru a procesa sarcinile de lucru atribuite și pentru a obține paralelismul pentru a îmbunătăți procesarea interogărilor.

Depozitare
Stocarea datelor în Amazon Redshift este gestionată de „Redshift Managed Storage (RMS)”. Are capacitatea de a scala stocarea independent folosind stocarea „Amazon S3”. RMS folosește stocarea locală de înaltă performanță bazată pe SSD ca cache de nivel 1, care optimizează performanța.

Rețeaua internă
Această rețea internă din Amazon Redshift ajută la comunicarea rapidă și sigură între nodurile lider și nodurile de calcul. Această rețea nu este direct accesibilă aplicațiilor client.

Baze de date
Clusterele au una sau mai multe baze de date. Datele din aceste baze de date sunt pe noduri de calcul. Aplicațiile client comunică cu nodul lider. Nodul de calcul gestionează execuția interogărilor între nodurile de calcul.

Este vorba despre Amazon Redshift și despre elementele sale arhitecturale. Acest articol a explicat în mod cuprinzător componentele de lucru ale Amazon Redshift

Concluzie

Arhitectura Amazon Redshift este motivul pe care se bazează capabilitățile sale. Nodul lider controlează și gestionează nodurile de calcul și secțiunile de noduri ajută la procesarea paralelă. Redshift Managed Storage folosește stocarea bazată pe SSD pentru a îmbunătăți performanța. Acest articol a explicat arhitectura sistemului Amazon Redshift Data Warehouse.