Cum să implementați depozitarea datelor cu Amazon Redshift?

Cum Sa Implementati Depozitarea Datelor Cu Amazon Redshift



Bazele de date tradiționale pot ajuta utilizatorii să efectueze interogări complexe sau să obțină rezultatele dorite, dar această alegere are câteva dezavantaje. Configurarea hardware-ului și instalarea bazelor de date pentru a rula interogări, problemele de stocare a datelor, performanța lentă și întreținerea manuală sunt câteva dintre puținele probleme cu bazele de date tradiționale.

Acest articol oferă utilizatorilor săi o înțelegere mai profundă pentru implementarea Data Warehouse cu AWS Redshift.

Ce este AWS Redshift?

AWS Redshift permite utilizatorilor săi să recupereze și să manipuleze datele fără toate configurațiile unei baze de date tradiționale. Scalează inteligent capacitatea în funcție de cerințele aplicației, oferă răspunsuri rapide și precise și este gestionat în totalitate de AWS. AWS Redshift este utilizat pe scară largă pentru aplicațiile sale vaste de analiză a datelor mari. În plus, urmează modelul de plata pe măsură ce utilizați și nu implică taxe suplimentare atunci când depozitul este inactiv:









Aflați mai multe despre Redshift, referindu-vă la acest articol: „Care sunt tipurile de date Amazon Redshift” :



Cum să implementați depozitarea datelor cu Amazon Redshift?

Amazon Redshift utilizează Standard Query Language (SQL) în diferite depozite pentru a executa interogări. Extragerea valorilor maxime în timp ce monitorizați costul configurației manuale a unui depozit de date este obositoare. Prin urmare, AWS Redshift accelerează în mod precis și inteligent sarcina dvs. de afaceri legată de date și vă ajută să vă accelerați timpul pentru a obține informații despre date într-un mod rapid, ușor, fiabil și sigur. Există multe beneficii ale implementării Data Warehousing cu Amazon Redshift:





  • Criptarea datelor
  • Optimizare inteligentă
  • Cost optim
  • Automatizați sarcinile repetitive
  • Capacitate de auto-scalare
  • Suport pentru diverse resurse AWS

Mai jos sunt câțiva pași în care putem implementa Data Warehousing cu Amazon Redshift:

Pasul 1: Creați un rol IAM

Primul pas în implementarea unui Data Warehouse pe AWS Redshift începe cu crearea unui rol IAM. În acest scop, căutați și selectați rolul IAM pe Consola de administrare AWS :



Faceți clic pe „Roluri” opțiunea din bara laterală a rolului IAM:

Faceți clic pe „Creează un rol” butonul următor:

În Tip de entitate de încredere secțiunea, faceți clic pe „Serviciul AWS” pe măsură ce creăm acest rol IAM pentru Redshift:

În Utilizare caz secțiune , Selectați 'Tura roșie' în câmpul evidențiat și procedați la selectarea următoarei opțiuni evidențiate. Faceți clic pe 'Următorul' butonul apoi:

În Politica de permisiuni secțiune , căutați și selectați „AmazonS3ReadOnlyAccess” opțiune. Și apoi faceți clic pe 'Următorul' butonul apoi:

În Detalii despre rol secțiune , furnizați numele rolului:

Păstrând restul setări implicite, faceți clic pe „Creează un rol” butonul din partea de jos a interfeței:

Rolul a fost cu succes creată. Faceți clic pe „Vedeți rolul” buton:

În Vedeți rolul secțiunea, copiați ARN și salvați-l în Notepad pentru utilizare ulterioară:

Pasul 2: Creați Redshift Cluster

În AWS Management Console, căutați și apoi selectați 'Tura roșie' serviciu:

Derulați în jos 'Tura roșie' consola principală și faceți clic pe „Creează cluster” buton:

Aceasta va naviga utilizatorul la „Creează un cluster” interfata. Aici, pe această interfață, furnizați un nume pentru cluster și selectați „dc.2 mare” pentru tipul cluster:

În Configurații baze de date secțiuni, furnizați a nume de utilizator și parola pentru cluster:

Derulați în jos la Roluri IAM secțiune. Vom atașa aici rolul IAM pe care l-am creat mai devreme în acest tutorial. În acest scop, faceți clic pe „Rol asociat IAM” buton:

În această secțiune, am selectat rolul creat și am făcut clic pe „Asociați roluri IAM” butonul pentru a atasa rolul:

Păstrând valorile implicite, faceți clic pe „Creează cluster” butonul din partea de jos a interfeței:

Acest lucru va dura ceva timp pentru ca clusterul să fie disponibil. Faceți clic pe numele clusterului din tabloul de bord RDS după ce starea este afișată 'Activ':

Pasul 3: Adăugați permisiuni

Accesați Serviciul IAM de la AWS Management Console la configurați o nouă politică în contul de utilizator root:

De la Tabloul de bord IAM, faceți clic pe „Utilizatori” opțiunea din bara laterală din stânga:

Faceți clic pe Nume rol care are acces de administrator la cont:

Apasă pe „Adăugați permisiuni” butonul situat pe interfață:

Faceți clic pe „Atașați direct politicile” opțiunea de sub Opțiuni de permisiuni secțiune:

Adăugați următoarele permisiuni la contul dvs.:

  • AmazonRedshiftQueryEditor
  • AmazonRedshiftQueryEditorV2FullAccess
  • Amazon RedshiftReadOnlyAccess

După adăugarea următoarelor permisiuni, faceți clic pe 'Următorul' buton:

În Rezumatul permisiunilor secțiunea, faceți clic pe „Adăugați permisiuni” buton:

Aici permisiunile sunt configurate cu succes:

Pasul 4: Editor de interogări

Pe Tabloul de bord AWS RDS , faceți clic pe „Editor de interogări v2” opțiunea din bara laterală:

Aceasta va afișa următoarea interfață. Pe această interfață, selectați numele cluster-ului dvs. și furnizați următoarele detalii pentru conexiune. După ce ați furnizat detaliile, faceți clic pe „Creează o conexiune” buton:

În scopuri de testare, vom furniza următoarea interogare și vom apăsa pe 'Alerga' buton:

Interogarea a fost executată cu succes:

Asta este tot din acest ghid. Acum, utilizatorul poate rula diferite interogări în această consolă, de exemplu, Creați, inserați, ștergeți, etc.

Concluzie

Pentru a crea Data Warehousing cu Redshift, configurați un rol IAM și o permisiune cu clusterul RDS și faceți clic pe „ Editor de interogări ” opțiune pentru a executa interogări. AWS Redshift este o bază de date bazată pe cloud care urmează sintaxa SQL și execută interogări pe seturi mari de date eficient pentru performanță ridicată. Acest articol oferă instrucțiuni pentru implementarea depozitării datelor cu Amazon Redshift.