Coloana Pandas Insert().

Coloana Pandas Insert



„Python oferă o gamă largă de structuri de date și operațiuni pentru manipularea datelor numerice și a serii de timp. DataFrame pe care l-am creat sau importat în Pandas poate fi folosit pentru o varietate de scopuri. Coloanele din cadrul de date pot fi, de asemenea, ajustate, împreună cu sursa de date. Panda simplifică multe dintre sarcinile obositoare și consumatoare de timp asociate cu prelucrarea datelor. Există patru moduri de a adăuga o coloană la un DataFrame în Pandas, dar în acest articol, folosim funcția „insert()” a coloanei panda.

Odată ce am construit sau încărcat dataFrame-ul nostru în Pandas, există o varietate de lucruri pe care am dori să le realizăm. De exemplu, am putea continua să manipulăm datele, de exemplu, schimbând coloanele din cadrul de date. În continuare, trebuie să înțelegem cum să includem coloane într-un cadru de date dacă majoritatea datelor provin de la un furnizor de date, dar unele date provin de la altul. O coloană poate fi adăugată cu ușurință la un cadru de date Pandas.”







Pandas insert() Metoda

Ultima coloană a cadrului de date este generată de o funcție diferită. Utilizând metoda „insert()” DataFrame, puteți adăuga coloane între coloanele curente, în loc să le adăugați în partea de jos a Pandas DataFrame. Ne oferă opțiunea de a adăuga o coloană oriunde alegem, mai degrabă decât pur și simplu la încheiere. În plus, oferă multe modalități de adăugare a valorilor pentru coloane. Când trebuie să adăugați o coloană la o anumită poziție sau index, funcția Pandas „insert()” este utilă.



Sintaxa pentru coloana Pandas insert().



Exemplul 1: Inserarea unei coloane într-un cadru de date utilizând metoda Pandas insert().

Începeți cu primul exemplu din articol, în care vom explica cum să inserați o coloană într-un cadru de date. Folosind instrumentul „spyder”, putem demonstra acest cod. În primul rând, generăm un cadru de date numit „curs”. Avem două coloane în acest cadru de date, „course_title” și „fee”. În coloana „course_title” avem o listă de cursuri „python”, „java”, „object_oriented” și „PHP”. În a doua coloană „taxă” avem lista de taxe de curs care este „30000”, „25000”, „15000” și „22000”. Afișarea DataFrame-ului nostru, „curs”, utilizând „pd. DataFrame”.





În continuare, vom discuta despre funcția principală a codului, care este „coloana „insert()” pandas. Este o metodă eficientă de a include o nouă listă în cadrul de date. Puteți adăuga noua coloană în orice loc specificat folosind metoda de inserare. Această metodă permite, de asemenea, adăugarea manuală a unei coloane la un cadru de date, dar există o adaptabilitate mai mică.

Pe parcursul inserării înseamnă că sursa DataFrame este actualizată direct în timpul procesului și nu este creat niciun nou DataFrame. În acest caz, am adăugat o nouă coloană în cadrul nostru de date cu numele „Time_duration” utilizând funcția „insert()”. Lista de valori pe care o avem în această coloană este „6_months”, „3_months”, „3months” și „6_months”. Avem o coloană „Time_duration” cu un index definit ca „2” în programul de mai jos. Deoarece indexul specificat, DataFrame-ului i se va da un interval care începe la 0 și crește în pași, deci înseamnă că această coloană este afișată ca o a treia coloană în cadrul de date. DataFrame adaugă o nouă coloană numită „Time _duration” utilizând funcția „pd.insert()”.



Și acum, să discutăm despre rezultatul programului de sus. Ieșirea sa arată un cadru de date care are trei coloane. Coloana suplimentară este adăugată la sfârșitul cadrului de date. Folosind metoda „pd.DataFrame.insert()”, puteți adăuga o coloană printre alte coloane în loc să le adăugați la sfârșitul panda DataFrame.” Time_ duration” este o coloană nouă pe care am adăugat-o folosind „inserarea” funcţie. Poziția „2” se referă la a treia coloană din DataFrame, deoarece poziția începe la 0. Coloana este adăugată la ultimul loc din cadrul de date.

Exemplul 2:  Adăugarea de coloane într-un cadru de date utilizând funcția Pandas insert().

Vom folosi metoda „insert()” pentru a adăuga noi coloane în cadrul de date. În loc să adăugați coloane suplimentare la sfârșitul panda, le puteți introduce între coloanele existente. Pentru a genera un cadru de date similar cu exemplul anterior, am luat trei coloane și le-am atribuit valori. În prima coloană, „Nume”, avem o listă de nume care includ „Emma”, „Ella”, „Smith” și „Maxwell”. În a doua coloană „Vârsta”, lista de valori avem „29”, „36”, „39” și „33”.

După aceea, tipărim o declarație „DataFrame”. Vom afișa cadrul de date sub declarația „cadru de date”. Creăm încă o coloană pentru cadrul de date Pandas folosind funcția „inserare()”. Trebuie creată o listă, astfel încât să poată fi adăugată ca o nouă coloană la setul de date dat. Metoda „assign()” a panda DataFrame poate fi, de asemenea, folosită pentru a adăuga mai multe coloane. Inserăm o nouă coloană folosind „df. introduce'. Coloana suplimentară numită „Sex” afișează sexul fie ca „Bărbat” sau „Femeie”.

Haideți să imprimăm o altă declarație, „New Dataframe”. Un nou cadru de date va fi acum prezentat sub mențiunea „New Dataframe”, care conține coloana suplimentară pe care am adăugat-o cu „pd. funcția insert()”. Coloana cu un nume similar nu poate fi adăugată utilizând funcția „insert()”. În cazul în care o coloană există deja în Cadrul de date, în mod implicit este aruncată o Eroare de valoare.

În această ieșire, coloana pe care am făcut-o utilizând funcția „inserare()” este adăugată cadrului de date. Ieșirea sa afișează două cadre de date; primul dataFrame a fost creat folosind „pd.data frame”, în care avem două coloane, „Name” și „Age”. Noua coloană „sex” pe care am adăugat-o folosind funcția „insert()” este afișată în al doilea cadru de date afișat mai jos. Acest cadru de date demonstrează că există trei coloane cu unele date în ele. Indicele are dimensiunea „2”, ceea ce înseamnă că are intrări de la „0 la 3”. Noua coloană pe care am atribuit-o acestui cadru de date are o poziție de index de „3”.

Concluzie

O operație de analiză și actualizare a datelor folosită în mod obișnuit este adăugarea de coloane în DataFrame. Cu toate acestea, Pandas vă oferă numeroase opțiuni pentru a finaliza sarcina, oferind patru metode diferite; totuși, utilizăm o singură tehnică, care este coloana panadas „insert()”, în articolul nostru. Una dintre cele mai dificile părți ale extinderii unui DataFrame cu coloane noi este indexarea. Să descriem rapid ambele exemple. Am creat mai întâi un cadru de date intitulat curs și am adăugat coloanele „titlul cursului” și „taxă” și am atribuit valori acestei coloane. Folosind funcția „insert()”, adăugăm apoi o nouă coloană la același cadru de date indicând poziția sa ca „2” în index. În al doilea exemplu, sunt afișate două DataFrames. Am creat două coloane și am enumerat câteva valori în primul cadru de date. Apoi, folosind funcția insert(), am inserat o nouă coloană în cadrul de date numită „Gender”, a fost poziționată și ca „2” în index; acum, a afișat din nou tabelul, așa cum se arată în al doilea exemplu de mai sus.

După stăpânirea tehnicilor de mai sus, putem adăuga cu ușurință noi coloane la DataFrame.