Pandas Reindex

Pandas Reindex



„În „pandas”, putem stoca o mulțime de informații în formă tabelară, cunoscută și sub numele de DataFrame. „Panda” ne facilitează metoda „DataFrame()” pentru construirea DataFrame. DataFrame conține indecși și, de asemenea, putem modifica indecșii DataFrame utilizând funcțiile „pandas”. Metoda pe care o folosim pentru reindexarea DataFrame este metoda „reindex()”. Această metodă ajută la modificarea valorilor indexului rândului, precum și a valorilor indexului coloanelor. Utilizând această metodă, putem schimba indexul implicit al DataFrame și, de asemenea, putem schimba indexul pe care l-am setat în timpul creării DataFrame. Vom folosi metoda „reindex()” în exemplele noastre „pandas” din acest tutorial și vom explica acest concept în profunzime aici.”

Exemplul # 01

Instrumentul „Spyder” ne ajută să dezvoltăm codul „pandas” aici în acest tutorial și începem codul cu cuvântul cheie „import”, care va ajuta la importarea funcției „pandas”. Punem „pandas as pd” după ce tastăm „import”. După aceasta, creăm DataFrame tastând „pd.DataFrame()”. Scriem acest „pd” aici deoarece „DataFrame()” este metoda „pandas”. „value_df” este numele variabilei în care este salvat DataFrame. Adăugăm „RandomName”, care este numele coloanei, iar „RandomName” conține „Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander și Samuel”.







Apoi, avem „Valoare_1”, în care am inserat „16, 29, 24, 35, 44, 50, 69, 74 și 88”. Apoi vine „Value_2” și am adăugat „25, 38, 42, 56, 54, 65, 78, 89 și 99”. Acum urmează „Valoarea_3” și plasăm „36, 48, 52, 69, 74, 75, 87, 91 și 69”. Coloana „Valoare_4” este prezentă după aceasta, unde am inserat „52, 64, 72, 88, 82, 95, 97, 21 și 39”. Ultima coloană este coloana „Value_5” aici, iar în această coloană, valorile pe care le-am adăugat sunt „66, 78, 82, 99, 34, 45, 57, 61 și 89”. După aceasta, folosim funcția „print()” în care se adaugă astfel „Values_df”. Se va imprima pe terminal.




După ce apăsăm „Shift+Enter”, putem obține cu ușurință rezultatul codurilor noastre în aplicația „Spyder”. Aici, acest cod returnează DataFrame cu indexul implicit. Acum, vom aplica metoda „reindex()” pentru reindexarea acestui DataFrame în „pandas”.




Funcția „reindex()” este folosită aici pentru reindexarea valorii indexului rândului. În DataFrame de mai sus, puteți vedea că sunt afișate valorile implicite ale indexului rândului, iar acum, aplicăm metoda „reindex()” pentru reindexarea acelor indici de rând. Plasăm numele DataFrame-ului și apoi metoda „reindex()” în care plasăm acele valori de index pe care dorim să le adăugăm la DataFrame-ului de mai sus. Punem „ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H și ind_I” în funcția „reindex()”. Deci, indecșii acestor rânduri vor fi actualizați pe DataFrame atunci când executăm acest cod.






Valorile indexului rândului sunt afișate în acest rezultat și puteți observa că valorile DataFrame nu sunt afișate aici, iar valorile „NaN” au apărut. Acest lucru se datorează faptului că noile valori ale indexului nu se potrivesc cu valorile anterioare ale indexului DataFrame. Când noul index și indexul vechi nu se potrivesc, atunci se afișează „Nan” acolo. Aceste valori „NaN” apar în mod implicit când schimbăm indexul și nu se potrivește cu indexul anterior.



Exemplul #02

Acum modificăm valorile indexului coloanei „Value_df”, pe care le-am creat anterior în exemplul 1. După imprimarea „Value_df”, am pus variabila „coloană” și i-am adăugat câteva valori. Adăugăm „a_1, b_1, c_1, d_1 și e_1”. Acum, dorim să ajustam aceste valori ca index al coloanelor, așa că, pentru aceasta, folosim metoda „reindex()” și plasăm numele variabilei „coloană” în care sunt stocate noile valori ale indexului coloanei și setați, de asemenea, „axa” la „coloane”, astfel încât va actualiza indexul axei coloanei. Am pus metoda „reindex()” în „print()”, așa că se va randa și pe terminal.


Deoarece am folosit metoda „reindex()”, valorile indexului coloanei care sunt prezente în primul DataFrame sunt actualizate, iar noi valori sunt adăugate în DataFrame actualizat. De asemenea, puteți observa că toate valorile DataFrame sunt convertite în „NaN”, deoarece ambele valori ale indexului coloanelor sunt diferite.

Exemplul #03

„Programming_data” din acest cod conține „P_Languages”, unde am adăugat „JavaScript, CSS, Web Engineering, OOP, C#, AI, Java și JavaScript”. Apoi, avem „Ore” în care plasăm „4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs și 6_hrs”. După aceasta, se introduce „P_Code” și inserăm „11523, 12423, 12321, 11456, 11454, 12267, 13106 și 14123”. Adăugăm variabila „p_index” și punem „Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G și Pro_H”.

Aceste valori vor fi folosite ca valori de index ale rândurilor. Schimbăm „Programming_data” în „Programming_df” DataFrame. Adăugăm, de asemenea, „p_index” la acest DataFrame utilizând metoda „index”. Punem „Programming_df” și apoi metoda „index” și îi atribuim „p_index”. Acum, valorile indexului de mai sus sunt adăugate ca valori ale indexului rândurilor la DataFrame. Printăm și „Programming_df”.

După aceasta, adăugăm câteva valori de index noi în variabila „new_index”, iar acestea sunt „P_1, P_2, P_3, P_4, P_5, P_6, P_7 și P_8”. Deoarece dorim să actualizăm valorile indexului rândurilor, folosim metoda „reindex()” și punem „new_index” ca parametru al acestei funcții și, de asemenea, stocăm DataFrame actualizat în „newProgramming_df” și plasăm „newProgramming_df” în „ print()” pentru afișare.


Valorile indexului sunt actualizate și putem spune, de asemenea, că am reindexat DataFrame-ul pe care l-am creat. Toate valorile DataFrame sunt, de asemenea, convertite în „NaN”, deoarece ambele valori ale indexului sunt diferite.

Exemplul #04

În prezent modificăm valorile indexului „Programming_df” ale coloanelor, pe care le-am dezvoltat anterior în exemplul 3. Am plasat variabila „coloană” și inserăm noi valori în ea. „P_Code, P_Languages, Hours și New” sunt adăugate la variabila „coloană”. Apoi, folosim din nou metoda „reindex()” în care setăm variabila „coloană”, care va actualiza valorile anterioare ale indexului coloanei și va adăuga aceste noi valori ale indexului coloanei la DataFrame.

Aici, puteți observa că noile valori pe care le-am adăugat în „coloană” sunt aceleași cu cele adăugate în DataFrame de mai sus, dar secvența este diferită, așa că va schimba secvența coloanelor și va ajusta toate coloanele pe măsură ce menționate în variabila „coloană”. De asemenea, adăugăm încă o valoare de index care nu este prezentă în DataFrame de mai sus, care este „Nou” aici, astfel încât valorile „NaN” vor apărea în această coloană.


Secvența coloanelor este schimbată aici și toate valorile apar așa cum sunt prezente în coloanele DataFrame original, iar coloana „Nou” din DataFrame actualizat conține toate valorile „NaN”, deoarece această coloană nu este prezentă în DataFrame original.

Concluzie

Am prezentat acest tutorial care ne ajută să înțelegem în detaliu noțiunea „pandas reindex”. Am discutat despre cum putem reindexa coloana unui DataFrame, precum și valorile indexului rândului. Am explicat că funcția „reindex()” a „pandas” este utilizată pentru a face acest lucru. Am făcut diferite exemple în care am schimbat valorile index ale rândurilor DataFrame-ului și, de asemenea, valorile indexului indexului coloanei DataFrame. Am redat rezultatele tuturor codurilor pe care le-am făcut aici în acest tutorial și, de asemenea, le-am explicat în profunzime.