Pandas Dataframe Unic

Pandas Dataframe Unic



Cea mai populară bibliotecă Python care este utilizată în știința datelor se numește Pandas. Oferă programatorilor Python instrumente de înaltă performanță, ușor de utilizat și de analiză a datelor. Odată ce înțelegeți funcțiile fundamentale și cum să le utilizați, Pandas este un instrument puternic pentru modificarea datelor. În „pandas” metodele standard pentru stocarea datelor într-o formă tabelară sunt DataFrames. Putem folosi câteva metode „pandas” pentru a obține valorile unice din coloana DataFrame „pandas”. Când trebuie să obținem valori unice în coloanele DataFrame și nu dorim duplicarea valorilor în coloana DataFrame „pandas”, putem folosi metodele pe care „pandas” le oferă pentru a face acest lucru. Să ne uităm la astfel de metode în acest ghid, împreună cu câteva exemple și rezultate pentru a obține valori unice în coloana „pandas” a DataFrame.

Metode pentru obținerea valorilor unice în coloanele DataFrame „pandas”.

Putem folosi două metode pentru a obține valorile unice în coloanele DataFrame „pandas”. Aruncăm valorile duplicate și obținem numai valorile unice în coloanele din DataFrames. Metodele pe care „pandas” le oferă pentru a face această sarcină sunt:







  • Prin utilizarea metodei unique().
  • Prin utilizarea metodei drop_dupliactes().

Acum, vom folosi ambele metode în codurile „pandas” pentru a obține valorile unice din coloanele DataFrame „pandas”.



Exemplul # 01

Aplicația „Spyder” este utilizată aici pentru a genera aceste coduri „pandas” pentru a utiliza acele metode care ne ajută să obținem valorile unice în coloanele DataFrame „pandas”. Trebuie să importam modulele „pandas”, care sunt necesare pentru codul „pandas”, înainte de a crea DataFrame. Folosind termenul „import” și plasând „pandas ca pd”, importăm aceste module.



Acum, cu ajutorul lui „pd”, putem obține rapid funcțiile sau metodele „pandas”. Apoi punem „Subject_data” în care adăugăm „Nume” și în „Nume”, adăugăm datele numelui care sunt „Roman, William, Peter, Smith, John, Milli, Thomas și James”. Apoi, adăugăm datele subiectului în „Subj”, care sunt „Matematică, Economie, Știință, Matematică, Statistică, Statistică, Statistică și Calculator”. Apoi, convertim acest „Subject_data” în „Subject_df” DataFrame folosind metoda „pd.DataFrame()”. Plasăm „Subject_df” în metoda „print()”, astfel încât să se afișeze pe terminal.





Acum, dorim să obținem valorile unice din coloana „Subj” a DataFrame „pandas”. În acest scop, folosim metoda „unique()” aici și adăugăm numele coloanei și, de asemenea, numele DataFrame-ului, așa cum se arată mai jos. Adăugăm această metodă în „print()”, astfel încât rezultatul va apărea și pe terminal.



Acum, apăsăm „Shift+Enter” pentru a obține rezultatul acestui cod și se redă pe terminal și este, de asemenea, afișat aici, care conține DataFrame cu toate valorile. Acesta este DataFrame original pe care l-am adăugat în cod și dedesubt afișează valorile unice ale coloanei „Subj”. Elimină valorile duplicate și afișează valorile unice ale coloanei „Subj” din DataFrame.

Exemplul #02

Creăm „Sample_list” care conține câteva informații. Inserăm „Layla, 21, 28, 31, 14 și 39” care va apărea ca prima coloană când convertim această listă în DataFrame. Apoi, adăugăm „Lusy, 31, 25, 34, 26 și 21” ca al doilea rând al DataFrame. După aceasta, avem „Peter, 38, 20, 20, 35 și 24” și „Layla 38, 23, 39 24, 23”, care vor fi al treilea și al patrulea rând al DataFrame. De asemenea, inserăm încă trei date care sunt „Stella, 21, 24, 24, 28, 31”, „Layla, 33, 32, 26, 30, 25” și, de asemenea, „Peter, 21, 21, 31, 21, 29” .

Acum, convertim „Sample_list” în „DF_Sample”, care este numele DataFrame aici, punând funcția „pd.DataFrame()”. De asemenea, setăm numele coloanelor acestui DataFrame și aceste nume sunt „Nume, Ass_1, Ass_2, Ass_3, Ass_4 și Ass_5”. Apoi, folosim „print()” care ajută la afișarea DataFrame „DF_Sample”. Acum, folosim o altă metodă în acest exemplu pentru a obține valorile unice din coloana DataFrame. Această metodă este metoda „drop_duplicates()” a lui „pandas”.

În metoda „drop_duplicates()”, setăm numele coloanei în care dorim să obținem valorile unice din coloana DataFrame. Obținem valori unice ale coloanei „Nume” prin eliminarea valorilor duplicate din această coloană cu ajutorul metodei „drop_duplicates()” și, de asemenea, redăm aceste valori unice folosind funcția „print()” aici.

Numele care sunt duplicate sunt eliminate și valorile unice sunt redate după aplicarea metodei „drop_duplicates()”. Puteți observa că numele „Layla” apare în trei celule ale coloanei „Nume”. Dar atunci când metoda „drop_duplicates()” este aplicată acestei coloane, toate valorile duplicate sunt eliminate și un nume „Layla” a apărut pe ecran. După eliminarea valorilor duplicate, a apărut noul DataFrame care conține valorile unice în această coloană „Nume”. În acest fel, putem elimina valorile duplicate și obținem valoarea unică în coloana DataFrame cu ajutorul metodei „drop_duplicates()”.

Exemplul #03

Același DataFrame este utilizat din nou și acum aplicăm metoda „unique()” aici. Cu metoda „unique()” plasăm numele coloanei, precum și numele DataFrame-ului pe care dorim să aplicăm această metodă „unique()” pentru obținerea valorilor unice. Acest lucru va afișa numai valorile unice ale acelei coloane și nu va afișa aceste valori sub formă de DataFrame.

Aici, DataFrame conține șapte valori în coloana „Nume”, dar când aplicăm metoda „unique()” acestei coloane, au apărut doar patru valori și acestea sunt valorile unice ale acelei coloane. Nu redă valori duplicate.

Exemplul #04

DataFrame-ul pe care îl creăm în acest exemplu este „F_G_df”. Inserăm „My_fruits” și „my_Vegs” în acest DataFrame. Coloana „My_fruits” conține „Mere, Portocală, Măr, Peră, Lychee, Măr, Măr, Peră și Măr”. În continuare, avem „My_Vegs” care conține numele legumelor care sunt „Chilli, Bringle, Morcov, Cartofi, Cartofi, Morcovi, Ceapă, Usturoi și Ghimbir”. Acest DataFrame conține doar două coloane.

Acum, obținem valorile unice în ambele coloane  cu ajutorul metodei „unique()”. Menționăm numele DataFrame. Apoi, puneți prima coloană numele coloanei. După aceasta, folosim metoda append(). În această anexă, plasăm din nou numele DataFrame și numele a doua coloană și plasăm metoda „unique()”. Aceasta va obține valorile unice ale ambelor coloane și apoi va adăuga valorile unice ale ambelor coloane și le vor apărea pe ecran.

DataFrame este randat mai întâi conținând toate valorile. După aceasta, se aplică metoda „unique()” și valorile unice ale ambelor coloane sunt redate mai jos. În acest cod, obținem valorile unice în coloanele multiple ale DataFrame folosind metoda „unique()”.

Concluzie

Explicația completă a obținerii valorilor unice în coloana DataFrame este găsită în acest ghid. Am discutat despre metodele „unique()” și „drop_duplicates()”, care ne ajută să obținem valorile unice ale coloanei DataFrame. Am explorat cum să folosim aceste metode în codul „pandas” folosind aceste metode aici în codurile noastre. Am ilustrat diferite exemple în acest ghid și v-am arătat cum să obțineți valorile unice ale unei coloane folosind metoda „unique()”, precum și metoda „drop_duplicates()”. De asemenea, am explorat cum să obținem valorile unice în mai multe coloane utilizând metoda „unique()” din acest ghid.