Panda se numără printre cele mai populare instrumente folosite astăzi de cercetătorii de date pentru a analiza datele tabulare. Pentru a trata conținutul tabelar, oferă un API mai rapid și mai eficient. Ori de câte ori vedem cadre de date în timpul analizei, Pandas setează automat diferite comportamente de afișare la valorile implicite. Aceste comportamente de afișare includ câte rânduri și coloane trebuie afișate, precizia floaturilor în fiecare cadru de date, dimensiunile coloanelor etc. În funcție de cerințe, este posibil să fie necesar ocazional să modificăm aceste valori prestabilite. Pandas au o varietate de abordări pentru modificarea comportamentului implicit. Folosirea atributului „opțiuni” al panda ne-a permis să schimbăm acest comportament.
Pandas afișează rândurile maxime
Ori de câte ori încercați să imprimați un cadru de date uriaș care conține mai multe rânduri și coloane decât pragul predefinit, rezultatul va fi tăiat. Pentru a afișa toate rândurile din DataFrame, veți învăța cum să modificați opțiunile de afișare ale Pandas în acest tutorial. Pandas impune implicit o limită a numărului de coloane și rânduri pe care le prezintă. Deși acest lucru ar putea fi util pentru citirea conținutului, provoacă frecvent frustrare dacă informațiile pe care trebuie să le vizualizați nu sunt afișate. Aici, vom folosi metodele prezentate mai jos cu sintaxa lor pentru a afișa toate coloanele cadrului de date.
to_string()
set_option()
context_opțiune()
Vom învăța utilizarea tuturor acestor metode cu implementare practică pentru a afișa maximum de rânduri în cadrul de date furnizat.
Exemplul # 1: Utilizarea metodei Pandas to_string().
Această demonstrație ne va învăța să afișăm numărul maxim de rânduri într-un cadru de date pe terminal folosind metoda pandas „to_string()”.
Pentru compilarea și executarea exemplelor de programe, am ales instrumentul „Spyder”. În acest ghid, vom folosi acest instrument pentru executarea tuturor exemplelor noastre. Am lansat instrumentul „Spyder” pentru a începe să scriem script-ul Python. Începând cu codul, trebuie mai întâi să încărcăm bibliotecile necesare în fișierul nostru python, astfel încât să ni se permită să-i folosim funcțiile. Biblioteca de module de care avem nevoie aici este „Pandas”. Așadar, l-am importat în fișierul nostru Python și l-am alias la „pd”.
Deoarece operația principală a acestui articol este afișarea numărului maxim de rânduri ale unui cadru de date, mai întâi avem nevoie de un cadru de date. Acum depinde de dvs. dacă preferați să generați un cadru de date sau să importați un fișier CSV. Am importat un exemplu de fișier CSV. Pentru a citi un fișier CSV în programul python, am folosit funcția panda „pd.read_csv()”. Între parantezele acestei funcții, am furnizat fișierul CSV pe care vrem să-l citim pe afișaj, care este „industry.csv”. Am construit o variabilă „df” pentru a stoca rezultatul generat din citirea fișierului CSV furnizat. Apoi, am invocat metoda „print()” pentru a afișa cadrul de date.
Când rulăm acest program python apăsând opțiunea „Run fișier”, un cadru de date este afișat pe consolă. Puteți observa că în rezultatul de mai jos sunt 43 de rânduri, dar sunt afișate doar zece. Acest lucru se datorează faptului că valoarea implicită a bibliotecii Pandas este de numai 10 rânduri.
Vom folosi metoda panda „to_string” pentru a afișa toate rândurile aici. Cel mai simplu mod de a afișa maximum de rânduri dintr-un cadru de date este cu această tehnică. Cu toate acestea, deoarece transformă întregul cadru de date într-un singur șir, nu este recomandat pentru seturi de date foarte mari (de milioane). Cu toate acestea, acest lucru funcționează eficient pentru seturi de date care au o lungime de mii.
Am urmat sintaxa furnizată mai sus pentru funcția „to_string()”. Pur și simplu am invocat metoda „to_string()” cu numele cadrului nostru de date. Apoi am plasat această metodă în funcția „print()” pentru a o afișa atunci când este apelată.
Instantaneul de ieșire ne arată un cadru de date cu toate rândurile afișate pe terminal.
Exemplul # 2: Utilizarea metodei Pandas set_option
A doua metodă pe care o vom practica în acest ghid este panda „set_option()” pentru a afișa rândurile maxime ale cadrului de date furnizat.
În fișierul python, am importat biblioteca panda pentru a accesa funcția menționată mai sus. Am folosit panda „pd.read_csv()” pentru a citi fișierul CSV furnizat. Am invocat funcția „pd.read_CSV()” cu numele fișierului CSV pe care dorim să-l folosim între paranteze, care este „Sampledata.csv”. Când importați fișierul CSV, țineți cont de directorul de lucru curent al programului Python. Fișierul dvs. CSV trebuie plasat în același director; în caz contrar, veți primi un mesaj de eroare „fișierul nu a fost găsit”. Am creat un „eșantion” variabil pentru a stoca cadrul de date din fișierul CSV. Am numit metoda „print()” pentru a afișa acest cadru de date.
Aici, avem rezultatul nostru în care sunt afișate doar zece rânduri. Numărul maxim de rânduri indicat este 99. Toate celelalte rânduri dintre primele 5 și ultimele cinci rânduri sunt trunchiate.
Pentru a afișa numărul maxim de rânduri care sunt 99 pentru acest cadru de date, vom folosi funcția „set_option()” a modulului Pandas. Pandas vin cu un sistem de operare care vă permite să schimbați comportamentul și afișarea. Această metodă ne permite să setăm afișajul să afișeze un cadru de date complet, mai degrabă decât unul trunchiat. Pandas oferă funcția „set_ option()” pentru afișarea tuturor rândurilor din cadrul de date.
Am invocat „pd.set_option()”. Această funcție are parametrii „display.max_rows”. „display.max_rows” specifică numărul maxim de rânduri care vor fi afișate la afișarea unui cadru de date. Valoarea „max_rows” este setată implicit la 10. Dacă este selectat „Niciunul”, înseamnă toate rândurile din cadrul de date. Deoarece vrem să afișăm toate rândurile, așa că îl setăm la „Niciuna”. În cele din urmă, am folosit funcția „print()” pentru a afișa cadrul de date cu rânduri maxime.
Acest lucru produce rezultatul oferit în instantaneul de mai jos.
Exemplul # 3: Utilizarea metodei Pandas option_context().
Ultima metodă pe care o discutăm aici este „option_context()” pentru a afișa toate rândurile cadrului de date. Pentru aceasta, am importat pachetul panda în fișierul python și am început să scriem codul. Am folosit funcția „pd.read_csv()” pentru a citi fișierul CSV pe care l-am specificat. Am creat o variabilă „dalta” pentru a stoca cadrul de date din fișierul CSV specificat. Apoi, am tipărit pur și simplu cadrul de date cu metoda „print()”.
Rezultatul pe care l-am obținut din executarea codului de mai sus ne arată un cadru de date cu rânduri trunchiate.
Acum vom aplica panda „pd.option_context()” pe acest cadru de date. Această funcție este identică cu „set_option()”. Singura diferență dintre cele două abordări este că „set_option()” modifică setările permanent, în timp ce „option _context()” tocmai le-a schimbat în domeniul său de aplicare. Această metodă ia, de asemenea, rândurile display.max ca parametru, pe care l-am setat la „Niciuna” pentru a reda toate rândurile cadrului de date. După invocarea acestei funcție, am afișat-o doar prin metoda „print()”.
Aici, putem vizualiza cadrul de date complet cu rândurile sale maxime, care sunt 2747.
Concluzie
Acest articol se concentrează pe opțiunile de afișare ale panda. Uneori ar putea fi nevoie să vedem întregul cadru de date pe terminal. Panda ne oferă o varietate de opțiuni în acest scop. În acest ghid, am folosit trei dintre aceste strategii. Primul exemplu s-a bazat pe utilizarea metodei „to_string()”. A doua instanță ne învață să implementăm „set_option()”, în timp ce ultima ilustrație execută metoda „option_context()”. Toate aceste tehnici sunt demonstrate pentru a vă familiariza cu modalitățile alternative pe care ni le oferă panda pentru a obține rezultatul dorit.