Seria Pandas în CSV

Seria Pandas In Csv



Metoda „Series.to_csv()” din Pandas scoate obiectul serie specificat într-o notație cu valori separate prin virgulă (csv). Această funcție pur și simplu preia valorile dintr-o serie și modifică formatul acestora adăugând virgule pentru separarea valorilor indexului și coloanei.

Pentru a folosi această funcție, trebuie să folosim următoarea sintaxă:









Acest articol vă va oferi două tehnici diferite pentru a învăța modalitățile de a folosi această metodă într-un program python.



Exemplul # 1: Utilizarea metodei Series.to_csv() pentru a converti o serie cu DatetimeIndex în valori separate prin virgulă

Pentru a modifica o serie într-un format CSV, vom folosi funcția „Series.to_csv()”. Această ilustrație va genera o serie cu un DatetimeIndex și apoi o va converti într-un format de valori separate prin virgulă.





Pentru a pune în funcțiune această metodă, trebuie să avem un instrument care acceptă programarea Python. Instrumentul „Spyder” este optat pentru compilarea codurilor. Pentru a scrie scriptul pe el, am lansat mai întâi instrumentul instalat în sistemul nostru. Programul python are nevoie de o bibliotecă pentru a-și exercita metodele pentru a obține rezultatul necesar. Biblioteca pe care am încărcat-o aici este „Panda”. În aceeași linie de cod, aliasul acestei biblioteci este identificat ca „pd”. Deci, oriunde în program, trebuie să scriem „pandas” pentru a accesa o funcție. În schimb, am scrie „pd”.

Primul pas pentru a începe cu codul este generarea unei serii Pandas. Trebuie să scriem „pd” pentru a folosi metoda de creare a seriei de la panda. Funcția „pd.Series()” este apelată pentru a construi o serie cu valorile specificate. Valorile pe care le-am furnizat pentru serie sunt „Istanbul”, „Izmir”, „Ankara”, „Ankara”, „Antalya”, „Konya” și „Bursa”. Dacă doriți să dați un nume acestei matrice de valori, puteți face acest lucru folosind parametrul „nume”. Aici, am denumit această serie de valori „Orașe”, deoarece conține numele a 6 orașe. Pentru a stoca această serie, a fost creat un obiect serie „Turcia”.



Pentru a crea un DatetimeIndex, am invocat metoda „pd.date_range()”. Între parantezele acestei funcții, am trecut 4 argumente care sunt: ​​„start”, „freq”, „periods” și „tz”.

Argumentul „start” ia o dată și o oră pentru a începe generarea unui interval de date din acesta. Aici, am specificat data și ora de începere ca „2022-03-02 02:30”. Parametrul „frecvență” clasifică frecvența pentru intervalul de date. Deci, i-am furnizat valoarea „D”. Acum, va crea un interval de date pe frecvența zilnică. Argumentul „perioada” este setat la „6”, ceea ce înseamnă că va genera un interval de date pentru 6 zile. Ultimul parametru este „tz” care specifică fusul orar pentru zona specificată. Am specificat fusul orar pentru „Asia/Istanbul”.

Pentru a stoca acest interval de date, am creat o variabilă „Datetime”. Pentru a seta DatetimeIndex, am folosit proprietatea „Series.index”. Numele seriei „Turcia” este furnizat cu proprietatea „.index” și i se atribuie intervalul de date și oră stocat în variabila „Datetime”. Astfel, proprietatea „index” va prelua valorile din variabila „Datetime” și le va transforma în lista de indici a seriei „Turcia”. În cele din urmă, pentru a vizualiza seria de ieșire, am folosit metoda „print()” și am transmis seria „Turcia” ca intrare pentru a-și afișa conținutul.

Tocmai am apăsat pe opțiunea „Run fișier” pentru a executa scriptul. În consecință, putem vedea o serie cu DatetimeIndex care începe de la „2022-03-02 02:30:00+03:00” și se termină la „2022-03-07 02:30:00+03:00″ creând o perioadă de 6 zile. Sub serie sunt menționate, de asemenea, „Freq :D”, numele listei de matrice „Cities” și dtype „obiect”.

Acum, vom învăța să convertim această serie pe care tocmai am văzut-o în instantaneul de mai sus într-un format CSV. Pentru a modifica seria la valori separate prin virgulă, avem o metodă oferită de modulul panda care este „Series.to_csv()”. Această metodă ia valorile seriei furnizate și adaugă virgule între valorile coloanei.

Este apelată funcția „Series.to_csv()”. Numele seriei pe care dorim să o convertim este menționat cu metoda „Turkey.to_csv()”. Pentru a păstra valorile separate prin virgulă, am creat o variabilă „Comma_Separated” și apoi am pus conținutul acesteia în fereastra de ieșire invocând funcția „print()”.

Iată seria noastră în format csv. Putem vedea în instantaneu că indexul și valorile seriei au fost separate folosind virgulele din ele.

Exemplul # 2: Utilizarea metodei Series.to_csv() pentru a converti o serie cu valori NaN în valori separate prin virgulă

A doua tehnică de exercitare a metodei „Series.to_csv()” este aplicarea acestei metode pentru a converti o serie care conține unele intrări nule într-un format CSV.

Am importat inițial pachetele necesare. „pd” este un alias pentru panda și „np” ca alias pentru numpy. Setul de instrumente numpy este încărcat aici deoarece vom face unele intrări nule în seria noastră folosind „np.NaN” în timp ce îl creăm folosind metoda panda „pd.Series()”.

Funcția „pd.Series()” este invocată pentru a construi o serie de panda cu aceste valori: „Nile”, „Amazon”, np.NaN, „Ganges”, „Mississippi”, „np.NaN”, „Yangtze”, „Dunărea”, „Mekong”, „np.NaN” și „Volga”. Există un total de 21 de valori definite pentru serie, dintre care 3 intrări conțin valori „np.NaN”, ceea ce înseamnă că lipsesc 3 valori din serie. Proprietatea „nume” specifică numele acestei matrice de valori pe care le-am furnizat „Titluri”. Proprietatea „index” este utilizată pentru a seta lista de index definită de utilizator în loc să mergeți cu lista implicită.

Aici, dorim lista de index cu valorile „10”, „11”, „12”, „13”, „14”, „16”, „17”, „18”, „19”, „20”, și 21”. Acum, seria noastră va avea lista de indici începând de la „10” în loc de „0”. Acum, stocați această serie, astfel încât să o putem folosi mai târziu în program. Am inițializat un obiect serie „Rivers” și i-am alocat seria de ieșire generată din apelarea metodei „pd.Series()”. Seria poate fi văzută afișând-o folosind funcția „print()” de la python.

Ieșirea redată pe terminal a tipărit o serie a cărei listă de index începe de la 10 și se termină la 21, ceea ce înseamnă că seria are 21 de valori.

Seria va fi transformată într-un format CSV cu metoda „Series.to_csv()”.

Am invocat metoda „Series.to_csv()” cu seria noastră „Turcia”. Prin urmare, această metodă va prelua valorile din seria „Turcia” și le va converti într-un format de valori separate prin virgulă. Rezultatul este salvat în variabila „Converted_csv”. Și în cele din urmă, seria convertită este tipărită cu ajutorul funcției „print()”.

În instantaneul rezultatului de mai jos, puteți vedea că valorile seriei sunt acum modificate într-un mod în care este folosită o virgulă pentru a le separa de lista de index. Mai mult, acolo unde valorile lipsesc, doar numărul de index este tipărit cu virgulă.

Concluzie

Modificarea unei serii panda într-un format CSV este o abordare practică. Acest lucru poate fi realizat folosind funcția panda „Series.to_csv()”. Acest ghid a pus în practică două tehnici de utilizare a acestei metode. În prima ilustrare, am invocat această metodă pentru a converti o serie cu un DatetimeIndex într-un format de valori separate prin virgulă. A doua instanță a folosit funcția „Series.to_csv()”   pentru a modifica o serie cu unele intrări lipsă într-un format CSV. Ambele tehnici au fost implementate practic folosind instrumentul „Spyder” pe sistemul de operare Windows.