Cum se citește fișierul Excel (xlsx) în python

How Read Excel File Python



The .xlsx este extensia documentului Excel care poate stoca o cantitate mare de date sub formă de tabel, iar multe tipuri de calcul aritmetic și logic se pot face cu ușurință într-o foaie de calcul Excel. Uneori este necesar să citiți datele din documentul Excel folosind scriptul Python în scopuri de programare. Există multe module în Python pentru a citi documentul excel. Unele dintre modulele utile sunt xlrd , openpyxl , și panda . Modurile de utilizare a acestor module pentru a citi fișierul excel în Python au fost prezentate în acest tutorial.

Cerință prealabilă:

Va fi necesar un fișier Excel fictiv cu extensia .xlsx pentru a verifica exemplele acestui tutorial. Puteți utiliza orice fișier excel existent sau puteți crea unul nou. Aici, un nou fișier Excel numit vânzări.xlsx fișierul a fost creat cu următoarele date. Acest fișier a fost utilizat pentru citire utilizând diferite module python în următoarea parte a acestui tutorial.







vânzări.xlsx



Data vânzării Vânzător Cantitate
05/12/18 Sila Ahmed 60000
12/06/19 Eu Hossain 50.000
20.08.2020 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Exemplu-1: Citiți fișierul Excel folosind xlrd

Modulul xlrd nu este instalat în mod implicit cu Python. Deci, trebuie să instalați modulul înainte de al utiliza. Cea mai recentă versiune a acestui modul nu acceptă fișierul excel cu extensia .xlsx. Deci, trebuie să instalați versiunea 1.2.0 a acestui modul pentru a citi fișierul xlsx. Rulați următoarea comandă de la terminal pentru a instala versiunea necesară a xlrd .



$pipinstalare xlrd== 1.2.0

După finalizarea procesului de instalare, creați un fișier python cu următorul script pentru a citi fișierul vânzări.xlsx fișier folosind al xlrd-lea modul. open_workbook () funcția este utilizată în script deschideți fișierul xlsx pentru citire. Acest fișier Excel conține o singură foaie. Asa ca workbook.sheet_by_index () funcția a fost utilizată în script cu valoarea argumentului 0. Apoi, imbricat 'pentru' loop a folosit pentru a citi valorile celulei din foaia de lucru folosind valorile rândului și coloanei. Două funcții range () au fost utilizate în script pentru a defini dimensiunea rândului și a coloanei pe baza datelor din foaie. The cell_value () funcția a folosit pentru a citi valoarea de celulă particulară a foii în fiecare iterație a buclei. Fiecare câmp din ieșire va fi separat printr-un spațiu tab.





# Importați modulul xlrd
import xlrd

# Deschideți registrul de lucru
registru de lucru = xlrd.open_workbook(„sales.xlsx”)

# Deschideți foaia de lucru
foaie de lucru = workbook.sheet_by_index(0)

# Iterează rândurile și coloanele
pentrueuîngamă(0,5):
pentrujîngamă(0,3):
# Imprimați valorile celulei cu spațiu tab
imprimare(worksheet.cell_value(i, j),Sfârșit=„ t”)
imprimare('')

Ieșire:

Următoarea ieșire va apărea după executarea scriptului de mai sus.



Exemplu-2: Citiți fișierul Excel folosind openpyxl

The openpyxl este un alt modul python pentru a citi fișierul xlsx și, de asemenea, nu este instalat în mod implicit cu Python. Rulați următoarea comandă de la terminal pentru a instala acest modul înainte de al utiliza.

$pipinstalareopenpyxl

După finalizarea procesului de instalare, creați un fișier python cu următorul script pentru a citi fișierul vânzări.xlsx fişier. Ca și modulul xlrd, openpyxl modulul are load_workbook () funcție pentru a deschide fișierul xlsx pentru citire. The vânzări.xlsx fișier este utilizat ca valoare argument a acestei funcții. Obiectul wookbook.active a fost creat în script pentru a citi valorile max_row si max_column proprietăți. Aceste proprietăți au fost utilizate în bucle imbricate pentru a citi conținutul fișierului vânzări.xlsx fişier. Funcția range () a fost utilizată pentru a citi rândurile foii, iar funcția iter_cols () a fost folosită pentru a citi coloanele foii. Fiecare câmp din ieșire va fi separat de două spații de tab.

# Importați modulul openyxl
import openpyxl

# Definiți variabila pentru a încărca wookbook-ul
wookbook = openpyxl.load_workbook(„sales.xlsx”)

# Definiți variabila pentru a citi foaia activă:
foaie de lucru = wookbook.active

# Iterează bucla pentru a citi valorile celulei
pentrueuîngamă(0, worksheet.max_row):
pentru cu înworksheet.iter_cols(1, worksheet.max_column):
imprimare(cu[eu].valoare,Sfârșit=' t t')
imprimare('')

Ieșire:

Următoarea ieșire va apărea după executarea scriptului de mai sus.

Exemplu-3: Citiți fișierul Excel folosind panda

Modulul pandas nu este instalat cu python ca modulul anterior. Deci, dacă nu l-ați instalat înainte, atunci trebuie să îl instalați. Rulați următoarea comandă pentru a instala fișierul panda de la terminal.

$pipinstalarepanda

După finalizarea procesului de instalare, creați un fișier python cu următorul script pentru a citi fișierul vânzări.xlsx fişier. The read_excel () funcția pandas este utilizată pentru citirea fișierului xlsx. Această funcție a fost utilizată în script pentru a citi fișierul vânzări.xlsx fişier. The DataFrame () funcția a fost utilizată aici pentru a citi conținutul fișierului xlsx în cadrul de date și a stoca valorile în variabila numită date . Valoarea datelor a fost tipărită ulterior.

# Importă panda
panda de importla fel depd

# Încărcați fișierul xlsx
Excel_data = pd.read_excel(„sales.xlsx”)
# Citiți valorile fișierului în cadrul de date
data = pd.DataFrame(Excel_data,coloane=[„Data vânzării”,„Vânzător”,'Cantitate'])
# Imprimați conținutul
imprimare(„Conținutul fișierului este: n', date)

Ieșire:

Următoarea ieșire va apărea după executarea scriptului de mai sus. Rezultatul acestui script este diferit de cele două exemple anterioare. Numerele rândurilor sunt tipărite în prima coloană, unde valoarea rândului a numărat de la 0. Valorile datei sunt aliniate central. Numele vânzătorilor sunt aliniați la dreapta. Suma este aliniată la stânga.

Concluzie:

Utilizatorii Python trebuie să lucreze cu fișiere xlsx în diferite scopuri de programare. Trei moduri diferite de a citi fișierul xlsx au fost prezentate în acest tutorial utilizând trei module python. Fiecare modul are funcții și proprietăți diferite pentru a citi fișierul xlsx. Acest tutorial îi va ajuta pe utilizatorii Python să citească cu ușurință fișierul xlsx folosind scriptul Python după ce au citit acest tutorial.