Lista celor mai bune 10 cărți și descrieri de știință a datelor pentru generalist

Lista Celor Mai Bune 10 Carti Si Descrieri De Stiinta A Datelor Pentru Generalist



Știința datelor este domeniul de studiu care manipulează cantități mari de date folosind metode, procese, algoritmi și sisteme științifice pentru a găsi tipare nevăzute, pentru a obține informații semnificative, pentru a lua decizii de afaceri în companii și, de asemenea, pentru a le utiliza în instituții non-business. Instituțiile non-business includ industrii pentru sănătate, jocuri, recunoaștere a imaginilor, sisteme de recomandare, logistică, detectare a fraudelor (instituții bancare și financiare), căutare pe Internet, recunoaștere a vorbirii, publicitate direcționată, planificare a rutei aeriene și realitate augmentată. Știința datelor este un sub-set al inteligenței artificiale. Datele care sunt utilizate pentru analiză pot proveni din multe surse diferite și sunt prezentate în diferite formate. Unele dintre datele sursă pot fi standardizate; altele pot să nu fie standardizate.

Cu alte cuvinte, se folosesc metodologii diferite pentru a culege datele (plural de date). Apoi, cunoștințele (concluzii valoroase) sunt extrase din datele asamblate. În proces, după ce datele sunt adunate, se face cercetarea asupra acestora (date) pentru a obține noi date (rezultate) din care se rezolvă problemele.







Știința datelor ca disciplină (majoră) există la nivel de licență și master la universitate. Cu toate acestea, doar puține universități din lume oferă știința datelor la diplomă de licență sau master. La nivel de licență, studentul absolvă o diplomă în Data Science. Aceasta este ca o diplomă cu scop general. La nivel de master, studentul pleacă cu o diplomă postuniversitară în Data Science, specializat în Data Analytics, Data Engineering sau ca Data Scientist.



S-ar putea să surprindă cititorul și, eventual, din păcate, că învățarea automată, modelarea, statistica, programarea și bazele de date sunt cunoștințe esențiale pentru a studia știința datelor la nivel de licență, în ciuda faptului că sunt cursuri universitare respectate în drepturi proprii, studiate în alte discipline la nivel de licență sau master. Cu toate acestea, atunci când un student merge la o universitate pentru a studia Data Science la nivel de licență, toate aceste cursuri vor fi în continuare studiate, alături sau înaintea cursurilor adecvate, pentru Data Science.



Știința datelor pentru licență sau specializările sale precum Data Analytics, Data Engineering sau ca Data Scientist sunt încă în curs de dezvoltare; deși au ajuns într-un stadiu în care sunt aplicate în industrii după ce au fost studiate (la universitate). Data Science este o disciplină relativ foarte nouă, în general.





Amintiți-vă că ar trebui să fiți mai întâi generalist înainte de a deveni specialist. Distincțiile dintre programele de specialitate nu sunt încă clare. Distincțiile dintre programele generaliste și cele de specialitate nu sunt încă clare.

Deoarece Data Science este o disciplină relativ nouă, cărțile prescrise în acest document se bazează pe acoperirea conținutului și nu pe pedagogie (cât de bine învață cartea). Și sunt pentru programul de licență (generalist). Există diferite cursuri generaliste.



Lista

Pentru mai multe detalii și posibilă achiziție cu cardul de credit, se oferă un hyperlink pentru fiecare dintre cărți. Nici una dintre cărți nu acoperă toate cursurile generaliste.

Matematică esențială pentru știința datelor: calcul, statistică, teoria probabilității și algebră liniară

Scris de: Hadrien Jean

  • Editura: Hadrien Jean
  • Data publicării: După 30 septembrie 2020
  • Limba: engleza
  • Număr de pagini: mai mult de 400

Conținutul acestei cărți poate fi văzut ca un curs de matematică pentru Data Science. Deși nu este recomandat să învețe Data Science de unul singur, un absolvent de liceu care dorește să învețe singur Data Science ar trebui să înceapă cu această carte.

Conținut: calcul; Statistică și probabilitate; Algebră liniară; Scalari și Vectori; Matrici și tensori; Spațiul, dependența liniară și transformarea spațiului; Sisteme de ecuații liniare; Vectori proprii și valori proprii; Descompunerea unei valori singulare.

https://www.essentialmathfordatascience.com/

Un ghid de bun simț pentru structurile de date și algoritmi: Creșteți-vă abilitățile de bază de programare / Ediția a 2-a

Scris de: Jay Wengrow

  • Editura: Pragmatic Bookshelf
  • Data publicării: 15 septembrie 2020
  • Limba: engleza
  • Dimensiuni: 7,5 x 1,25 x 9,25 inci
  • Număr de pagini: ‎508

Această carte tratează algoritmii și structurile de date care sunt utilizate în Data Science. Presupunând că cineva învață știința datelor de unul singur după ce a absolvit liceul, atunci aceasta este următoarea carte de citit după ce a citit cartea anterioară de matematică. Exemplele de programe sunt date în JavaScript, Python și Ruby.

Conținut: De ce sunt importante structurile de date; De ce contează algoritmii; O da! Notația O mare; Accelerarea codului dvs. cu Big O; Optimizarea codului cu și fără Big O; Optimizare pentru scenarii optimiste; O mare în Codul de zi cu zi; Căutare rapidă cu tabele Hash; Crearea unui cod elegant cu stive și cozi; Recurs recursiv cu recursivitate; Învățarea scrierii în recursiv; Programare dinamică; Algoritmi recursivi pentru viteză; Structuri de date bazate pe noduri; Accelerarea tuturor lucrurilor cu arbori binari de căutare; Păstrează-ți prioritățile drepte cu grămezi; Nu doare să încerci; Conectarea totul cu grafice; Tratarea constrângerilor de spațiu; Tehnici de optimizare a codului

Știință mai inteligentă a datelor: reușită cu proiecte de date și IA de nivel Enterprise / 1 Sf Editare

Scris de: Neal Fishman, Cole Stryker și Grady Booch

  • Editura: Wiley
  • Data publicării: 14 aprilie 2020
  • Limba: engleza
  • Număr de pagini: ‎286

Conținut: Urcarea pe scara AI; Încadrarea Partea I: Considerații pentru organizațiile care utilizează IA; Framing Part II: Considerații pentru lucrul cu date și AI; O privire în urmă asupra analizelor: mai mult de un ciocan; O privire cu nerăbdare asupra analizei: nu totul poate fi un cui; Abordarea disciplinelor operaționale pe scara AI; Maximizarea utilizării datelor dvs.: a fi determinat de valoare; Evaluarea datelor cu analiză statistică și permiterea unui acces semnificativ; Construirea pe termen lung; A Journey’s End: O IA pentru AI.

Învățare automată: o perspectivă probabilistică (seria Calcul adaptiv și Învățare automată) Ediție ilustrată

Scris de: Kevin P. Murphy

  • Editura: The MIT Press
  • Data publicării: 24 august 2012
  • Limba: engleza
  • Dimensiuni: 8,25 x 1,79 x 9,27 inci
  • Număr de pagini: ‎1104

Această carte este bună pentru începători. Din nou, ca și restul cărților prescrise în acest document, această carte nu acoperă tot ceea ce este necesar pentru programul generalist care, din păcate, nu este încă finalizat (programele de specialitate nu sunt și ele finalizate). Începătorul tipic de aici este un absolvent de liceu cu o trecere la matematică și informatică.

Conținut: Introducere (Învățare automată: ce și de ce?, Învățare nesupravegheată, Câteva concepte de bază în învățarea automată); Probabilitate; Modele generative pentru date discrete; modele gaussiene; statistici bayesiene; Statistici frecventiste; Regresie liniara; Regresie logistică; Modele liniare generalizate și familia exponențială; Modele grafice dirijate (rețele Bayes); Modele de amestec și algoritmul EM; Modele liniare latente; Modele liniare rare; Sâmburi; procese gaussiene; Modele de funcții de bază adaptive; Markov și modele Markov ascunse; Modele spațiale de stat; Modele grafice nedirecționate (câmpuri aleatorii Markov); Inferență exactă pentru modele grafice; Inferență variațională; Inferență mai variațională; inferență Monte Carlo; Inferența lanțului Markov Monte Carlo (MCMC); Clustering; Învățarea structurii modelului grafic; Modele variabile latente pentru date discrete; Invatare profunda.

Știința datelor pentru afaceri: Ce trebuie să știți despre minarea datelor și gândirea analitică a datelor / Ediția I

Scris de: Tom Fawcett și Foster Provost

  • Editura: O’Reilly Media
  • Data publicării: 17 septembrie 2013
  • Limba: engleza
  • Dimensiuni: 7 x 0,9 x 9,19 inci
  • Număr de pagini: ‎413

Conținut: Gândire analitică a datelor; Probleme de afaceri și soluții de știință a datelor; Introducere în modelarea predictivă: de la corelație la segmentarea supravegheată; Adaptarea unui model la date; Supraajustarea și evitarea acesteia; Similaritate, vecini și clustere; Gândirea analitică decizională I: Ce este un model bun?; Vizualizarea performanței modelului; Dovezi și probabilități; Reprezentarea și extragerea textului; Gândirea analitică a deciziei II: către ingineria analitică; Alte sarcini și tehnici de știință a datelor; Știința datelor și strategia de afaceri; Concluzie.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Statistici practice pentru cercetătorii de date: peste 50 de concepte esențiale folosind R și Python / Ediția a 2-a

Scris de: Peter Bruce, Andrew Bruce și Peter Gedeck

  • Editura: O’Reilly Media
  • Data publicării: 2 iunie 2020
  • Limba: engleza
  • Dimensiuni: 7 x 0,9 x 9,1 inci
  • Număr de pagini: ‎368

Conținut: Analiză exploratorie a datelor, Distribuții de date și eșantionare, Experimente statistice și Testare de semnificație, Regresie și predicție, Clasificare, Învățare automată statistică, Învățare nesupravegheată.

Cartea de ce: noua știință a cauzei și efectului

Scris de: Judea Pearl, Dana Mackenzie

  • Editura: Basic Book
  • Data publicării: 15 mai 2018
  • Limba: engleza
  • Dimensiuni: 6,3 x 1,4 x 9,4 inci
  • Număr de pagini: ‎432

În timp ce multe cărți Data Science folosesc industria de afaceri pură pentru ilustrare, această carte folosește industria medicală și alte discipline pentru ilustrare.

Conținut: Introducere: Mind over Data; Scara Cauziunii; De la bucanieri la cobai: Geneza inferenței cauzale; De la dovezi la cauze: reverendul Bayes îl întâlnește pe domnul Holmes; Confuzie și deconfuzie: sau, uciderea variabilei care se pândește; Dezbaterea plină de fum: curățarea aerului; Paradoxuri din belșug!; Dincolo de ajustare: Cucerirea Muntelui Intervenție; Contrafactuale: lumi miniere care ar fi putut fi; Mediere: Căutarea unui mecanism; Big Data, inteligența artificială și marile întrebări.

Construiți-vă o carieră în știința datelor

Scris de: Emily Robinson și Jacqueline Nolis

  • Editura: Manning
  • Data publicării: 24 martie 2020
  • Limba: engleza
  • Dimensiuni: 7,38 x 0,8 x 9,25 inci
  • Număr de pagini: ‎354

Conținut: Noțiuni introductive în știința datelor; Găsirea locului de muncă în știința datelor; Instalarea în Data Science; În creștere în rolul tău de Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / Ediția a 2-a

Scris de: Lillian Pierson

  • Editura: For Dummies
  • Data publicării: 6 martie 2017
  • Limba: engleză
  • Dimensiuni: 7,3 x 1 x 9 inci
  • Număr de pagini: ‎384

Această carte presupune că cititorul are deja cunoștințele pre-necesare de matematică și programare.

Conținut:  Învățați-vă în știința datelor; Explorarea conductelor și infrastructurii de inginerie a datelor; Aplicarea informațiilor bazate pe date în afaceri și industrie; Machine Learning: Învățare din date cu mașina dvs.; Matematică, probabilitate și modelare statistică; Utilizarea clusterizării pentru a subdiviza datele; Modelare cu Instanțe; Construirea de modele care operează dispozitive Internet-of-Things; Urmând principiile proiectării vizualizării datelor; Utilizarea D3.js pentru vizualizarea datelor; Aplicații web pentru proiectarea vizualizării; Explorarea celor mai bune practici în proiectarea tabloului de bord; Realizarea de hărți din date spațiale; Utilizarea Python pentru Data Science; Utilizarea Open Source R pentru Data Science; Utilizarea SQL în știința datelor; Efectuarea științei datelor cu Excel și Knime; Data Science in Journalism: Nailing Down the Five Ws (and an H); Aprofundarea în știința datelor de mediu; Știința datelor pentru stimularea creșterii în comerțul electronic; Utilizarea științei datelor pentru a descrie și a prezice activitatea criminală; Zece resurse fenomenale pentru date deschise; Zece instrumente și aplicații gratuite pentru știința datelor.

Exploatarea seturilor de date masive / 3 rd Editare

Scris de: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editura: Cambridge University Press
  • Data publicării: 13 februarie 2020
  • Limba: engleză
  • Dimensiuni: 7 x 1 x 9,75 inci
  • Număr de pagini: ‎565

Această carte presupune, de asemenea, că cititorul are deja cunoștințele pre-necesare de matematică și programare.

Continut: Data Mining; MapReduce și noua stivă de software; Algoritmi care utilizează MapReduce; Găsirea articolelor similare; Fluxuri de date miniere; Analiza legăturii; Seturi de articole frecvente; Clustering; Publicitate pe web; Sisteme de recomandare; Grafice ale rețelei sociale de minerit; Reducerea dimensionalității; Învățare automată la scară largă.

Concluzie

Distincțiile dintre programele de specialitate nu sunt încă clare. De asemenea, diferențele dintre programele generaliste și cele de specialitate nu sunt încă clare. Cu toate acestea, după ce a citit lista de cărți dată, cititorul va fi în poziția de a aprecia mai bine rolurile speciale de analist de date, inginerie de date și om de știință a datelor și apoi să avanseze.