Skip to content

Commit

Permalink
Info about Pandas
Browse files Browse the repository at this point in the history
  • Loading branch information
tisnik committed Nov 14, 2023
1 parent 1ccd846 commit 4d09fbb
Showing 1 changed file with 83 additions and 0 deletions.
83 changes: 83 additions & 0 deletions docs/python_data_science.md
Original file line number Diff line number Diff line change
Expand Up @@ -220,6 +220,12 @@

## Xarray

![xarray](images/xarray1.png)

---

### Xarray

* n-dimensionální pole s metadaty
- jméno
- dimenze (osy)
Expand All @@ -241,8 +247,84 @@

---

### Množina polí

![xarray](images/xarray2.png)

---

## Pandas

* Načtení dat z různých datových zdrojů do datových rámců
- CSV
- TSV
- databáze
- tabulkové procesory
* Programová konstrukce datových rámců
* Prohlížení obsahu datových rámců
* Iterace nad daty, řazení a další podobné operace
* Spojování, seskupování a změna tvaru dat
* Práce s takzvanými sériemi
- většinou získanými z datových rámců
* Vykreslování grafů z údajů získaných z datových rámců

---

### Práce s datovými rámci

* Knihovna Pandas podporuje využití různých datových zdrojů, především pak:
- Souborů CSV (Comma-Separated Values)
- Souborů TSV (Tab-Separated Values)
- Textových souborů s volitelným oddělovačem a formátem sloupců
- Tabulek z tabulkových procesorů (xls, xlsx, xlsm, xlsb, odf, ods, odt)
- Souborů JSON se strukturovanými daty
- Načítání z relačních databází s využitím SQL driverů
- Načítání z Parquet souborů
- atd.

---

### Zpracování souborů s nestandardním formátem

* https://www.cnb.cz/cs/financni_trhy/devizovy_trh/kurzy_devizoveho_trhu/denni_kurz.txt
* Evidentně se jedná o tabulková a velmi dobře strukturovaná data, která by bylo vhodné umět automaticky zpracovat

```
13.11.2023 #219
země|měna|množství|kód|kurz
Austrálie|dolar|1|AUD|14,683
Brazílie|real|1|BRL|4,672
Bulharsko|lev|1|BGN|12,573
Čína|žen-min-pi|1|CNY|3,162
Dánsko|koruna|1|DKK|3,296
EMU|euro|1|EUR|24,590
Filipíny|peso|100|PHP|41,117
Hongkong|dolar|1|HKD|2,952
Indie|rupie|100|INR|27,682
Indonesie|rupie|1000|IDR|1,468
Island|koruna|100|ISK|16,040
Izrael|nový šekel|1|ILS|5,964
Japonsko|jen|100|JPY|15,186
Jižní Afrika|rand|1|ZAR|1,228
Kanada|dolar|1|CAD|16,664
Korejská republika|won|100|KRW|1,740
Maďarsko|forint|100|HUF|6,514
Malajsie|ringgit|1|MYR|4,896
Mexiko|peso|1|MXN|1,303
MMF|ZPČ|1|XDR|30,319
Norsko|koruna|1|NOK|2,069
Nový Zéland|dolar|1|NZD|13,550
Polsko|zlotý|1|PLN|5,552
Rumunsko|leu|1|RON|4,947
Singapur|dolar|1|SGD|16,936
Švédsko|koruna|1|SEK|2,118
Švýcarsko|frank|1|CHF|25,471
Thajsko|baht|100|THB|64,040
Turecko|lira|1|TRY|0,806
USA|dolar|1|USD|23,050
Velká Británie|libra|1|GBP|28,230
```

---

## Polars
Expand Down Expand Up @@ -273,3 +355,4 @@
- https://www.datacamp.com/blog/top-python-libraries-for-data-science

---

0 comments on commit 4d09fbb

Please sign in to comment.