QV hezký graf

Představení BI nástroje QlikView na praktické ukázce.

V předcházejícím dílu jsem ukázal, jak načíst data přes internet a zobrazit je v jednoduché tabulce pomocí BI nástroje QlikView.

Otevřeme si minulý QV model. Pomocí „Edit Script“ provedeme následující úpravu a data necháme znovu načíst.

LOAD date(datum,’D.M‘) as datum,
           [Počet provedených testů] as ptest,
           [Počet nakažených osob] as posob
FROM
[https://www.helios-is.cz/covid-19/]
(html, utf8, embedded labels, table is @1);

Na záložku MAIN vložíme objekt „Chart“ a konfigurujeme podle následujících obrázků.
QV_Chart_GeneralQV_Chart_DimensionsQV_Chart_ExpressionsA výsledek je tady.
QV_Graph1

Co můžeme vylepšit?
Pokud nás zajímá závislost mezi počtem testů a počet osob, můžeme si posunout počátek osy X do třetího měsíce.

Provedeme malou úpravu ve skriptu, uděláme z datumu novou proměnou „mesic“.
LOAD date(datum,’D.M‘) as datum,
           month(datum) as mesic,
           [Počet provedených testů] as ptest,
           [Počet nakažených osob] as posob
FROM
[https://www.helios-is.cz/covid-19/]
(html, utf8, embedded labels, table is @1);

A přidáme zobrazovací prvek „ListBox“, bude obsahovat definice měsíců.
QV_Graph2Ještě zkusím oddělit pro větší čitelnost křivky od sebe. Zaškrtnu pro „testy“ v záložce „Axes“ hodnotu Log Scale
QV_Chart_Axes_testya v záložce „Dimension Limits“ nastavím „Limits“ na posledních 10 dnů.
QV_Chart_Dimension_Limits_10A výsledek je lépe čitelný.
QV_Graph3

 

 

Stavíme QV model

Představení BI nástroje QlikView na praktické ukázce.

V předcházejícím dílu jsem ukázal, jak postavit jednoduchý datový zdroj, který budeme pro naši ukázku využívat přes vzdálený přístup z našeho počítače pomocí BI nástroje QlikView.

Co budeme potřebovat?
Nainstalovaný SW QlickView na operačním systému Windows10, může být Personal Edition licence, přístup na internet a jedno kafe.

Před instalací se musíte zaregistrovat na portále nebo využít tento odkaz. Program nainstalujeme a spustíme přes ikonu QlikView 11.

Příprava zdroje
Vytvoříme záložku Main kliknutím na tlačítko „New“.

QV_New

Potom klikneme na ikonu „Editor Script“.
QV_Edit_Script

a otevře se okno „Editor Script“.
QV_Edit_Script

Kliknutím na tlačítko „Web Files …“ se spustí průvodce, který nám načítání zjednoduší.
QV_File_Wizard_Source

Vybereme možnost „Internet File“ a doplníme následující odkaz https://www.helios-is.cz/covid-19/ a klikneme na tlačítko „Next >“.
QV_File_Wizard_Type

Nástroj QlikView se připojí na internetovou adresu, načte html stránku a pokusí se najít html tag <table>. Tedy nemusíme použít žádný další nástroj, např. programovací jazyk R. Pro zájemce o samostudium, tento jazyk se také používá v jiném komerčním nástroji pro statistické služby, analýzi, modelování, predikce atd. SPSS.

Provedeme pár drobných úprav pro správnou diakritiku a pokračujeme tlačítkem „Next >“ až do této obrazovky.
QV_File_Wizard_Script

Poslední tlačítko průvodce je „Finish“. Jak můžete vidět, průvodce vygeneroval jednoduchý kód pro načtení dat přes internet. Potom klikneme na tlačítko „OK“.
LOAD datum,
           [Počet provedených testů],
           [Počet nakažených osob]
FROM
[https://www.helios-is.cz/covid-19/]
(html, utf8, embedded labels, table is @1);

Načtení dat
Kliknutím na tlačítko „Reload“ se provede načtení do paměti nástroje QlikView. Vyskočí informační okno, které se automatický zavře po provedení operace.
QV_Reload

Visualizace dat
Kliknutím pravého tlačítka na myši, vložíme objekt „Tablebox“.
New_Sheet_Object_TableBox

Objeví se nastavení objektu „Table Box“. V záložce „General“ vyplníme následující položky „Title“ a „Fileds Displayed in Tablebox“
New_TableBox_General

a klikneme na tlačítko „OK“.
Table1

A jak udělat hezký graf?
To si ukážeme v přístím díle.

COVID-19

Přehled situace v ČR

Onemocnění COVID-19 je způsobeno novým typem koronaviru s odborným označením SARS-CoV-2. Jedná se o vysoce infekční onemocnění, které se projevuje zejména horečkami, respiračními potížemi (kašel, dušnost), bolestí svalů a únavou. U starších a chronicky nemocných osob může nemoc mít vážnější průběh a může vést i k úmrtí. Další charakteristiky a nebezpečnost onemocnění jsou vzhledem ke krátkému času od prvního výskytu u člověka stále předmětem sledování a výzkumu. Inkubační doba se pohybuje mezi 6 a 14 dny, smrtnost se uvádí v řádu několika procent. K přenosu nemoci dochází kontaktem s infikovanou osobou prostřednictvím kapének šířených při mluvení, kýchání či kašlání. Zdroj nákazy zatím nebyl prokazatelně identifikován, pravděpodobně však jde o některé z divokých zvířat v lokalitě prvního výskytu onemocnění.

Počátek epidemie COVID-19 je datován k 31. prosinci 2019, kdy byly první případy hlášeny v čínském městě Wu-Chan v provincii Chu-Pej. Během následujících dvou měsíců onemocnělo po celém světě přes 87 tisíc osob, téměř 3 tisíce pacientů zemřely; o další týden později již počet nakažených přesáhl 100 tisíc. V České republice byly první tři případy nákazy novým koronavirem prokázány 1. března 2020.

Zdroj: https://onemocneni-aktualne.mzcr.cz/covid-19

Níže uvedené tabulky jsou vytvořeny v BI nástroji Qlikview, který bude představen v následujících článcích a na praktických ukázkách.

Covid-19CR

Datový zdroj
Vzhledem k faktu, že otevřená datová sada COVID-19 (KHS) v ČR je v přípravě, tak pro jednoduchost, jsem vytvořil excelovskou tabulku a ručně copy/paste jsem doplnil data ze stránek ÚZIS ČR https://onemocneni-aktualne.mzcr.cz/covid-19.

Výsledný soubor má následující strukturu.

datumPočet provedených testůPočet nakažených osob
2020-03-26 00:00:00311271925
2020-03-25 00:00:00266981763
2020-03-24 00:00:00226001472
2020-03-23 00:00:00196241287
2020-03-22 00:00:00173771161
2020-03-21 00:00:00155841047
2020-03-20 00:00:0013704889
2020-03-19 00:00:0011619765
2020-03-18 00:00:009402560
2020-03-17 00:00:007664450
2020-03-16 00:00:006302383
2020-03-15 00:00:005068298
2020-03-14 00:00:004065189
2020-03-13 00:00:003094141
2020-03-12 00:00:002353116
2020-03-11 00:00:00181694
2020-03-10 00:00:00135863
2020-03-09 00:00:00119338
2020-03-08 00:00:0092832
2020-03-07 00:00:0078726
2020-03-06 00:00:0059419
2020-03-05 00:00:004838
2020-03-04 00:00:004075
2020-03-03 00:00:003405
2020-03-02 00:00:002623
2020-03-01 00:00:002113
2020-02-29 00:00:002000
2020-02-28 00:00:001930
2020-02-27 00:00:001700
2020-02-26 00:00:001350
2020-02-25 00:00:001120
2020-02-24 00:00:00980
2020-02-23 00:00:00860
2020-02-22 00:00:00830
2020-02-21 00:00:00820
2020-02-20 00:00:00820
2020-02-19 00:00:00820
2020-02-18 00:00:00800
2020-02-17 00:00:00800
2020-02-16 00:00:00780
2020-02-15 00:00:00770
2020-02-14 00:00:00760
2020-02-13 00:00:00760
2020-02-12 00:00:00750
2020-02-11 00:00:00740
2020-02-10 00:00:00720
2020-02-09 00:00:00640
2020-02-08 00:00:00620
2020-02-07 00:00:00620
2020-02-06 00:00:00560
2020-02-05 00:00:00530
2020-02-04 00:00:00530
2020-02-03 00:00:00480
2020-02-02 00:00:00430
2020-02-01 00:00:00380
2020-01-31 00:00:00370
2020-01-30 00:00:00340
2020-01-29 00:00:00330
2020-01-28 00:00:00280
2020-01-27 00:00:00200

Počet provedených testů znamená celkový (kumulativní) počet provedených testů. Počet nakažených osob znamená celkový (kumulativní) počet osob s prokázanou nákazou COVID-19 dle krajských hygienických stanic včetně laboratoří.

Jak začít?
Přečte se následující příspěvek.