Článek: Statistický software pro psychology snadno a zdarma

Autor: Michaela Borovanská

3. 6. 2019

Věnujete se rádi psychologickému výzkumu nebo potřebujete občas jen zpracovat drobné analýzy, na které vám nestačí MS Excel? Nemáte přístup k drahým statistickým nástrojům a marně hledáte takový, který by byl levný a zároveň vyhovující? Pak je tento článek právě pro vás. Hledala jsem varianty za co nejpříznivější cenu, tedy ideálně zdarma. Popisuji zde výhody i limity 3 statistických nástrojů, i úskalí, se kterými jsem se při jejich vyzkoušení (jakožto jejich uživatel začátečník) potýkala. Mojí ambicí není jejich recenzování nebo hodnocení, který z nich by pro vás mohl být nejlepší. Zaprvé se s nimi sama teprve seznamuji, zadruhé vždy bude záležet spíše na vašich konkrétních potřebách a nárocích.

Mnozí z nás si zvykli na jednoduchost a pohodlí, které nám při zpracování dat poskytuje software, jako je IBM SPSS (více informací na https://www.ibm.com/cz-en/products/spss-statistics) nebo Statistica (více informací na http://www.statsoft.cz). Oba tyto robustní nástroje jsou samozřejmě placené. A jejich cena není právě zanedbatelná. Pokud si chcete tento software pouze vyzkoušet nebo použít jednorázově, můžete si stáhnout 30 denní zkušební licenci.

PSPP

Jedním z nástrojů, které lze doporučit těm z vás, kdo jste zvyklí na SPSS, je jeho bezplatná alternativa PSPP (více informací a stažení PSPP na http://www.gnu.org/software/pspp/). Instalace je jednoduchá a bezproblémová. Jako vstupní sety dat lze v PSPP používat data ve formátu .sav (kromě PSPP tento formát používá také SPSS), případně je vytvářet přímo v PSPP. Další možností je import dat z různých textových nebo tabulkových editorů, např. .txt, .ods (OpenDocument), .gnm (Gnumeric tabulkový editor) nebo .csv. Pokud si obvykle připravujete data v MS Excel, budete zde muset udělat jeden krok navíc, a to exportovat je nejprve do .txt nebo .csv formátu (v MS Excel na záložce soubor vyberete exportovat). Importování dat v PSPP je celkem intuitivní, přesto jsem s ním mírně bojovala. Především kvůli „neochotě“ PSPP načíst soubor a pustit mě k druhému kroku importu. Pouze upozorním na jeden z dalších kroků, kde můžete snadno přehlédnout instrukci. Při „Select the First line“ vybíráte první řádek, ve kterém jsou data. Pokud v prvním řádku v souboru s daty máte názvy proměnných, pak označíte až druhý řádek. Dole pod tabulkou s daty je v takovém případě nutné ještě zatrhnout políčko „Line above selected line contains variable names“.

Jakmile máte otevřená nebo naimportovaná data v PSPP, otevře se před vámi prostředí velmi podobné tomu v SPSS. Tabulku s daty vidíte v okně „Data View“. V okně „Variable View“, podobně jako v SPSS, nastavíte např. typ proměnných, zobrazované názvy, názvy kategorií, počet desetinných míst u jednotlivých numerických proměnných. Také lišta se základním menu je velmi podobná SPSS, což původním uživatelům tohoto nástroje může značně usnadnit orientaci a zkrátit dobru potřebnou pro prvotní seznámení.

Podobně jako v SPSS můžete také rozdělit soubor a generovat výsledky současně pro různé skupiny respondentů nebo vybrat na základě nějakého kritéria případy, které chcete do analýz zahrnout. Další podobnosti najdete ve způsobu počítaní nových proměnných nebo překódování stávajících. Zde jen připomenu, že v PSPP lze vytvářet standardizované skóry (transformací na z-skóry) v Analyze-Descriptives.

Pokud nepotřebujete sofistikovanější zpracování dat, rozsah analýz a možnosti jejich nastavení vám pravděpodobně bude stačit. Najdete zde potřebné základní popisné statistiky, srovnání středních hodnot skupin pomocí t-test, ANOVA a neparametrických testů, Pearsonovu korelaci (Spearmanova či parciální bohužel prozatím chybí), dimenzionální analýzy (např. explorační faktorová analýza, K-mean clusterová analýza), test reliability, regresní analýzu. Základní grafy můžete vytvářet samostatně nebo jako součást některých z výše uvedených analýz. K dílčímu testování normality lze využít histogramy a Kurtosis a Skeweness test, které jsou součástí Descriptives. Ačkoli nabídka analýz je omezená, tvůrci softwaru ji neustále rozšiřují.

Výstupy z PSPP nelze jednoduše kopírovat nebo exportovat do MS Excel s formátem .xlsx. Lze je ale exportovat do .odt, .pdf, .html, .txt, .csv (jako text oddělený čárkami). Pokud chcete získat tabulku v MS Excel pro další úpravy, můžete to učinit několika rychlými způsoby. Jedním z nich je export do .odt, který otevřete i v MS Word a následné zkopírování výstupu do MS Excel. Druhou variantou je export do .csv, které lze otevřít v MS Excel. Zde na záložce data převedeme označený text do sloupců. Další varianta zahrnuje importování výsledku z .txt nebo .csv do MS Excel. V každém případě jde o krok navíc. Řešení je však poměrně rychlé a bez dalších obtíží.

jamovi

Zajímavým bezplatným, uživatelsky poměrně přívětivým a užitečným nástrojem je také jamovi (více informací na https://www.jamovi.org). Sety s daty můžete vytvářet v jamovi, nebo importovat data připravená v různých textových formátech (.txt nebo .cvs) nebo ve formátech z jiných statistických nástrojů, např. SPSS a PSPP (.sav), SAS, STATA (.dta) nebo JASP (.jasp). Jamovi pak ukládá data k opětovnému použití ve formátu .omv.

Jakmile máte data otevřená nebo naimportovaná, můžete upravit proměnné či vypočítat nové, včetně výpočtu standardizovaných hodnot (z-skóry). Základní nabídka analýz je na první pohled celkem jednoduchá, přesto běžnému uživateli bude více než stačit. Najdete zde základní popisné statistiky (obsahující v nastavení možností také základní prozkoumání normality), srovnání středních hodnot skupin pomocí t-testu a neparametrických testů (ty jsou zde schované v nastavení možností pod t-testem), ANOVA (včetně jejích neparametrických obdob), ANCOVA, MANCOVA, korelační analýzy (Pearsonova, Spearmanova, Kenuallovo tau b) a regresní analýzy (lineární, logistická a log-lineární schovaná pod Frequencies), test reliability, PCA, explorační i konfirmační faktorovou analýzu. Nabídka analýz je poměrně bohatá (ačkoli některé jsou ukryty tam, kde bychom při prvním pohledu nejspíš nehledali). Nastavení u jednotlivých analýz nabízí vcelku dostačující možnosti, včetně vytváření potřebných grafů. Jamovi lze navíc doplnit různými rozšiřujícími instalacemi, které z něj mohou vytvořit více než užitečného pomocníka.

Samotné výstupy jsou přehledné a lze je přímo kopírovat. Nepotřebujete-li je dále upravovat, máte vyhráno. Potřebujete-li je dále upravit například v MS Excel, budete si muset zvyknout na určité nepohodlí. Dílčí nevýhodou je používání desetinné tečky namísto čárky. Při zkopírování výstupu do MS Excel se zde některé údaje změní na datum (při převedení na číslo neodpovídá původnímu údaji). Jedna z možností řešení pravděpodobně bude upravení nastavení v MS Excel. Druhá možnost je zkopírování výstupu do textového editoru (např. MS Word), hromadné nahrazení tečky čárkou a následné zkopírování do MS Excel. Navíc při zkopírování výstupu přebývají prázdné sloupce a úprava především velkých výstupních tabulek je poměrně náročná. Jako limitující proto vnímám i nemožnost upravovat rozložení tabulek s výstupy přímo v jamovi. Velmi podobným (a mnou zatím neprozkoumaným) nástrojem je JASP (více informací na https://jasp-stats.org/).

R-project a R Commander

Poslední zde zmíněnou alternativou, která je bezplatná, je využití R-project (více informací na http://www.r-project.cz/). R je prostředí pro statistické výpočty a grafické znázornění, které je dostupné jako volně šiřitelný software. Základem je R jako programovací jazyk, v němž uživatel připravuje jednotlivé skripty, tedy programuje. Pro ty, kteří se nechtějí učit programovat, může být vhodný nadstavbový balíček R Commander. Představuje grafické rozhraní pro R, v němž se stačí proklikat v menu k tomu, co právě potřebujete. Umožňuje tak poměrně jednoduše provádět řadu analýz. Nabízí i možnost vytváření grafů a nástroje pro práci s modely.

Základní instalační balíček pro R můžete stahovat z  https://cran.r-project.org/mirrors.html. R Commander naistalujete po otevření programu R tak, že zapíšete do R Console příkaz install.packages(“Rcmdr”). Pro otevření R Commander zadáte příkaz library(Rcmdr) nebo kliknete na liště na Packages-Load package a vyberete Rcmdr.  

Vstupní sety dat lze v R Commander přímo vytvářet. Můžete samozřejmě otevřít již připravená data v R formátu (.RData) nebo je importovat do programu v nejrůznějších dalších formátech – z MS Excel (.xlsx), v textové podobě (.txt), ve formátech dalších statistických nástrojů – SPSS a PSPP (.sav), SAS (.sas) a STATA (.dta). Načíst lze také data z webové stránky či data zkopírovaná do schránky. Samotná data lze následně upravovat přímo v programu, například rekódovat hodnoty, změnit název proměnné, spočítat novou proměnnou, standardizovat proměnnou transformací na z-skóry aj.

Rozsah analýz, které jsou v R Commander dostupné, postačí většině psychologů, kteří jsou běžnými uživateli statistických nástrojů. Kromě základních popisných statistik (frekvence, průměry, kontingenční tabulky) jsou dostupné různé testy normality, srovnání středních hodnot ve skupinách pomocí t-testu, ANOVA či neparametrických testů), korelační analýzy (Pearsonova, Spearmanova, parciální), test reliability, dimenzionální analýzy (např. explorační faktorová analýza, clusterová analýza) či regresní analýzy. Nastavení základních parametrů u jednotlivých analýz je poměrně jednoduché, někdy spíše možná chybí další možnosti, které by uživatel mohl uvítat. Jste-li zvyklí na graficky povedené výstupy analýz, které nabízí např. SPSS, můžete zde být poměrně zklamáni.

Výstupy samotných analýz mají čistě textovou podobu, a to například včetně tabulek. Převod výsledné tabulky do MS Excel není právě snadný. Do R lze doinstalovat řadu nástrojů, díky nimž lze výstupy do MS Excel exportovat, obvykle ale vyžadují použití skriptů zapsaných v jazyce R. Výstupy lze zkopírovat do MS Excel také jako text a následně v záložce data převést text do sloupců. Ne vždy je výsledkem skutečně smysluplná (správně rozložená) tabulka. Zároveň limitem je, podobně jako u jamovi, desetinná tečka namísto čárky. Před převedením textu do sloupců je tedy potřeba nahradit všechny desetinné tečky desetinnými čárkami.

Článek lze komentovat.

Příspěvek byl publikován v rubrice Aktuality pro veřejnost a jeho autorem je MBor. Můžete si jeho odkaz uložit mezi své oblíbené záložky nebo ho sdílet s přáteli.

1 komentář u „Článek: Statistický software pro psychology snadno a zdarma

Napsat komentář