No to zacznijmy od tego "p" i "r", a w kolejnych postach i niekoniecznie dzisiaj pójdziemy dalej Moja wiedza niestety też jest na pewno mocno niedoskonała, więc proszę o ewentualne poprawianie.
p, czyli poziom istotności
dla większości prac (przynajmniej tych, które czytałem/słyszałem) przyjmuje się, że jeśli p < 0,05 to wynik jest istotny statystycznie. Ale skąd to p? Wylicza się je np. testem t-Studenta i określa czy różnice wartości występujące w dwóch zbiorach są faktyczne czy przypadkowe. p=0,05 czyli 1/20 czyli 5% oznacza, że tylko z 5% prawdopodobieństwem relacja wyników jest przypadkowa. Czyli możemy powiedzieć, że na 95% zauważony w pracy fakt (np., że kobiety są niższe od mężczyzn) jest prawdą, a nie tylko zbiegiem okoliczności.
r, czyli współczynnik korelacji
To może od razu na przykładzie. Mamy 200 pacjentów i chcemy wykazać czy wśród nich Ci, którzy chorują na Colitis ulcerosa częściej zachorują na raka okrężnicy. Czyli chcemy sprawdzić czy występuje pozytywna korelacja pomiędzy występowaniem CU a raka okrężnicy.
Najprościej rzecz ujmując patrzymy czy pacjenci, którzy mają plus+ przy Colitis ulcerosa jednocześnie mają plus+ przy raku. Możemy otrzymać trzy rodzaje wyników: ujemne, zero, dodatnie. Ujemne "r" poinformuje nas, że pacjenci, którzy mają CU na raka okrężnicy zachorują rzadziej. Zerowe "r" poinformuje nas, że nia ma rzadnej korelacji. Dodatnie "r" jak się już domyślacie oznacza, że taka zależność występuje i niestety pacjenci z CU mogą częściej spodziewać się również raka okrężnicy.
Bardzo prosze nie bierzcie tego wszystkiego co napisałem za pewnik, bo za każdym razem jak do tego siadam to jeszcze sto razy się upewniam jak to się liczyło i co dokładnie przez to należy rozumieć. Myślę jednak, że może troche przybliżyłem temat chociaż tych dwóch parametrów.
Pozdrawiam!