31 Mayıs 2012 Perşembe

İstatistiksel testler


Parametrik ve non-parametrik testler
İstatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır. Kategorik verilerde parametrik olmayan istatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır.

Bağımlı iki grup ortalaması için Student t testi
Deneklerin önce ve sonra değerleri ortalamaları arasında fark olup olmadığının test edilmesidir

Wilcoxon işaretli sıra testi
Bu testte bağımlı iki grubun ortalamaları değil, ortancaları arasındaki farkın önemli olup olmadığı test edilir. Yani evren medyan farkı hakkındaki hipotezi test eder.  Genel olarak, normal dağılım göstermeyen değerler için Wilcoxon testi, t testine göre daha güçlüdür, yani önce ve sonra değerleri arasında fark varsa, daha doğru olarak saptar. Normal dağılım gösteren değerler için her iki testin gücü aynıdır.

Bağımsız iki grup ortalamasının karşılaştırılması
Bağımsız gruplar  denince, her grupta farklı deneklerin yer aldığı, bir gruptaki bir deneğin aynı zamanda başka gruplarda da bulunmadığı anlaşılır.

Student t testi
Varyansların homojenliği Levene-F testi kullanarak değerlendirmektedir. P>0.05 ise %5 anlamlılık düzeyinde “varyanslar eşittir” hipotezi kabul edilir. Böylece deney ve kontrol gruplarının varyanslarının homojen olduğu kabul edilir. Varyansların homojenliğinin sağlanması, tip II hatasına karşı araştırmayı korur Student t testi varsayımları sağlanamıyorsa Mann-Whitney U testi ya da Bağımsız iki grupta medyan testi uygulanır.

Bağımsız iki grupta medyan testi 
Bağımsız iki grupta medyan testi, iki grubun aynı medyana sahip evrenlerden geldiği şeklindeki hipotezin test edilmesinde kullanılır. Medyan testinin uygulanabilmesi için, verilerin en az ordinal ölçekle ölçülmesi gerekir.

Mann-Whitney U testi
Dağılımı normal olmayan bağımsız iki grup varsa değerlere dönüşüm uygulandığında (dönüştürülmüş değerler normal dağılıyorsa ve yine bu dönüştürülmüş değerlerin varyansı eşitse, t testi uygulanabilir) ve bu iki varsayımdan herhangi birinin sağlanamadığı durumlarda t testinin non-parametrik karşılığı olan Mann-Whitney U testi kullanılır.Bu testte de yapılan, değerlere sıra dönüşümü uygulanması ve ortalamalar yerine ortancaların karşılaştırılmasıdır .

27 Mayıs 2012 Pazar

Kestirim ve Hipotez testleri


Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır.Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır. Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.

Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir.H1 ile gösterilen alternatif hipotez  adı verilen hipotez ise, Ho hipotezinin tam tersidir.
Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılırHo hipotezi “iki ortalama arasında fark vardır” şeklinde ise hipotez iki-yönlü; “1.grubun ortalaması 2.grup ortalamasından büyüktür/küçüktür” şeklinde ise tek-yönlü’dür.

26 Mayıs 2012 Cumartesi

Normal Dağılım


İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.Standart sapması değeri 1 ise, frekans eğrisi çan şeklinde olan simetrik dağılımdır. Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir.

Dağılım şekli ölçütleri :  Çarpıklık –1 ve +1 arasında yer alır. Normal dağılımın çarpıklık katsayısı sıfırdır. Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık, küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.

Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır. Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir.

Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır. Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.
Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30)  testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.

Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır.
Genellikle bir örneklemde 30 ya da daha fazla sayıda denek varsa, evren normal dağılım göstermiyorsa bile, ortalamanın örneklem dağılımının normal olduğu varsayılabilir

Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :
1.      Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak.
2.      Varolan verilere parametrik olmayan bir test uygulamak

25 Mayıs 2012 Cuma

Yayılma Ölçütleri


Farklı grupların merkezi eğilim ölçütleri aynı olduğu halde, gruplar birbirlerinden çok farklı olabilir. Bu nedenle merkezi eğilim ölçütleri yanında, yayılma ölçütleri de çok önemlidir.

Değer aralığı (Genişlik - Range) 
En basit yaygınlık ölçüsüdür. En küçük ve en büyük değer arasındaki farktır.
Örnek büyüklüğü ile artma eğilimi vardır. Ortalama gibi, uç değerlerden çok etkilenir. En uçtaki iki değer arasında kalan değerler hakkında bilgi vermez.

Standart sapma ve Varyans
Standart sapma, bir örneklemdeki denek değerlerinin örneklem ortalamasından aşağı ya da ne kadar saptığını, yani denek değerlerinin yayılmasını gösterir. Yani, denekler arasında ne kadar yaygınlık olduğunu ifade eder. Ss’ nın karesine varyans adı verilir. Tüm değerlerin dağılımı ile bilgi verirler. Tüm değerler eşitse, her ikisi de sıfıra eşittir. Değerler arasında farklar arttıkça standart sapma (Ss) ve varyans büyür.

Merkezi eğilim ölçütü olarak ortalama kullanıldığında, yayılma ölçütü olarak da standart sapma kullanılır.
Normal dağılım gösteren değişken değerleri için aşağıdaki kurallar geçerlidir :
1.      Değerlerin % 67’si ortalama ± 1 Ss içindedir.
2.      Değerlerin % 95’i ortalama ± 2 Ss içindedir.
3.      Değerlerin % 99.7’si ortalama ± 3 Ss içindedir

Standart hata
Aynı evrenden seçilecek, ya da seçilmesi mümkün olan aynı büyüklükteki örneklemlerin ortalamalarının yayılmasına ortalamanın örneklem dağılımı  denir. Ortalamanın örneklem dağılımının ölçütü  ortalamanın standart hatası (standard error of mean = SEM)’ dır.
Çalışmaya alınan örneklemin yayılma özellikleri verilmek isteniyorsa, doğru olanı Ss’nın verilmesidir. Çünkü, SEM örneklemdeki deneklerin yayılması ile ilgili olmadığı için, makaledeki çalışma grubunun değişkenliğini göstermez.
Çalışma gruplarındaki ortalamaların karşılaştırıldığı grafiklerde ise ±2 SEM kullanılması daha doğrudur.

Değişim katsayısı [coefficient of variation (CV)]
Birimleri farklı olan değişkenlerin yayılmalarını karşılaştırmak için değişim katsayıları kullanılır. Değişim katsayısı, standart sapmanın ortalamaya oranının yüzde olarak ifadesidir.

Çeyrek ve Yüzdelikler
Çeyrek ve yüzdelikler bir aralık olmayıp bir noktayı gösterirler.
25’inci yüzdelik birinci çeyrek, 50’inci yüzdelik ikinci çeyrek (yani ortanca), 75’inci yüzdelik üçüncü çeyrek olarak adlandırılır. 25’inci yüzdelik, gözlemlerin %25’inin bunun altında ve %75’inin üstünde kaldığı değerdir. 50’ici yüzdelikte değerlerin %50’si bunun altında, %50’si üzerindedir.Değerlerin dağılımı normalse, ortalama – 2 Ss ve ortalama + 2 Ss, sırasıyla 2.5 ve 97.5 persentil değerlerine karşılık gelir.Çeyrekler arası aralık : 25 ve 75 persentil (birinci çeyrek ve üçüncü çeyrek) değerleri arasındaki farka denir. Yani değerlerin ortada yer alan %50’ si çeyrekler arası aralıktadır.

22 Mayıs 2012 Salı

Tıp alanında kullanılan temel istatistiksel kavramlar II

TANIMLAYICI İSTATİSTİK
Tanımlayıcı istatistikler verilerin sayısal ya da grafiksel olarak özetlenmesidir. Çalışmada veriler toplandıktan sonra, bunların merkezi eğilimleri, yayılımları, çarpıklık  araştırılır.

A.Merkezi Eğilim Ölçütleri
Bu ölçüt verilerin değer olarak nerede toplandığını gösterir.

a.Aritmetik Ortalama :
Değerlerin toplamının denek sayısına bölünmesiyle elde edilir. Sayısal değişkenler için merkezi eğilim ölçütüdür.
Ordinal değişkenler için kullanılamaz.  Aşırı değerlerden etkilenir.

b.Ortanca =Orta değer=Median :
Küçükten büyüğe ya da büyükten küçüğe doğru sıralandığında, tam ortadaki deneğin değeridir. Denek sayısı çiftse, ortadaki iki deneğin ortalamaları alınır.
Ordinal veriler için en iyi merkezi dağılım ölçütüdür. Aşırı değerlerden etkilenmez. Nominal değerler için uygun değildir.

c.Tepe değeri = Mod :
Değişkenler içinde en fazla görülen, en çok tekrarlanan değerdir.
Tıpta nadir kullanılan bir merkezi eğilim ölçütüdür.
Ordinal ve sayısal değişkenlerde kaba bir merkezi eğilim ölçütü olarak kullanılabilir. Nominal veriler için uygun bir merkezi eğilim ölçütüdür.

21 Mayıs 2012 Pazartesi

Tıp alanında kullanılan temel istatistiksel kavramlar I


İstatistik belirli bir gerçek dünya problemi ile ilgili bilgilerin (datanın) toplanması, organize edilmesi ve analizi ile ilgili bilimsel metodlar ve bunlara dayandırılan geçerli çıkarımlarla ilgilenen bir bilim dalıdır.

Toplanan bilgilerin başkaları tarafından da anlaşılabilmesi,
Aynı yollarla elde edilmiş başka bilgilerle karşılaştırılabilmesi zorunluluğu,
Verilerin belli kurallara göre, tek tek ve dağılımlar halinde özetlenerek sunulması zorunluluğunu getirmiştir.


Uygun istatistik yöntemin seçilmesi için değişkenlerin ölçüm özellikleri iyi belirlemek gerekir.

Ölçüm özelliklerine göre değişkenler

SAYIMLA BELİRLENEN ÖLÇEKLER (KATEGORİK)
A.NOMİNAL (isimsel, kalitatif) ölçüm düzeyleri arasında bir sıralama ya da uzaklık – yakınlık gibi belirli bir mesafe yoktur
Placebo grubu “0”,
1.tedavi grubu “1”,
2.tedavi grubu “2” olarak kodlanabilir

B. ORDİNAL : Ordinal ölçüm, nominal ölçümün belirli bir biçimde veya belirli bir kritere göre sıralandırılması dır.
Sıralandırma, iyiden kötüye doğru ya da kötüden iyiye doğru yapılabilir.
 Ordinal bir değişkende, ölçüm düzeyleri arasında bir sıralama vardır, ancak düzeyler arasındaki uzaklık belli değildir. Örneğin radyolojik evreleri girdiğimiz “EVRE” adlı değişkene 1,2,3,4 değerleri girilebilir.
Bu değerler belli bir sırayı gösterir. Evre 3, evre 2’ den daha ileri bir evredir; evre 1 en iyi, evre 4 en kötü evredir.
Ama değişkenler arasındaki uzaklık belli değildir. Yani, evre 2, evre 1’ den ne kadar ileriyse, evre 4’ te evre 3’ ten o kadar ileridir denemez
Ordinal değişken değerleri yalnızca “<” ve “>” işlemleri için sayı gibi değerlendirilir; bunlar dışındaki matematik işlemler uygulanamaz.

ÖLÇÜMLE BELİRLENEN ÖLÇEKLER (SAYISAL)
Bir değişkenin aldığı değerler, nominal ya da ordinal değişkenlerde olduğu gibi araştırmacı tarafından belirlenmiş kodlar değil de gerçek rakamlarsa, o değişkenin sayısal ölçüm skalasında ölçüldüğü söylenebilir.
Sayısal ölçümle belirlenen değişkende, değişken düzeyleri arasında hem sıralama, hem de belirli bir uzaklık vardır. Sayısal değişken değerlerine, reel sayılara uygulanan her türlü matematik işlem uygulanabilir.
Sayısal değişkenleri, sınıflayarak ordinal değişkenlere dönüştürebiliriz.
Sayısal değişkenleri çok gerektirmedikçe, ordinal değişkenlere dönüştürmek uygun değildir.
İstatistik analiz sırasında hataya yol açmaz, ancak daha az bilgi veren yöntemlerin kullanılmasını gerektirebilir.
Bu nedenle çalışmalar sırasında verileri toplarken, sayısal değişkenleri sınıflandırmadan, gerçek değerleri ile kaydetmek, daha sonra gerekirse dönüşüm uygulamak yerinde olur.


19 Mayıs 2012 Cumartesi

Ankette hata kaynakları


Bir anketi değersiz kılabilecek hata kaynakları; kapsam, örnekleme, ölçüm ve cevaplamama hataları olmak üzere dört ayrı başlık altında toplanabilir.

Kapsam Hatası: Örneklemin seçildiği liste ya da çerçeve, araştırmacının ilgilendiği kitlenin tüm üyelerinin içermediği zaman oluşur. Eğer hakkında bilgi toplamayı planladığınız topluluğa hedef kitle, örneklemi seçeceğiniz listeyi anket kitlesi olarak tanımlarsak, kapsam hatası bu iki kitle arasındaki farktır.

Örnekleme Hatası: Etkisi azaltıla bilmekle birlikte hiçbir zaman tam olarak ortadan kaldırılamayacak bir hata türüdür. Hedef kitledeki herkes ankete dahil edilmediği sürece örnekleme hatası kaçınılmazdır. Bu hata türünü örneklem büyüklüğünü arttırarak kontrol etmek mümkündür.

Ölçüm Hatası: Verilerin toplanması safhasında gerçekleşebilir. Ankete verilen cevaplar çeşitli nedenlerle insanların gerçek görüşlerini yansıtmıyorsa bu hata oluşur.Örneğin; bir okulda öğretmenin ne sıklıkla sınav yaptığı sorusuna, üç ayda bir izleme testi yapılan bir sınıftaki öğrencilerin bazılar “nadiren” bazıları ise “düzenli” cevabını verebilirler.Ölçüm hatası anket sorularının yanısıra, anket yöntemi, anketör ve anketin uygulandığı kişilerden de kaynaklanabilir.

Cevaplamama Hatası: Örnekleme dahil olan kişilerden anketi cevaplayan ve cevaplamayanlar arsında, ankete konu olan özellikler açısından farklılıklar bulunması veya örnekleme dahilk olan kişilerin önemlibir kısmı ile görüşülmemesi durumlarında ortaya çıkar.

13 Mayıs 2012 Pazar

İstatistikte Ölçüm Türleri


Nominal Skala: Aralarında bir sıralama olmayan ve sadece sınıflandırma amacıyla rasgele isimler takılan verilerden oluşan ölçüm.
Örnek: Cinsiyet: Erkek, Kız
      Medeni Hal: Evli, Bekar, Boşanmış vb.

Ordinal Skala: Aralarında bir sıralama ilişkisi bulunan verileri gösteren ölçümdür. Değerler arasındaki farklar anlamlı değildir.
Örnek: Likert tipi 5 dereceli tutum ölçekleri
           Öğrenim Durumu: İlkokul, Ortaokul, Lise, Lisans vb.

Aralık Skalası: Sıralı ve değerleri arasındaki farkların anlamlı olduğu bir ölçümdür. Ancak değerler arasındaki oran anlamlı değildir. Gerçek bir 0 referans noktası yoktur.
Örnek: Sıcaklık: 0 derece, 12 derece vb.
           Tarih: Gün, ay, yıl, çeyrek, yarı yıl

Oranlı Skala: Sıralı, gerçek bir sıfır'ı (referans noktası) olan, değerler arası farkların ve değerler arasındaki oranların anlamlı olduğu verileri gösteren ölçüm.
Örnek: Aylık Gelir: 0, 300, 1000, 5000 vb.
           Boy: 0, 1.20, 1.85 vb.

12 Mayıs 2012 Cumartesi

Merkezi Eğilim Ölçütleri


Aritmetik Ortalama :
Değerlerin toplamının denek sayısına bölünmesiyle elde edilir. Sayısal değişkenler için merkezi eğilim ölçütüdür.
Ordinal değişkenler için kullanılamaz ve aşırı değerlerden etkilenir.

Ortanca (Orta değer - Median) :
Küçükten büyüğe ya da büyükten küçüğe doğru sıralandığında, tam ortadaki deneğin değeridir. Denek sayısı çiftse, ortadaki iki deneğin ortalamaları alınır.  Ordinal veriler için en iyi merkezi dağılım ölçütüdür. Aşırı değerlerden etkilenmez. Nominal değerler için uygun değildir.

Tepe değeri (Mod) :
Değişkenler içinde en fazla görülen, en çok tekrarlanan değerdir. Tıpta nadir kullanılan bir merkezi eğilim ölçütüdür. Ordinal ve sayısal değişkenlerde kaba bir merkezi eğilim ölçütü olarak kullanılabilir. Nominal veriler için uygun bir merkezi eğilim ölçütüdür.

11 Mayıs 2012 Cuma

Klinik araştırmaların tasarlanması


Doğru araştırma tasarıma ulaşmak için bir araştırıcının şu soruların cevabını vermesi gerekir;

- Çalışmanın amacı nedir?
- Çalışma sonucunda elde edilecek çıkarımın hangi değerde olması bekleniyor?
- Çalışılacak hastalık, ilaç ve hasta grubunun dikkat edilmesi gereken bir özelliği var mıdır?
- Çalışılacak tedavinin alternatifi var mıdır?
- Kontrol grubu kullanılmalı mıdır? Hangi kontrol grubu kullanılmalıdır?
- Çalışmaya ne kadar maliyet, süre ve ne kadar personel ayrılabilir?
- Çalışmanın yapılacağı merkezlerin olanakları nelerdir? Çalışma pratik olarak uygulanabilir mi?
- Düşünülen tasarım; hastalık, ilaç ve hasta grubu göz önüne alındığında etik midir?

Bu soruların cevapları sonucunda araştırıcı uygun çalışma tasarımına ulaşacaktır. Çalışma tasarımının belirlenmesi sırasında burada özetlenen  genel ilkeler ışığında her bir tasarımın özel koşullarının dikkate alınması önemlidir.
Sonuç olarak, klinik ilaç araştırmalarının tasarımı, elde edilecek verinin değerini belirleyen en önemli etkendir. Bu araştırmaların tasarlanması sırasında, çalışmanın fazı, amacı, ilacın ve hastalığın özellikleri, zaman, maliyet ve klinik uygulanabilirlik gözönüne alınmalı ve her bir tasarım türünün özellikleri bilinmelidir.

8 Mayıs 2012 Salı

İstatistikçi


İstatistik programını bitirenlere "İstatistikçi" ünvanı verilir. İstatistikçi, kendince özel anlamı olan sayı ve sembollerle uğraşır. Kullandığı semboller özel bir dile benzer, bu yolla karmaşık ilişkileri basite indirger. Elde edilen sayısal verileri analiz ederek ilgilenilen sorunların çözümüne yarayacak çıkarsamalarda bulunur.

İstatistikçi, şu üç alanda çalışmaktadırlar: Öğretim, araştırma ve uygulama. Bunlardan ilk ikisi genellikle kuramsal istatistik alanına girer ve bu alana ilgi duyanlar genellikle üniversitelerde öğretim elemanı olarak çalışabilirler. Uygulamalı istatistikçiler sosyal ve politik bilimler, tıp, eğitim, doğal bilimler, endüstriyel faaliyetler vb. alanlarda sayısal verilerin toplanması, çözümlenmesi ve buna dayanarak geleceğe ilişkin tahminler yapılması ile ilgili konularda çalışırlar. Endüstrileşme ve planlı kalkınma çabasında olan ülkemizde iyi yetişmiş istatistikçilere büyük ihtiyaç duyulmaktadır.

2 Mayıs 2012 Çarşamba

Doğruluk ve Duyarlılık

Doğruluk (Accuracy); analiz sonucunun gerçek değere ne kadar yakın olduğunun, Duyarlılık(Precision) ise yapılan ölçümlerin birbirine ne ölçüde yakın olduğunun ifadesidir.

Bir analizde ölçümlerin duyarlılığıgerçeğe en yakın bir şekilde her zaman hesaplanabilir. Ancak gerçek değer tam olarak bilinmezse sonucun doğruluğuancak tahmin edilebilir.Bir ölçümde, duyarlılığın çok iyi olması onun doğruluğunun da çok iyi olduğunu göstermez, ancak gerçeğe yakınlığı konusunda bir fikir verebilir.
Örneğin, içinde tam %20 demir bulunan bir karışımın analizi sonunda bulunan yüzde demir miktarı sonucun doğruluk derecesi hakkında bir fikir verir.Öte yandan içindeki gerçek demir miktarı bilinmeyen bir filizin analizi sonunda bulunan yüzde demir, o değerin doğruluğu konusunda bir şey söylemez.

Bu sonucun elde edilmesi sırasındaki ölçümlerin birbirine yakınlığıyani ölçümün duyarlılığıise bulunan sonucun doğruluğu konusunda bir fikir verir. Doğruluk,ölçümlerin aritmetik ortalamasının gerçek değere yakınlığı olarak tanımlanır ve hata olarak ifade edilir. Duyarlılık ise, ölçümlerin birbirine yakınlığıolarak tanımlanır ve sapma olarak ifade edilir.Duyarlılık, aynı değeri yeniden elde etme becerisi olarak da tanımlanır.

1 Mayıs 2012 Salı

Emek ve dayanışma gününe


Bilimlerin, toplumsal faydayı sağlayacak hedeflere yönelik uygulanması herkes için saygın bir yaşam sağlanması için şarttır.