Skip to content

İstatistikile Nasıl Yalan Söylenir? 

“İstatistik ile Nasıl Yalan Söylenir?” Darrell Huff’ın (1913-2001) 1954 yılında yazdığı ve istatistiğin bir “aldatmaca aracı olarak kullanılma yöntemlerini” açıkladığı, güncelliğini kaybetmeyen kitabıdır.

https://mronline.org/wp-content/uploads/2019/05/HowToLieWithStatistics.pdf

Mel Calman’ın bir çizimine “Romancı olup da ne yapacaksın? İstatistikçi ol, hayal gücünü daha çok kullanırsın.” sözünü iliştiren yazar, kitabın “Giriş” bölümünde amacını şöyle izah eder:

“Bu kitap, istatistiğin bir aldatma aracı olarak kullanılma yöntemlerini sergiliyor. Belki madrabazlar için bir el kitabı gibi görünebilir. Buna, kilit açma ve ayak seslerini gizleme yöntemlerini anlattığı anıları rekor kıran emekli kasa hırsızının karşı çıkışıyla yanıt vereceğim: Dalavereciler bunları nasıl olsa biliyor; ben, dürüst insanlar öğrensinler de kendilerini korusunlar diye yazdım.”

Kitapta yer alan on bölümde şu konular ele alınmıştır:

1- Saptırımlı Örnekleme

Örneklemeye dayanan bir araştırmanın değerli olabilmesi için, her türlü sapma kaynağının ortadan kaldırıldığı ve temsil gücü yüksek bir örneklemin kullanılması gerektiğini belirten yazar, küçük bir örneklem grubuyla arzulanan sonuca ulaşan yanıltıcıları tanıtır. Bir örneklem grubu diye belirtilen bazen sadece bir düzine insandan oluşur ve bu küçük gruptan binlerce insanı etkileyen bir sonuç devşirilir. Rastgele oluşturulmuş ve yeterli sayıdaki örneklem grubu ile çalışılması, sapmaları kısmen de olsa önleyecektir.

“… bir araştırmayı tahrif etmek, yani yanlış bir izlenim yaratmak için sonuçları kasten değiştirmek şart değil. Örneklemin hep bir yönde sapma eğiliminde olmasıyla tahrifat zaten otomatik olarak sağlanmaktadır.”

“Görünür sapma kaynakları kadar görünmeyen sapma kaynaklarının da bir örneklemin güvenilirliğini bozabileceğini unutmamalısınız. Yani üzerinde deney yapabileceğiniz sapmalar bulamıyorsanız, bir yerlerde bir miktar sapma olması ihtimali hep var olduğu için kendinize bir şüphe payı ayırın. Bu ihtimal hep vardır.”

“Rastgele örneklem, istatistik kuramınca tam bir güvenle denetlenebilen tek örneklem türüdür; ancak onun da bir kusuru vardır. Elde edilmesi birçok alan için öylesine zor ve pahalıdır ki çoğunlukla maliyetler onu devreden çıkarıverir. Yerine, çok daha ucuz olan ve neredeyse dünyanın her yerinde kamuoyu yoklamalarında ve pazar araştırmalarında yararlanılan katmanlı rastlantısal örnekleme kullanılır.”

“Rastgele örneklemde kontrol edilmesi gereken şey, grubun bütünündeki her isim ya da unsurun örneklemde bulunma şansının eşit olup olmadığıdır.”

2- Doğru Seçilmiş Ortalama

Kişiler ya da kitleler ikna edilecekse, bu iknada istatistiksel ortalamalar kullanılır. “Ortalama” kavramının “kaypak” anlamını vurgulayan yazar, her defasında farklı bir ortalamanın kullanılarak kamuoyunun yanıltılmasının, bilhassa reklamlarda satışı artırılmak istenen ürünler için çok sık başvurulan bir hata olduğunu belirtir.

Yayınlanacak, pazarlık unsuru olarak kullanılacak ya da ilan tahtasına asılacak rakamlara ihtiyaç duyulur. Bu rakamların istenilen şekilde sunulması ama yalan da olmaması adına yapılacak şey, ortalamaları alırken işe gelen yöntemin kullanılmasıdır. Mod, medyan ve aritmetik ortalama gibi üç farklı ortalama yöntemi bulunurken, hilebazların daha çok aritmetik ortalamadan medet umduğu belirtilir. Medyan, daha doğru bir ortalamayı yansıtırken, aritmetik ortalamanın kullanılması tamamen menfaatlere uygun bir tercihtir.

“Burada yaptığım hile, ‘ortalama’ sözünün çok kaypak bir anlamı olduğu için, her defasında başka bir ortalama çeşidini kullanmamdır. Kamuoyu görüşünü etkilemek ve reklamlarda satışları artırmak isteyenlerin bazen masumane, bazen de kasten, çok sık başvurduğu bir hiledir bu. Size bir şeyin ortalama olduğu söylendiğinde, (aritmetik ortalama, medyan veya mod gibi) yaygın olarak kullanılan ortalama çeşitlerinden hangisi olduğu belirtilmedikçe, çok fazla bir şey öğrenmiş sayılmazsınız.”

3- Kaybolan Küçük Sayılar

Hiçbir şey ifade etmeyen rastlantısal sonuçlar elde etmede yazı tura atmak ne kadar anlamsızsa, küçük bir örneklem grubuyla sayılarla oynamak da o kadar anlamsızdır. Reklam stratejilerinde küçük gruplar kullanmanın öneminden bahseden yazar, “Büyük grupta tesadüf sonucu oluşan değişiklikler küçük kalır ve manşet atmaya değmez.” der.

Yazı tura örneğinden hareketle, “On kez yazı tura attığımızda sekiz defa tura gelmesi, bozuk paraların yüzde sekseninin tura geldiğini mi gösteriyor?” diye soran Huff, küçük örneklem grubuyla çalışılan istatistiklerde de aynı yanılgının yaşandığını belirtir. Bu nedenle, ancak yeterli sayıda deney yapıldığında ortalamalar yasasından bir çıkarsama ya da tanım yapmanın mümkün olduğunu söyler.

Grafiklerle de örnek veren yazar, bir ajansın iş hacminin yıldan yıla nasıl çarpıcı bir biçimde arttığını grafik aracılığıyla sunar. Ancak bu artışta rakamlara yer verilmemiş, sadece yıldan yıla sürekli yükselen bir ivme gösterilmiştir. Sayılara yer verilmediği için yıllık artış hacminin milyon dolarlar mı yoksa birkaç dolar mı olduğu belirsizdir. Buna rağmen, grafiğin yükselen eğrisi çarpıcı olduğu kadar yanıltıcıdır.

Bir istatistikçi, önümüze konan bir anket sonucu karşısında şu soruyu sormamız gerektiğini öğütler: “Bu sonuca varmak için kaç kişiye anket uyguladınız?”

Daha önce de belirttiğimiz gibi, yanlı örneklemi istediğiniz sonucu elde etmek için kullanabilirsiniz. Rastgele örneklem ne kadar küçükse, onunla oynama şansınız da o kadar fazladır.

Hiç Uğruna Kuru Gürültü

“Örneklemin bütün grubu temsil edecek biçimde ne kadar doğru seçildiği, sayılarla ifade edilebilen bir ölçüdür. Bunlara istatistikte olası hata ve standart hata adı verilir.” diyen Darrell Huff, “Testlerin sonucunda ortaya çıkan küçük farkların ‘standart hata’ payları göz önünde bulundurulmalıdır.” tespitinde bulunur.

Kitapta verilen örneklerde belirgin olan durum, en güvenilir testlerde bile standart hata oranının binde üç civarında olmasıdır. Bu bağlamda, küçük farklılıkların ortaya çıktığı istatistiki sonuçlarda o farkların aslında hiç olmama ihtimalinin göz önünde bulundurulması gerektiği vurgulanır. Küçük sonuçlar, aslında hiç olmayan ya da tam anlamıyla yer değişikliğiyle sonuçlanan farklara da tekabül edebilir. Bu nedenle, karşılaştırma yapmak anlamsızdır. +3 / -3 / +2 / -2 gibi hata payları her zaman akılda tutulmalıdır.

Matematiksel olarak hesaplanabilen ancak hiçbir önem taşımayacak kadar küçük bir sayı için yapılan abartılı tepkiler, örnek olaylarla açıklanır.

En çarpıcı örnek ise sigara hakkındadır:

“Bir dergi, laboratuvar ekibine farklı marka sigaraların içimini analiz ettirir ve markalara göre sigara dumanlarında bulunan nikotin ve katran miktarlarını yayımlar. Hangi markayı içerseniz için, sonuçların birbirine çok yakın olduğu görülür. Ancak listede, neredeyse aynı olan sonuçlar arasında bir marka en altta kalmıştır. Hemen ardından gazetelerde tam sayfa reklamlar yer alır. Reklamlarda, bu saygın dergi tarafından test edilen sigaralar arasında en az zararlı madde içeren sigaranın kendi markaları olduğu vurgulanır. Gerçek farkın ihmal edilebilir düzeyde olduğu göz ardı edilir. Kamuoyunu yanıltan bu reklamlar daha sonra durdurulsa da, asıl etki çoktan yaratılmış olur.”

Bazen matematiksel olarak doğru olan, hesaplanabilen ancak hiçbir önem taşımayacak kadar küçük olan bir sayı için gereksiz yaygara koparılır. Eski bir söz bu durumu şöyle ifade eder: “Fark ancak önemsiz olduğu zaman bir farktır.”

Hokus-Pokus Grafikleri

Sözcüklerin yetersiz kaldığı durumlarda başvurulan en yaygın yöntemlerden biri de tablo ve grafiklerdir. Okuyucu ilgisini çekmek isteyen yazarlar, ürününü pazarlamak isteyen reklamcılar ya da kitaplarının daha fazla satmasını hedefleyen yayınevleri, grafiklerin ve sayıların gücünden faydalanır.

Tek Boyutlu Resim

Göze hitap etmesi nedeniyle yanıltıcı olabilen resim grafikler, etkileyici ancak manipülasyona açık bir araçtır. Yazar, resim grafiklerini şu şekilde tanımlar: Bir insan figürü milyonlarca insanı, bir para torbası ya da üst üste yığılmış bozuk paralar bin sterlini, bir dana resmi ise ertesi yılki et arzını temsil edebilir. Çubuk grafiklere kıyasla, abartılı bir etki yaratmak için resimli grafiklere sıkça başvurulur.

Örneğin:

“Mesele şurada, ikinci torbanın yüksekliği birincinin iki katı. Ancak genişliği de iki katıdır. Sayfa üzerinde ötekinin iki katı değil, dört katı bir alan kaplamaktadır. Sayılar hâlâ bire iki derken, görsel etki bire dört şeklinde algılanır. Üç boyutlu nesnelerin resimleri söz konusu olduğunda ise yanıltıcılık daha da artar. İkinci torba, birinci şeklin iki katı kalınlıkta da olmalıdır. Geometri ders kitaplarında belirtildiği gibi, benzer katı cisimlerin hacimleri, verilen boyutun kübü oranında artar. İki çarpı iki çarpı iki sekiz eder. Eğer bir para torbasında 15 £ varsa, ikinci torbada sekiz kat hacim olduğuna göre içinde 31 değil, 120 £ bulunması gerekir.”

Eğreti Rakamlar

Ulaşım, sağlık, şirketlerin mali raporları gibi birçok alanda, bilerek ya da bilmeyerek kullanılan istatistiksel manipülasyonlardan biri de eğreti rakamlardır. Huff, bu konuda şöyle der:

“Kanıtlamak istediğinizi doğrudan kanıtlayamıyorsanız, aynı anlama geldiğini iddia ederek başka bir şeyi öne sürmeyi deneyin. İstatistiklerle insan aklının çarpışmasından çıkan toz duman içinde kimse farkı anlamayacaktır. Eğreti rakamlar, sizin yere sağlam basmanızı garanti edecek bir araçtır.”

Bu durumu daha iyi anlamak adına kitaptan şu örnek verilebilir:

“Demiryolu kazalarında bir yılda 4712 kişinin öldüğü açıklanmıştır. Bu sayı, trenlere adım atmayıp otomobil kullanmayı tercih etmeniz için yeterli görünüyor olabilir. Ancak, bu sayının derinine inildiğinde oldukça farklı bir anlam taşıdığı görülür. Ölenlerin yarısını, tren geçitlerinde otomobilleriyle çarpışan sürücüler oluşturur. Geri kalanların büyük çoğunluğu ise raylar üzerinde gezintiye çıkan yayalardır. 4712 kişi içindeki gerçek tren yolcusu ölümleri sadece 132 kişidir. Ancak bu sayı bile, kilometre başına toplam yolcu sayısı bilinmeden anlam ifade etmez.”

“Bir şeyleri sayıp, başka şeyler üzerine sonuç çıkarmanın birçok farklı yöntemi vardır. Genel olarak kullanılan yöntemlerden biri, aynı gibi görünen ama gerçekte aynı olmayan iki veriyi birlikte ele almaktır.”

“Her istatistiksel veriyi ifade etmenin birçok yolu vardır. Örneğin, ‘Satışlar üzerinden %1 kâr elde edildi.’, ‘Yatırımın geri dönüş oranı %15 oldu.’, ‘Toplam kâr 10 milyon dolar.’, ‘1965-69 ortalamasına kıyasla kârlar %40 arttı.’ ya da ‘Geçen yıla oranla %60 azaldı.’ ifadelerinin tümü, aslında aynı olguyu farklı şekillerde sunmaktadır. Seçilecek ifade biçimi, verilen mesajın amacına en uygun olanıdır. Okuyucuların büyük çoğunluğu, bu ifadelerin gerçekte aynı sonucu yansıttığını fark etmeyecektir.”

“Eğreti rakamların tümü kasıtlı olarak üretilmez. Pek çok istatistik, tıp verileri de dahil olmak üzere insanlar için büyük önem taşır. Ancak, bilgi kaynağının beceriksizce aktarılması nedeniyle yanlış yorumlanabilirler.”

Post-Hoc Yine Doludizgin

“İki faktör arasında bir bağlantı olması, birinin ötekinin nedeni olacağının kanıtı olamaz” savından hareketle yazar, aralarında bağıntı kurulan iki değişken arasındaki korelasyonun, illaki bir sebep-sonuç ilişkisi taşımayabileceği konusunda dikkatli olunması gerektiğini vurgular.

Post hoc yanılsamasına düşmemek ve olmayan şeylere bel bağlamamak için öne sürülen her ilişkinin dikkatle incelenmesi gerektiğini belirten yazar, “Korelasyon, bir şeyin bir nedenle oluştuğunu kanıtlar gibi görünen inandırıcı derecede yüksek bir rakam, gerçekten bunu kanıtlayabileceği gibi başka bir şeylerin de kanıtı olabilir” uyarısında bulunur.

Yazar, pozitif ve negatif korelasyon örnekleriyle post hoc yanılsamalarını detaylandırır.

Profesör Helen M. Walker, iki faktörün bir arada olduğu durumlarda muhakkak bir neden-sonuç ilişkisi bulunduğu yanılgısına şu örneği verir: Kadınların fiziki özellikleriyle yaşlarını birlikte ele alırken önce, yürürken bacaklarının yaptığı açı ölçülmüş. Yaşlı kadınlarda bu açının daha büyük olduğu görülmüş. İlk akla gelen, kadınların bacaklarını daha fazla açtıkları için yaşlandıkları olabilir. Saçma, değil mi? Öyleyse, yaşlandıkça bacaklar arasındaki açının büyüdüğü, kadınların çoğunun da yürürken bacaklarını daha fazla açtıkları sonucuna varabiliyoruz. Ancak böyle bir sonuç, yanlış ve hiçbir kanıt taşımıyor. Aynı kadınları uzun süre inceleyerek bir sonuca varırsanız, elde edilen bulgular ancak o zaman geçerli olabilir. Ancak bu tür bir çalışma, burada etkili olan faktörü ortadan kaldırabilir.

İstatistikbazlık

Literatürde olmasa da Darrell Huff’ın türettiği bir terim olan “istatistikbazlık” için yazar şu tanımı yapar:

“İnsanları istatistiksel malzeme kullanarak yanlış yönlendirmeye istatistiksel dalavere, yani istatistikbazlık denir.”

“Sayıların algıyı etkileme gücü, istatistikçilerin mi yoksa onların elde ettikleri verileri kullanan, değiştiren, abartan, gereğinden fazla basitleştiren ve çarpıtan başkalarının mı işgüzarlığıdır? Suçlu kim olursa olsun, asla saflığa vurup masum rolü takınamaz,” diyen Huff, dergi ve gazetelerde sıkça karşılaşılan uydurma tabloların, bir durumu abartmak ya da olduğundan az göstermek için kullanıldığını belirtir.

İstatistiksel verileri yanlış yorumlamanın en yaygın ve manipülatif yollarından birinin harita kullanımı olduğunu söyleyen yazar, haritalarda gerçekleri gizlemek ve ilişkileri çarpıtmak için yeterince değişken bulunduğunu ifade eder.

Abartılı rakamlar elde etmek amacıyla istatistiksel stratejilere başvurmak, bazen verilen rakam yalan olmasa da merceğin bambaşka bir yöne tutulması, farklı hesaplamaların yapılması, haritaların, grafiklerin, yüzdelik dilimlerin ve ondalık rakamların büyüsünden faydalanılması şeklinde kendini gösterir.

“Post hoc yanılsamasına düşmemek ve olmayan şeylere bel bağlamamak için, öne sürdüğünüz her ilişkiyi dikkatle gözden geçirmelisiniz. Korelasyon, bir şeyin bir nedenle oluştuğunu kanıtlar gibi görünen yüksek bir rakam, gerçekten bunu kanıtlayabileceği gibi başka şeylerin de kanıtı olabilir.”

“Karşılıklı ilişkinin en yaygın biçimi, iki değişken arasında gerçek bir ilişkinin bulunmasına rağmen, hangisinin neden, hangisinin sonuç olduğunu kestirmenin zor olduğu durumlardır. Böyle hallerde neden ve sonuç zaman zaman yer değiştirebilir veya her iki faktör de aynı anda hem neden hem de sonuç olabilir. Gelir ile sahip olunan mallar arasındaki korelasyon bu türdendir: Daha fazla paranız oldukça daha çok mal satın alırsınız, daha çok mal satın aldıkça geliriniz artar. Hangisinin diğerine neden olduğunu söylemek her zaman kolay değildir.”

“Bir toplantıda (veya neşeli bir partide) biri size bir korelasyon hakkında yorum yaptığında, bu korelasyonun olayların akışıyla, zamana bağlı eğilimlerin değişmesiyle etkilenip etkilenmediğini sorgulayın. Günümüzde herhangi iki şey arasında bir korelasyon öne sürmek mümkündür.”

Bir grafikte küçük oynamalarla, örneğin “Ulusal gelir yüzde on arttı.” cümlesinin etkisi, “Muazzam bir yüzde onluk sıçrayış yaptı.” şeklinde değiştirilebilir. Grafikler, nesnelliği bozacak sıfatlar ve edatlar içermediği için sözden daha etkili olabilir. “Kimse size tek laf edemez.” diyen Huff, hilekârların hilelerini açığa çıkarmayı amaçlamaktadır.

“Yapabileceğiniz en az bir düzine hileden biri şudur: Hafifçe yükselen yüzde onluk artışınızı, yüzde yüzlük bir artıştan bile etkileyici gösterebilirsiniz. Apsis (x ekseni) ile ordinat (y ekseni) arasındaki orantıyı bozun. Örneğin, dikey eksendeki her birim artış doların yüzde onunu temsil etsin.”

Tek Boyutlu Resim

Resim grafiklerin, çapraşık, sürükleyici ve yanıltıcı bir etki yaratabildiğini belirten yazar, bu tür grafiklerde örneğin bir insan figürünün bir milyon insanı, bir para torbasının veya üst üste konmuş bozuk paraların bin sterlini temsil ettiğini ifade eder. Çubuk grafiklere kıyasla abartılı bir etki yaratmak için resimli grafiklere başvurulur.

“Mesele şurada: İkinci torbanın yüksekliği birincinin iki katı. Genişliği de iki katı. Sayfa üzerinde ilk torbanın dört katı bir alan kaplıyor. Sayılar hâlâ bire iki diyor, ancak baskın görsel etki bire dört diyor. Bunlar gerçekte üç boyutlu nesnelerin resimleri olduğundan, ikinci torbanın ilk şeklin iki katı kalınlıkta olması gerekir. Geometri kitabınızın da belirttiği gibi, benzer katı cisimlerin hacimleri boyutun kübü kadar artar. Yani iki çarpı iki çarpı iki sekiz eder. Eğer bir para torbasında 15 £ varsa, diğerinde sekiz kat hacim olduğuna göre 120 £ olması gerekir.”

Eğreti Rakamlar

Ulaşım, sağlık, şirketlerin mali raporları gibi birçok alanda bilerek ya da bilmeyerek kullanılan hilelerden biri olarak sunulan eğreti rakamlar için Huff, “Kanıtlamak istediğinizi kanıtlayamıyorsanız, aynı şey olduğunu iddia ederek başka bir şeyi öne sürmeyi deneyin. İstatistiklerle insan aklının çarpışmasından çıkan toz duman içinde kimse farkı anlamayacaktır. Eğreti rakamlar, sizin yere sağlam basmanızı garanti edecek bir araçtır.” der.

Bu hususun daha iyi anlaşılması adına kitaptan şu örnek verilebilir:

“Demiryolu kazalarında bir yılda 4712 kişinin öldüğü açıklanmış. Bu sayı, trenlere adım atmayıp arabanızın direksiyonuna yapışmanız için yeterli görünüyor, değil mi? Oysa sayının derinine indiğinizde farklı bir anlam taşıdığını görüyorsunuz. Sayının yarısını otomobilleriyle geçitlerde trenlere çarpanlar oluşturuyor. Geri kalanların büyük çoğunluğu raylar üzerinde yürüyenler. 4712 kişi içinde yalnızca 132’si tren yolcusu.”

Loading

Sonraki
Önceki
Back To Top