Tanımlayıcı İstatistiklerin Gücünü Ortaya Çıkarmak

Köşe yazarı David Fothergill, pazarlama verilerinizden anlam çıkarmanıza ve içgörüler toplamanıza yardımcı olabilecek istatistiksel ilkeler hakkında kullanışlı bir başlangıç kitabı sunuyor.

Baştan söyleyeyim: Bu yazı istatistikler içerecek. “İstatistiklerin yüzde 60’ı anında oluşturuluyor” gibi eğlenceli ve özlü bir tür değil, gerçek soğuk, zorlu istatistiksel uygulamalar.

Şaka bir yana, pazarlama verilerinizi anlamlandırmanıza yardımcı olmak ve daha iyi stratejik kararlar almanıza olanak sağlamak için her gün kullanabileceğiniz oldukça yüksek düzeyde istatistiksel analiz uygulamalarından bahsedeceğim. Ve hiç acı vermeyecek, söz veriyorum.

“Ama bunu zaten yapıyorum. Daima verilerimi analiz ediyorum!” İnanamayarak söylediğinizi duyuyorum.

Bu muhtemelen çok doğrudur; çoğu web analitiği kullanıcısı (Google Analytics, Omniture ve diğerleri) içgüdüsel olarak resmi olarak “tanımlayıcı istatistikler” olarak bilinen şeyi uygular.

Önerilen makale: girisiminizin basarili olacagina inanmanin yollari hakkında bilgi almak ve güncel girişimcilik haberlerine ulaşmak almak için ilgili sayfayı ziyaret edebilirsiniz.

Örneğin, günlük trafiğinizdeki bir yükselişi veya düşüşü bir grafiği “gözden geçirerek” kolayca tespit edebilirsiniz; performansı hızlı bir şekilde değerlendirmek için ortalamaları kullanırsınız; ve neler olduğunu (ve daha da önemlisi bundan sonra ne yapmanız gerektiğini) anlamanıza yardımcı olacak her türlü karşılaştırmayı yaparsınız.

Genel ilkelere gevşek bir bağlılık iyi ve işe yarar olsa da, bir titizlik unsurunun analizinizi bir sonraki seviyeye taşımanıza yardımcı olabileceğine kuvvetle inanıyorum. Aşağıda, bunun dikkate almanız gereken bir yaklaşım olduğuna sizi ikna edeceğini umarak, gerçek dünyadan örneklerle bağlantılı birkaç kavramı ele alacağım.

Varyans ve Standart Sapma
Her veri kümesinin, anlaşıldığında size ne olduğu ve gelecekte nasıl bir davranış bekleyebileceğiniz hakkında çok şey anlatan bir takım “özellikleri” vardır. Başlıca özelliklerden biri, veri noktalarının dağılımıdır (yani, ölçümlerin ne kadar yayılmış ve birbirinden farklı olma eğilimi).

Bunun resmi ölçüsü, ortak metriği olan varyanstan (σ2) türetilen standart sapmadır (SD). İsimlerden de tahmin edebileceğiniz gibi, gayri resmi olarak bunlar yalnızca verinin ne kadar sapmasının beklenebileceğini ve ne kadar değiştiğini temsil eder. Ancak biçimsel özelliklerin tam doğasından yararlanarak her türlü eğlenceli ve yararlı şeyi yapabilirsiniz.

SD, varyansın karekökü alınarak hesaplanır. Varyansı hesaplamak için şunları yaparız:

Sonuçlarınızın ortalamasını (ortalamasını) hesaplayın.
Sahip olduğunuz her ölçüm için, 1. adımda hesapladığınız ortalamayı çıkarın ve elde edilen rakamın karesini alın. Her birini bir kenara not edin.
İkinci adımı gerçekleştirirken not ettiğiniz tüm sayıları ekleyin ve işte! Sonuç sizin farklılığınızdır.
SD’yi elde etmek için hesaplanan varyansın karekökünü almanız yeterlidir. Yani tüm hesaplama aşağıdaki gibi görünüyor:

Finansta SD, risk veya volatilitenin önemli bir ölçüsüdür; yatırım yapmadan önce bir hisse senedi portföyünün ne kadar istikrarlı olduğunu bilmek inanılmaz derecede faydalıdır. Bir portföyün ortalama getirisi yüksek olabilir ve harika getiriler sunabilir, ancak standart sapması yüksekse bu, paranızı ona yatırma konusunda sizi daha isteksiz hale getirebilecek riskli bir bahis olabilir.

Bunu pazarlama açısından düşünmek için bazı kampanyalara aylık bütçe ayırdığınızı düşünün. Bütçenizin istediğiniz kadarını harcama potansiyeli olan şu ikisine sahipsiniz:

Saf yatırım getirisi verileriyle her şey basit: “Kar Ayakkabıları”na harcayabildiğimiz her şeyi harcayın ve geri kalanını “Mamut Polar Montlara” aktarın. (Yılın ilk karını bugün burada yaşadık, bu nedenle ilham veren sahte kampanyalar tercih ettik.)

Bununla birlikte, rakamları incelersek ve tarihsel sapmalara bakarsak, hedeflerimize bağlı olarak daha stratejik düşünmeye olanak sağlayabilecek ekstra bir bağlam elde ederiz:

Artık “Kar Ayakkabıları” kampanyası hala cazip bir seçenek; ancak risk/oynaklık unsurunun dikkate alınması gerekir. Karma bir strateji (daha çok “dengeli portföy” yaklaşımı) sizin veya müşterinizin bütçesinin daha mantıklı kullanılmasını sağlayacak mı? Bu tamamen duruma bağlıdır, ancak bu ek veriler sizi sağlam ve bilinçli kararlar alma konusunda çok daha iyi bir konuma getirir.

Bu verileri gördükten sonra yapılacak bir diğer işlem varyansa bakmak olacaktır. Temel sebep nedir? SD’yi düşürmek ve yüksek performansı korumak için yapabileceğiniz eylemler var mı?

Standart Sapma ve Beklentiler
Girişimde, seçmiş olduğunuz analitik paketinin zaman serisi grafiklerine bakarak yukarı ve aşağı yönlü trendleri tespit etmiş olduğunuzun kuvvetle muhtemel olduğunu belirtmiştim.

Resmi yaklaşımı takip ederek SD’yi bu trendler etrafında bağlam sağlamak ve ilkelere sadık kalarak gerçekten bilinçli kararlar vermek için kullanabiliriz.

Dağıtılmış verilerde, standart sapmaların sayısını, belirli bir ölçümün ne kadar “beklendiğinin” bir ölçütü olarak kullanabiliriz – örneğin, günlük işlem verilerinin normal şekilde dağıtıldığını basitleştirir ve varsayarsak (muhtemelen öyle değildir, ancak benim için uygun) Burada bu varsayımı yapmak için) o zaman tüm ölçümlerin yüzde 68’i bir standart sapma dahilinde olmalı, yüzde 95’i ise iki standart sapma dahilinde olmalıdır.

Bunu bilmenin amacı nedir? Pazarlamacılar olarak sınırlı zamanımız olduğundan mücadelemizi seçmemiz gerekiyor. Bu beklentileri kıstas olarak kullanmak, ani yükselişleri ve düşüşleri “işler her zamanki gibi” veya “hımm, bu ilginç, muhtemelen buna bakmaya zaman ayırmalıyım” şeklinde sınıflandırmamıza olanak tanıyor.

Tam bir daire çizerek bu yeni bağlamı bir zaman serisine uygulamak, aşağıda gördüğünüz şeyle sonuçlanır: ilk olarak, belirli bir dönem boyunca hesaplanan basit bir standart sapma ve ikinci olarak, ortalama ve standart sapmanın sürekli güncellenmesini sağlayan yuvarlanan bir hesaplama.

İlk grafiğimizde Ekim ayı sonu “2 Standart Sapma” bölgesine doğru istikrarlı bir düşüş gösteriyor, dolayısıyla durumun neden böyle olduğunu araştırmamız gerekiyor. Ayrıca ağustos ayının sonunda ne olduğunu bilmemiz gerekiyor; buradan ne öğrenebiliriz?

İstatistiksel Önem: Ne Kadar Eminsiniz?
Piyasadaki dönüşüm optimize edicilere tanıdık gelen İstatistiksel Önem, baktığımız bir sonucun veriler içindeki rastgele bir tuhaflıktan ziyade belirli bir ilişkiden kaynaklanıp kaynaklanmadığını bize bildiren kullanışlı bir yöntemdir.

Örneğin, A/B testi yaparken ve site dönüşüm oranını iyileştirmeyi amaçlayan değişiklikler yaparken, ölçülen iyileştirmelerin değişikliklerinize atfedilebileceğinden ve algılanan sonucun yalnızca gözlerinizi kamaştıran veriler olmadığından emin olmanız gerekir* .

*Kesinlik aynı zamanda tanımlanmış bir ölçüdür. Nadiren yüzde 100 emin olabilirsiniz, ancak hedefinizi, iyileştirmelerin sitenizin harika yeniden tasarımının bir sonucu olduğundan yüzde 95 emin olacak şekilde belirleyebilir ve bundan memnun olabilirsiniz.

Bir sonucun ne kadar önemli olduğunu etkileyen temel bileşenler şunlardır:

Örnek Boyutu: Bir şeyi defalarca ölçtüyseniz sonuçlarınızdan daha emin olabilirsiniz. Bir odada iki SEO uzmanınız ve bir basketbol oyuncunuz varsa, üç kişilik örneklem büyüklüğünüz, bir kişinin ortalama boyu konusunda size çok az güven duygusu bırakıyor. 1000 kişinin boyunu rastgele ölçerseniz ortalama boy tahmininizin ne kadar doğru olduğundan çok daha emin olursunuz. (SEO toplantınıza katılan bir Chicago Bull’un açıklanamayan varlığı nedeniyle çarpık değil.)

Standart Sapma: Umarım yukarıda bunun ne olduğunu anlatmayı başarabilmişimdir. Ancak ham SD hikayenin sonu değil. Bunu ölçüm sayısıyla (örneklem büyüklüğü) birleştirmek, “ortalamanın standart hatasını (SE)” hesaplamamıza olanak tanır.

Bu hesaplamanın ayrıntısı burada ve şimdi önemli değil. Buradan çıkarmanızı istediğim şey, baktığınız sonuçların çoğunun bir dereceye kadar kesinlik (veya kötümserseniz belirsizlik) içerebileceği ve bu belirsizliğin, bir şeyi kaç kez ölçtüğünüze bağlı olduğudur. ve bunları ölçtüğünüzde sonuçların ne kadar çeşitli olduğu.

Bu, örneğin aşağıdakileri incelerken geçerlidir:

ücretli arama veya programatik görüntülü reklam performansı.
Bir e-posta pazarlama kampanyasının başarısı.
farklı içerik türleriyle sosyal etkileşim oranları.
Sonuç olarak verilere dayalı kararlar vermeden önce, kesinlik düzeyinizi ve baktığınız rakamlara ne kadar güvenebileceğinizi anlamalısınız.

Çözüm
Umarım bu kavramlarla daha önce karşılaşmamış olanlar için faydalı olmuştur ve siz de bu ekstra adımların ve uygulamaların arama pazarlamacılığındaki çalışmalarımızla alakalı olduğu konusunda benimle aynı fikirde olursunuz.

Bunun, heyecan verici ve devam eden bir zorluk olduğunu düşündüğüm şeyde buzdağının görünen kısmı olduğunu düşünüyorum: Verilerin bir hikaye anlatmasını sağlamak.

WordPress.com ile böyle bir site tasarlayın
Başlayın