İstatistiksel Öğrenme II – Modelin Netliğini Değerlendirme

15statistik ne yazık ki kesin kuralları olan bir disiplin değil. Herhangi bir metot bir veri setinde çok iyi sonuçlar üretebilirken başka bir veri seti üzerinde çok kötü sonuçlar üretebilir. Bu yüzden belirli bir veri seti üzerinde en iyi performansı veren metodu bulabilmek çok önemli bir konu. Pratikte istatistiksel öğrenmenin en çetrefilli olayı da tam olarak budur: doğru yaklaşımı ve metodu belirlemek. Bu yazıda, belirli bir veri seti için en iyi sonucu üreten istatistiksel öğrenme prosedürünü seçmemizde bize yol gösterecek birkaç önemli konsepti inceleyeceğiz.

Uyum Kalitesinin Ölçümü 

Bir istatistiksel öğrenme metodunun belirli bir veri seti üzerindeki performansını değerlendirmek için metodun ürettiği tahminlerin gerçek sonuçlarla ne kadar örtüştüğünü ölçümlememize yarayacak yöntemlere ihtiyacımız var. Yani, belirli bir gözlem için tahmin edilen cevap(reponse) değerin o gözlemin gerçek cevap(reponse) değerine ne kadar yakın olduğunu sayısallaştırmamız gerekiyor. Regresyon için, en yaygın olarak kullanılan ölçüm Ortalama Karesel Hata (Mean Squared Error-MSE)‘dır ve şu şekilde ifade edilir:

MSE

Burada 6(xi) 6‘in i numaralı gözlem için ürettiği tahmini gösteriyor. Tahmin edilen değerler gerçek değerlere ne kadar yakınsa MSE o kadar küçük olur; gerçek değerlerden ne kadar uzaklaşırsa MSE o kadar büyük olur. Yukarıda MSE, modeli uydurmak(model fitting) için kullanılan training veri seti kullanılarak hesaplanır ve training MSE olarak ifade edilmelidir. Fakat genellikle, metodumuzun training veri seti üzerinde ne kadar iyi sonuçlar ürettiğiyle ilgilenmeyiz. Bilakis training veri seti dışındaki verilerde(test) modelin ne kadar kesin sonuçlar ürettiğiyle ilgileniriz. Peki neden durum böyle?

Düşünün ki geçmişteki stok getirilerini kullanarak gelecekteki stok getirilerini tahminlemeye yaracak bir algoritma yaratmaya çalışıyoruz. Metodu geçtiğimiz 6 ay içindeki stok getirilerini kullanarak eğitiyoruz(train). Ancak metodumuzun geçtiğimiz haftaki stok getirilerini ne kadar iyi tahminlediğiyle ilgilenmeyiz pek. Daha ziyade gelecek hafta veya aydaki stok getirilerini ne kadar iyi tahmin edebileceğiyle ilgileniriz. Veya düşünün ki elimizde birçok hastanın klinik ölçüm verileriyle (kilo, kan basıncı, boy, yaş, aile geçmişi, vb.) diyabet olup olmadığına dair veriler olsun. Bu hastaların verilerini bir hastanın klinik verilerini kullanıp diyabet olup olmadığını tahminlemeye yarayacak bir istatistiksel öğrenme metodunu eğitmek(train) için kullanabiliriz. Pratikte, bu metodu belirli bir hastanın klinik verilerinden yola çıkarak diyabete yakalanma riskini tahmin etmede kullanabiliriz. Bu metodun, metodu eğitmek için kullandığımız hastaların diyabet olup olmadığını ne kadar iyi tahmin ettiğiyle ilgilenmeyiz çünkü zaten bu hastaların gerçekten diyabet olup olmadığını biliyoruz. Daha matematiksel ifade etmek gerekirse, düşünün ki istatistiksel öğrenme metodumuzu training veri setine uydurduk(fit) ve bir 6 tahmini ürettik. Bu 6‘i kullanarak 6(x1), 6(x2),…..,6(xn)‘i hesapladık. Eğer bunlar gerçek y1, y2,…..,yn değerlerine yaklaşık olarak eşitse MSE değeri o kadar küçük olacaktır. Fakat gerçekten 6(xi)~yi olup olmadığıyla ilgilenmeyiz. Daha önce görmediğimiz bir veri üzerinde(x0) modelimizin ne kadar gerçeğe yakın tahmin yaptığıyla ilgileniriz: 6(x0)~y0. Peki test MSE değerini minimum yapacak metodu nasıl bulacağız? Bazı durumlarda test veri seti hazır olarak verilmiş olabilir. O zaman modelimizi training veri setini kullanarak uydururuz(fit) ve sonrasında test veri seti üzerinde çalıştırarak sonuçlarına bakıp MSE’i hesaplarız; mininum test MSE değerini üreten metodu seçeriz. Fakat eğer test veri seti yoksa ne yapacağız? Bu durumda, training MSE değerini minimize edecek istatistiksel metodu seçmeyi düşünebiliriz. Genellikle training MSE ile test MSE yakından alakalı olduğu düşünüldüğü için oldukça mantıklı bir yöntem gibi gözüküyor olabilir. Ne yazikki bu stratejiyle ilgili temel bir problem var: minimum training MSE değerini üreten metodun minimum test MSE değerini üreteceğine dair hiçbir garanti yok. Açık olmak gerekirse çoğu istatistiksel öğrenme metodu özellikle training MSE değerini minimize edecek katsayılar(coefficients) üretecek şekilde optimize edilmiş ve tasarlanmıştır. Bu metotların düşük trainin MSE değerleri üretmesi gayet normal, ancak sıklıkla test veri seti üzerine uygulandıklarında daha büyük test MSE değerleri üretirler.

Örnek 1

Örnek 1

Yukarıdaki grafiği inceleyerek bu durumu açıklayalım. Sol taraftaki grafikte siyah ile çizilmiş eğri bizim gerçek 7 fonksiyonumuzu gösteriyor. Turuncu çizgi ile mavi ve yeşil eğriler ise bizim gerçek 7 fonksiyonu için tahminlerimizi göstersin ve bunların esnekliği(flexibility) sırasıyla artıyor olsun; yani mavi turuncudan, yeşil de maviden daha esnek olsun. Turuncu çizgi “linear regression” metodu ile elde edilen tahmindir; yani esnekliği görece azdır. Mavi ve yeşil eğriler ise ilerideki konularda ayrıntılı ele alacağımız “smoothing splines” metodu kullanılarak elde edilen tahminlerdir ve bu eğriler farklı düzleme seviyeleri (level of smoothing) kullanılarak üretilmişlerdir. Grafiğe dikkatli baktığımızda göreceğimiz üzere esneklik seviyesi arttıkça eğri gözlemlenen veriye daha çok uyum sağlar (fit). Yeşil eğri en esnek olan eğridir ve gözlemlenen veriye en çok uyumu sağlamıştır. Fakat, bu eğrinin gerçek 7 eğrisine çok da benzemediğini görüyoruz; çünkü gereğinden fazla kıvrımlı. Smoothing spline fit metodunun esneklik seviyesini değiştirerek aynı veriye bir çok farklı eğri uydurabiliriz.

Sağ taraftaki grafikte gri eğri ortalama training MSE değerini esnekliğin  bir fonksiyonu olarak göstermekte. Burada esneklik kavramı istatistiki jargonda serbestlik derecesi(degree of freedom) olarak adlandırılır. Turuncu, mavi ve yeşil kareler sol taraftaki ilgili eğrinin MSE değerlerini belirtmekte. Daha kısıtlayıcı ve dolayısıyla daha düz(smooth) eğriler daha kıvrımlı olanlara nazaran daha az serbestlik derecesine (degree of freedom) sahiptir. Training MSE değeri esneklik arttıkça monoton olarak azalır. Bu örnekte gerçek 7 doğrusal değil, ve bu yüzden turuncu çizgi gerçek 7‘i yeterince iyi tahminleyecek esnekliğe sahip değil. Yeşil eğri en düşük training MSE değerine sahip çünkü içlerinden en esnek olanı o. Bu örnekte gerçek 7 fonksiyonunu biliyoruz ve böylece test MSE değerlerini çeşitli esneklik seviyeleri için hesaplayabiliyoruz. (Elbette pratikte gerçek 7 fonksiyonu genellikle bilinmez; dolayısıyla bu örnekte yapacağımız hesaplamayı yapmak mümkün olmaz). Test MSE değeri sağ tarafta kırmızı eğri ile gösterilmekte. Esneklik seviyesi arttıkça training MSE değerine paralel olarak test MSE değeri en başta azalmakta, belli bir noktada test MSE değeri minimum olmakta ve o noktadan sonra test MSE değeri tekrar artmakta. Bu nedenle, turuncu ve yeşil eğriler yüksek test MSE değerine sahip. Mavi eğri test MSE değerini minimize etmekte ve sol taraftaki görselde de görülebileceği üzere zaten görsel olarak gerçek 7‘i en iyi tahmin eden de bu. Yatay kesikli çizgi azaltılamayan hatayı (irreducible error) Var(e) gösteriyor ve bu da bütün metotların ulaşabileceği minimum test MSE değeri anlamına geliyor. Dolayısıyla, mavi eğri ile gösterilen smoothing spline tahmini optimuma yakın bir tahmin.

Yukarıdaki görselin sağ tarafındaki grafikte görebileceğiniz üzere istatistiksel öğrenme metodunun esnekliği arttıkça training MSE değerinde monoton bir azalma gözlemlerken test MSE değerinde U şekli gözlemliyoruz. Bu durum, eldeki veriden ve kullanılan istatistiksel metottan bağımsız olarak istatistiksel öğrenmenin temel bir özelliğidir. Model esnekliği arttıkça, training MSE hep azalır ancak test MSE hep azalmayabilir. Bir metot düşük training MSE değeri üretirken yüksek test MSE değeri üretiyorsa, bu durum elimizdeki veriye “aşırı uydurma” veya tam adıyla “overfitting” yapıyoruz demektir. Bunun sebebi elimizdeki istatistiksel öğrenme prosedürünün training veri setindeki örüntüyü (pattern) çok yakından takip etmesidir ve bu örüntülerden bazıları gerçek 7 fonksiyonunun özelliğinden kaynaklanmayıp tamamıyla şans eseri oluşan örüntülerdir. Training verisine “aşırı uydurma” yaptığımızda, test MSE değeri çok büyük olacaktır çünkü training verisinde bulduğumuzu sandığımız örüntüler(rastgele hatalardan kaynaklanan) test verisinde bulunmayacaktır. Şunu da not etmek gerekiyor ki aşırı uydurma yapalım ya da yapmayalım, neredeyse her zaman training MSE değerinin test MSE değerinden düşük olmasını bekleriz çünkü çoğu istatistiksel öğrenme metodu direkt ya da dolaylı olarak training MSE değerini minimize etmek için tasarlanmıştır. 

 1

Örnek 2

Yukarıdaki grafik gerçek 7‘in yaklaşık olarak doğrusal olduğu başka bir örneği gösteriyor. Gene esneklik arttıkça, training MSE değerinin monoton olarak azaldığını, test MSE değerinin ise U şekli çizdiğini görüyoruz. Fakat, gerçek 7 fonksiyonu doğrusala yakın bir fonksiyon olduğundan, test MSE artmadan önce çok az bir miktarda azalıyor; dolayısıyla turuncu least square fit yüksek miktarda esnek olan yeşil eğriden daha iyi tahminleme yapıyor.

Aşağıdaki figür ise gerçek 7 fonksiyonunun doğrusal olmadığı bir örneği gösteriyor. Training ve test MSE eğrileri aynı davranışı(yani training azalırken test MSE değeri U şekli çiziyor) gösteriyor fakat bu sefer test MSE değeri artmaya başlamadan önce her iki eğride de hızlı bir düşüş gözlemleniyor.

2

Örnek 3

Pratikte genellikle sadece training MSE değerini hesaplayabiliriz; test MSE değerini hesaplamak çok daha zordur çünkü genellikle test verisi elimizde yoktur. Yukarıdaki üç örnekten görebileceğiniz üzere, minimum test MSE değerini üreten modelin esneklik seviyesi veri setinden veri setine ciddi derecede farklılık gösterebiliyor. Bu minimum test MSE noktasını hesaplamak için bir çok yöntem var. Bunlardan en yaygını cross-validation. İleriki yazılarda ayrıntılı olarak inceleyeceğimiz için şimdilik burada duralım.

Taraflılık-Varyans Dengesi (Bias-Variance Trade-off)

Test MSE değerinde gözlemlediğimiz U şekli istatistiksel öğrenme metotlarının birbirleriyle rekabet içinde olan iki özelliğinden kaynaklanıyor. Matematiksel kanıtlamayı burada yapmaya kalkarsak yazının amacını çok aşmış oluruz, fakat beklenen(expected) test MSE değerinin her zaman üç temel miktarın toplamına eşit olduğunu söyleyelim:

3

Burada  4 beklenen(expected) test MSE değerini gösteriyor ve bu da bir sürü farklı training veri seti kullanılarak hesaplanan 6‘erin test setleri üzerindeki MSE değerlerinin ortalamasına tekabül ediyor.

Bu denklem bize şunu diyor aslında: beklenen test hatasını minimize etmek için, aynı anda hem düşük varyansa hem de düşük taraflılığa(bias) erişebilen bir istatistiksel öğrenme metodu seçmemiz gerekiyor. Dikkat edilmesi gereken konu şu ki varyans yapısı gereği her zaman sıfıra eşit ya da pozitiftir ve karesi alınmış taraflılık(bias) da hiçbir zaman negatif olamaz. Bu yüzden, beklenen test MSE değeri asla 5‘nin yani azaltılamaz hatanın (irreducible error) altına inemez.

Bir istatistiksel öğrenme metodunun taraflılığı ve varyansı derken tam olarak neden bahsediyoruz? Varyans 6‘in farklı training veri setleri kullanılarak hesaplandığında ne kadar değiştiği ile ilgilidir. Training veri seti istatistiksel öğrenme metodunu uydurmak(fit) için kullanıldığından, farklı training veri setleri farklı 6‘ler üretecektir. Fakat ideal olarak gerçek 7 için olan tahminimizin farklı training veri seti kullandığımızda çok fazla değişmemesi gerekir. Eğer bir metot yüksek varyansa sahipse o zaman training veri setindeki küçük değişiklikler bile tahminimiz olan 6‘te büyük değişikliklere sebep olur. Genel olarak, daha esnek istatistiksel metotlar daha yüksek varyanslara sahiptir. Örnek 1‘deki yeşil ve turuncu eğrileri gözlemleyin. Esnek yeşil eğri gözlemleri çok yakından takip ediyor. Bu eğri yüksek bir varyansa sahip çünkü gözlemlerden herhangi birini değiştirdiğimizde hesapladığımız 6 fonksiyonu ciddi derecede değişir. Diğer yandan, turuncu “least squares” çizgisi ise göreceli olarak daha az esnektir ve dolayısıyla daha düşük varyansa sahiptir çünkü herhangi bir gözlemi değiştirdiğimizde bu değişiklik fonksiyonumuzda çok çok ufak bir değişikliğe neden olacaktır.

Taraflılık(bias) ise gerçek hayattaki bir problemi yaklaşık olarak olarak modellediğimizde modelimizin sebep olduğu hatadır. Bu hata seçtiğimiz model basitleştikçe artış gösterir. Örneğin, linear regression Y ve X1,X2, . . . , Xp arasında doğrusal bir ilişki olduğunu var sayar. Gerçek hayatta karşılaştığımız herhangi bir problemin böylesine basit bir doğrusal ilişkiye sahip olması çok az rastlanılan bir durumdur. Dolayısıyla linear regression 7‘i tahminlemede şüphesiz bir biçimde bir miktar taraflılığa sebep olacaktır. Örnek 3‘te gerçek 7 doğrusal değildir, bu yüzden ne kadar training verisine sahip olursak olalım linear regression kullanarak net bir tahmin yapmamız mümkün değil. Diğer bir deyişle linear regression bu örnekte yüksek taraflılığa sebep oluyor. Fakat Örnek 2‘de gerçek 7 doğrusala çok yakın ve dolayısıyla elimizde yeterince veri olduğunda linear regression kullanarak net bir tahmin elde etmemiz mümkün. Genel olarak, daha esnek metotlar daha az taraflılığa sebep olur.

Genel bir kural olarak, daha esnek metotlar kullandığımızda varyans artarken taraflılık azalacaktır. Test MSE değerinin artmasını ya da azalmasını belirleyen etmen bu iki miktarın göreceli değişimidir. Esnekliği artırdığımızda taraflılık en başlarda varyansın artış hızından daha hızlı bir şekilde düşecektir. Sonuç olarak beklenen test MSE değeri de düşecektir. Ancak, belirli bir noktadan sonra esnekliği artırmak taraflılık üzerinde çok düşük miktarda etki gösterecektir ve varyansı ciddi derecede artırmaya başlayacaktır. Bu olduğunda test MSE değeri artış gösterir. Bu olay yukarıdaki 3 örneğin sağ tarafındaki grafiklerde gösteriliyor.

8

Yukarıdaki görseldeki üç grafik 1.,2. ve 3. örneklerimiz için beklenen test MSE değeri denklemimiz için sonuçlarını gösteriyor. Mavi eğri çeşitli esneklik seviyeleri için karesel taraflılığı (squared-bias), turuncu eğri de varyansı gösteriyor. Kesikli yatay çizgi ise azaltılamaz hatayı5, gösteriyor. Kırmızı eğri ise bu üç miktarın toplamını yani beklenen test MSE değerini gösteriyor. Her üç örnekte de metodun esnekliği arttıkça varyans artıyor ve taraflılık azalıyor. Fakat, minimum test MSE değerine karşılık gelen esneklik seviyesi her örnek için ciddi derecede farklılık gösteriyor çünkü karesel taraflılık ve varyans hepsinde farklı hızlarlarla değişiklik gösteriyor. Soldaki grafikte en başlarda taraflılık varyansın değişim hızına kıyasla çok hızlı bir şekilde azalıyor ve dolayısıyla test MSE değerinde düşüşe sebep oluyor. Fakat ortadaki grafikte gerçek 7 doğrusala yakın olduğundan esneklik arttıkça taraflılıkta çok az bir azalmaya neden oluyor ve test MSE değeri çok az miktarda azalıyor ve sonrasında varyans arttığı için hızla artmaya başlıyor. Ve sağ taraftaki grafikte ise esneklik arttıkça taraflılıkta çok ciddi bir azalma oluyor çüknü gerçek 7 bu örnekte doğrusal olmaktan çok uzak. Ayrıca esneklik arttıkça varyansta da çok az bir artış gözlemleniyor. Sonuç olarak, test MSE değeri çok ciddi miktarda azalıyor ve belirli bir noktadan sonra çok az artış gösteriyor.

Bu durum taraflılık-varyans dengesi (bias-variance trade-off) olarak adlandırılıyor. Bir istatistiksel öğrenme metodunun düşük test MSE değeri üretebilmesi için hem düşük varyansa hem de düşük karesel taraflılığa sahip olması gerekiyor. Bu denge olarak ifade ediliyor çünkü son derece düşük taraflılığı olup son derece yüksek varyansa sahip bir metot veya tam tersini elde etmek kolay. Buradaki zorlayıcı nokta hem varyansı hem de karesel taraflılığı düşük olan bir metot bulmak.

Gerçek hayatta gerçek 7‘i genellikle bilmeyiz. Bu yüzden bir istatistiksel öğrenme metodunun test MSE değerini, taraflılığını ve varyansını hesaplamak çoğu zaman mümkün değildir. Yine de taraflılık-varyansa dengesini göz önünde bulundurmamız gerekiyor. Bunları nasıl hesaplayacağımıza dair metotları sonraki yazılarda ele alacağız.

Sınıflandırma (Classification) Olayı

Şimdiye kadar model netliğini tartışırken hep regresyona odaklandık. Fakat karşılaştığımız konseptlerin çoğu, mesela taraflılık-varyans dengesi, sınıflandırma metotları için de geçerli. Buradaki tek değişiklik tahmin etmeye çalıştığımız değişkenin artık sayısal bir değişken olmaması. Diyelim ki elimizdeki veri şöyle olsun: {(x1, y1), . . . , (xn, yn)} ve gerçek 7‘i hesaplamaya çalışalım. Burada y değişkeni kalitatiftir. Tahminimizin, 6, netliğini ölçmedeki en yaygın yaklaşım training hata oranıdır (training error rate) ve bu da tahmin ettiğimiz 6‘i training veri setine uyguladığımızda elde ettiğimiz hatalı tahminlerin tüm tahminlere oranıdır.

Capture

Üzerinde şapka olan y i.’ci gözlem için tahminimizi temsil ediyor. I fonksiyonu ise içindeki ifade doğru ise 1 değil ise 0 üretiyor. Dolayısıyla yukarıdaki fonksiyon bize yanlış sınıflandırılan gözlemlerin yüzdesini veriyor.

Burada da gene tahminimizin training veri seti üzerinde ne kadar iyi sonuçlar ürettiğinden ziyade test veri seti üzerinde ne kadar iyi sonuçlar ürettiğiyle ilgileniriz. İyi bir sınıflandırıcı(classifier) test MSE değeri minimum yapandır.

Bayes Sınıflandırıcısı (Bayes Classifier)

Test MSE değeri her bir gözlemi tahmin değişkenlerine bakarak en yüksek olasılıktaki sınıfa atayarak minimize edilir. Diğer bir deyişle x0 tahminleyici değişken vektörüne (yani X1,X2,…,Xp) sahip bir test gözlemini öyle bir j sınıfına atamalıyız ki

Pr(Y = j|X = x0)

değeri maksimum olsun. Bu ifade bir koşullu olasılık (conditional probability)‘dır ve şu şekilde ifade edilir: x0 verildiğinde Y’nin j’ye eşit olma olasılığı. Bu son derece basit sınıflandırıcı Bayes Sınıflandırıcısı(Bayes Classifier) olarak adlandırılır. Yalnızca iki sınıftan(sınıf1, sınıf2) oluşan problemlerde Bayes Sınıflandırıcısı bir gözlemi Pr(Y = 1|X = x0) > 0.5 ise birinci sınıfa değilse ikinci sınıfa atar.

9

Yukarıdaki grafik X1 ve X2 tahminleyici değişkenlerinden oluşan iki boyutlu bir uzaydaki bir örneği gösteriyor. Turuncu ve mavi halkalar iki farklı sınıfa ait olan training veri seti gözlemlerini gösteriyor. X1 ve X2‘nin her bir değeri için, cevap (response) değişkeninin turuncu veya mavi olma olasılığı farklılık gösteriyor. Bu örnek yapay olarak yaratıldığından verinin nasıl oluşturulduğunu biliyoruz ve X1 ve X2’nin her bir değeri için koşullu olasılık değerlerini hesaplayabiliyoruz. Turuncu alan Pr(Y = orange| X) > 0.5 olduğu alanı, mavi alan ise bu değerin 0.5’ten küçük olduğu alanı gösteriyor. Kesikli mor çizgi ise olasılığın tam olarak 0.5 olduğu yerleri gösteriyor. Bu çizgi Bayes Karar Sınırı (Bayes decision boundary) olarak adlandırılıyor. Bayes Sınıflandırıcısının tahminleri bu sınır tarafından belirleniyor: eğer bir gözlem bu çizginin turuncu tarafına düşerse turuncu sınıfa, mavi tarafında düşerse mavi sınıfa atanıyor.

Bayes Sınıflandırıcısı mümkün olabilecek en düşük test hata oranını üretiyor ve bu da Bayes hata oranı (Bayes error rate) olarak adlandırılıyor. Bu örnekte Bayes hata oranı 0.1304. Sıfırdan büyük çünkü sınıflar birbirleriyle bazı noktalarda çakışıyor. Bayes hata oranı regresyon ortamındaki azaltılamaz hataya denk geliyor. 

K-Nearest Neighbors

Teoride her zaman Bayes sınıflandırıcısını kullanmak isteriz. Ancak gerçek veriler için Y’nin X değerlerine bağlı koşullu olasılık dağılımını bilmeyiz; bu nedenle Bayes sınıflandırıcısını kullanmak imkansızdır. Bu yüzden, Bayes sınıflandırıcısı ulaşılamaz bir altın standarttır ve diğer metotlar bununla kıyaslanarak değerlendirilir. Y‘nin X‘e bağlı koşullu olasılık dağılımını hesaplamaya yönelik birçok yaklaşım var. Bunlardan biri de En Yakın K Komşu Sınıflandırıcısı(K-Nearest Neighbors or KNN)‘dır. Elimizde training ve test veri setleri olsun. Test verisetindeki bir gözlemin hangi sınıfa ait olacağını hesaplamak için KNN algoritması ilk olarak bu test gözlemine training veri setindeki  en yakın K gözlemi  (N0) bulur. Sonrasında bu en yakın K gözlemin sınıf dağılımını hesaplar.

10

Hesapladıktan sonra KNN sınıflandırıcısı Bayes kuralını uygular ve test gözlemini (x0) en yüksek olasılık değerine sahip sınıfa atar. 

11

Yukarıdaki görselle birlikte KNN metodunu açıklamaya çalışalım. Sol tarafta 6 mavi ve 6 turuncu gözlemden oluşan küçük bir training veri seti gösteriliyor. Amacımız x ile gösterilen gözlem için sınıf tahminlemek. Diyelim ki K değerini 3 olarak seçtik. KNN ilk olarak bu gözleme en yakın 3 gözlemi bulacaktır. En yakın üç gözlemden ikisi mavi biri ise turuncu sınıfa ait gözüküyor ve bu gözlem için tahminimiz 2/3 olasılıkla mavi sınıf 1/3 olasılıkla turuncu sınıf olarak hesaplanıyor. Dolayısıyla KNN bu gözlem için mavi sınıf tahminliyor. Sağ tarafta ise KNN metodunu K=3 ile mümkün olan bütün X1 ve X2 değerleri için uyguladık ve KNN karar sınırını (KNN decision boundary) belirledik.

Çok basit bir yöntem olmasına rağmen KNN şaşırtıcı bir şekilde çoğu zaman optimal Bayes Sınıflandırıcısına yakın sınıflandırıcı üretiyor.

Aşağıdaki figür KNN‘in K=10 ile 100 adet gözleme uygulandığında elde edilen karar sınırını gösteriyor. Gerçek dağılım KNN sınıflandırıcısı tarafından bilinmemesine rağmen, KNN karar sınırı Bayes karar sınırına çok yakın. Test  hata oranı KNN ile 0.1363. Bu oran Bayes hata oranı olan 0.1304’e son derece yakın!

K’nin seçimi KNN sınıflandırıcısı üzerinde son derece önemli etkilere sahip. Aşağıdaki görselde K = 1 ve K = 100 iken elde edilen KNN karar sınırını görebilirsiniz. K=1 iken karar sınırı son derece esnek ve Bayes karar sınırında olmayan bazı örüntüler bulmuş. Bu düşük taraflılığa fakat son derece yüksek varyansa sahip bir sınıflandırıcıya denk geliyor. K arttıkça, metot daha az esnek olmaya başlıyor ve doğrusala yakın karar sınırları üretmeye başlıyor. Bu düşük  varyanslı fakat yüksek taraflılıklı sınıflandırıcıya denk geliyor. 

12

Tıpkı regresyonda olduğu gibi, sınıflandırmada da training ve test hata oranları arasında güçlü bir ilişki yok.  K=1 olduğunda KNN training hata oranı 0 oluyor fakat test hata oranı oldukça fazla olabilir. Genel olarak, daha esnek sınıflandırma metotları kullandığımızda training hata oranı azalacaktır ancak test hata oranı azalmayabilir. Aşağıdaki figürde KNN test ve training hataları 1/K‘nin bir fonksiyonu olarak gösteriliyor.  1/K arttıkça yani K azaldıkça, metot daha çok esnekleşiyor. Regresyonda olduğu gibi, tranining hata oranı esneklik arttıkça hep azalıyor. Fakat test hata oranı gene U şeklini gösteriyor: en başta azalıyor(K=10 iken minimum oluyor) fakat belirli bir esneklik noktasından sonra tekrar artmaya başlıyor ve veriye aşırı uydurma (overfitting) gerçekleşiyor.

14

Hem regresyonda hem de sınıflandırmada, esneklik seviyesini doğru seçmek herhangi bir istatistiksel öğrenme metodunun başarısı için kritik derecede önemli. Taraflılık-varyans dengesi, ve bunun sonucunda oluşan U şeklinde test hata oranı bu seçimi zor bir işe dönüştürüyor. Test hata oranını hesaplamak ve optimum esneklik seviyesini seçmek için oluşturulan metotları ileriki yazılarda ayrıntılı olarak ele alacağız.

3 – Growth Hacking Süreci

Growth Hacker‘ın elinin altındaki spesifik taktiklere dalmadan önce bir GH‘nin sürecinden bahsetmek daha faydalı olabilir. Yetenekli GH‘lerin kendi şirketlerini büyütme çabasına giriştiklerinde akıllarından geçen olmazsa olmaz bazı adımlar var tabii ki, bilinçli veya bilinçsiz. Riskinizi kendiniz üstlenip bu listeyi görmezden gelebilirsiniz.

Eğer bu yazıdaki gibi checklist’lerden şüphe duyuyorsanız, Atul Gawande‘nin Checklist Manifesto adlı kitabını okumalısınız. Cerrahların bir “checklist”inin olmasının kesinlikle bir sebebi var. Aynı durum keza pilotlar için de geçerli. GH‘ler de “checklist”e ihtiyaç duyar. Bunlar bizi tamamen önlenebilecek aptalca ve pahalıya mal olan hatalar yapmaktan alı koyar.

01: EYLEME GEÇİRİLEBİLİR HEDEFLER TANIMLAYIN

Her şey eyleme geçirilebilir dar bir hedefe odaklanmakla başlar. Bu çok önemli çünkü bir GH çok geniş ve dolayısıyla manasız bir hedefe kendini kolayca kaptırabilir. Evet, ana hedef büyüme; fakat bu büyük hedefi ulaşılabilir küçük parçalara bölmezseniz ona asla ulaşamazsınız.

Diyelim ki bir ürününüz var ve siz de DAU(daily active users) sayınızı artırmak istiyorsun. Ne yazık ki bu çok geniş bir hedef. Sonra, var olan müşterileri elde tutmaya odaklanmaya karar verdiğiniz çünkü bu DAU’nuzu artıracak. Üzgünüm, hala hedefiniz çok geniş. Sonra, mevcut kullanıcılara kendi içeriklerini yaratmaları konusunda yardımcı olmaya odaklanmaya karar verdiniz çünkü fark ettiniz ki bir kullanıcı ürününüz içerisinde içerik üretici rolünü üstlendiğinde(yani sadece tüketici olmadığında) site üzerindeki aktiviteleri ciddi bir biçimde artış gösteriyor. İçerik üretimi kullanıcıyı elinizde tutmanıza yarıyor ve bu da DAU’nuzu artırıyor. Bu yüzden, hedefinizi içerik üretimini iki kat artırmak olarak belirlemeye karar verdiniz.

Çok Geniş: DAU’yu arttır.
Uygun: İçerik üretimini 2 kat arttır.

Çoğu insan hedeflerini yeterince daraltıp daraltamadığı konusunda zorluk çeker. Bunun için şu yöntemi kullanabilirsiniz: Hedeflerinizi, iç içe gömülü hiyerarşilerden oluşan bir bütün olarak düşünün. En içteki hedefi bulana kadar ilerlemeye devam edin. En içteki hedefe ulaştığınızda artık buradaki bütün görevleri bireysel görevler olarak tanımlayabilirsiniz. Bu durumda hiyerarşiniz şuna benzeyecek:

tablo

Şu durumda, “startup’ımı büyüt” hedefini yapılacaklar listenizden silebileceğiniz bir gün olması ihtimal dahilinde mi ? Hayır. Çünkü hedef çok geniş. DAU’nuzu artırmayı bitirdiğinizi söyleyebileceğiniz bir zaman gelecek mi ileride? Hayır. Çok geniş. Fakat, “üyeler email aracılığıyla içerik üretimi konusunda eğitildi” gibi bir hedefi tamamlandı olarak işaretleyebilirsiniz. Kendinizi hiyerarşinin tamamlandı olarak işaretlenebilecek bir noktasında bulduğunuzda hedefinizi uygun bir şekilde daraltmışsınız demektir.

02: HEDEFLERİNİZİ İZLEMEK İÇİN ANALİTİK İMPLEMENT EDİN

Buraya kadar içerik üretimini iki kat arttırmaya karar verdiniz. Sıradaki soru şu: bu hedefinize ulaşıp ulaşmadığınızı görebilecek bir pozisyonda mısınız? Uygun Analitik’leri yerleştirdiniz mi? İşte kendinize sorabileceğiniz birkaç soru:

  • İçerik üretimi metriğini mevcut olarak ölçümlüyor musunuz?
  • İçerik üretimini cohort bazında mı yoksa toplam olarak mı ölçümlüyorsunuz ?
  • İçerik hakkındaki metrikleri ölçümlüyor musunuz ? (dosya boyutu, uzunluk, görüntülenme sayısı, paylaşım sayısı, vb.)
  • İçerikleriğin hangi cihazlarda üretildiğini ve tüketildiğini ölçümlüyor musunuz? (Mobil, tablet, masaüstü, vb.)
  • İçerik üretiminden en çok sorumlu URL refer‘lerini ölçümlüyor musunuz?

Ve çok daha fazlası…

Analitik olmadan hedefler anlamsızdır. Eğer hedefinize ulaşıp ulaşmadığınızı kesin olarak söyleyemiyorsanız o zaman ilerlemeden önce zorunlu şartları tamamlamamışsınız demektir. Dahası Analitik size hedeflerinizi değiştirebileceğiniz değerli veriler sağlar. Analitik’iniz ve hedefleriniz, birbirini bilgilendiren, rafine eden ve şekillendiren karşılıklı bir denge yaratır.

Karşılıklı dengeye örnek olarak şunu düşünün. Hedefinizi “içerik üretimini iki kat artır” olarak belirleyip yola koyuldunuz fakat sonra müşterileri elde tutmayla ilgili bir şeyin bundan daha önemli ve kritik olduğunu fark ettiniz. Eğer yalnızca üç dakikanın üzerindeki içerikler içerik üreticisini ve tüketicisini(müşterisini) elde tutmanızı artıran içeriklerse, o zaman hedefinizi gözden geçirip değiştirebilirsiniz. (Üç dakikanın altındaki içerikleri dikkate almayarak hedefinizi yeniden tanımladınız.)

Hedeflerinizi izlemek için spesifik Analitik’ler implement etmenin güzel yanlarından biri de bunun, genel Analitik’iniz üzerindeki etkisidir. Bir hedeften başka bir hedefe atlaya atlaya birkaç yılınızı startup için harcadığınızda, üzerinde çalışmanız gereken tarihsel verinin çok güçlü ve etkili olduğunu fark edeceksiniz. Zamanla, yeni bir hedef yarattığınızda bununla ilgili metrikleri zaten çoktan ölçümlemeye başlamış olduğunuzu göreceksiniz. Artık bu hedefi yaratmanıza neyin sebep olduğuna dair araştırma yapabileceğiniz bir veriye sahipsiniz demektir.

Bütün GH‘ler kör bir baltayla işe başlar, zaman fonksiyonuna bağlı olarak balta gitgide keskinleşir. Sadece vazgeçmemeye çalışın.

03: KUVVETLİ YÖNLERİNİZDEN KAZANÇ SAĞLAYIN

Archimedes‘in şöyle bir lafı var:

“Bana yeterince uzun bir kaldıraç(sopa) ve altına koyabileceğim bir destek verin, dünyayı hareket ettireyim.”

Son derece doğru. Yeterince uzun bir sopayla çok ufak bir kuvvet uygulayarak çok ağır objeleri kaldırabilirsiniz. (Fizik 101: moment)

Her startup’ın kaldıraç(leverage) olarak kullanabileceği kuvvetli yönleri ve varlıkları vardır. Elinizin altında ufak bir efor gerektirecek fakat büyük sonuçlar üretebilecek bir şey varsa, o zaman bir “kaldıraç” buldunuz demektir.

Yukarıdaki örneğimize devam edecek olursak, ilk olarak eğitici email’ler göndermeniz gerektiğine mi yoksa “yeniler” (what’s new) diye bir kategori eklemeniz gerektiğine mi karar vermeye çalışıyor olabilirsiniz. Eğer elinizde 200 bin adet email ve çok sağlam bir email dağıtım sistemini varsa ve söz konusu email’leri aynı gün içinde oluşturabileceksiniz, o zaman bu gelecek vaat eden bir “kaldıraç” gibi gözüküyor.

Eğer “yeniler” (what’s new) kategorisi en az 2-3 gün planlama, 2-3 gün tasarım ve gözden geçirme ve 2-3 gün programlama gerektiriyorsa, ve mühendisleriniz yapılacaklar listesi yüzünden çoktan strese girmişse, “yeniler” kategorisini yaratmak gelecek vaat eden bir rota gibi gözükmüyor. Özellikle, kek bir yöntem bulmaya çalışıyorsanız.

Bu noktada kaldıraç kanunu esas olarak sizin yerinize karar alabilir. Mailleri gönderin. Startup’ınızın kendine has kaldıracı email listenizin büyüklüğünden ve email dağıtım sisteminizden gelmektedir, problemleri üzerine yıkabileceğiniz mühendislik beygir gücünüzün miktarından değil. Farklı startup’lar farklı opsiyonlar seçebilir, ancak kendi kaldıraçları farklı bir şekil alırsa.

Kaldıraçlara aldırış etmeden üst üste sıralanan planlar, hedefler, ve görevler genellikle yanlış sıralanırlar. Güçlü yönlerinize göre karşı saldırıya geçin. Bunları gelecek yazılarda daha ayrıntılı ele alacağız.

04: DENEYLER YAPIN

1.ci adımı çoktan tamamladınız ve hedefinizi “içerik üretimini iki katına çıkarmak” olarak belirlediniz. 2.ci adımı da tamamladınız ve artık hedefinize ulaşıp ulaşmadığınızı kontrol edebileceğiniz gerekli dataları izlemeye başladınız. 3.cü adımı da tamamladınız ve email’lerle üyelerinizi eğitmeye karar verdiniz, çünkü bu nokta kaldıracınızın olduğu nokta. Artık deneyler yürütmenin, yani gerçekten mail göndermenin vakti geldi. Deneyinizi yürütürken aklınızda bulundurmanız gereken bazı şeyler(not: bunu deney olarak adlandırıyoruz çünkü kimse gerçekten neler olacağını bilmiyor):

Deneyinizi Yürütmeden Önce Hipotenizi Bir Kenara Not Edin
Bir deneyi gerçekten yürütmeden önce neler olabileceğine dair en iyi tahminlerinizi bir kenara kaydetmelisiniz. Bu email’lerin hali hazırda gönderdiğiniz email’lerden daha mı fazla yoksa daha mı az CTR(click through rate) alacağını düşünüyorsunuz ? Bunu neden düşünüyorsunuz? Önümüzdeki bir ay içerisinde email’lerin içerik üretimini ne kadar artıracağını düşünüyorsunuz? Bunların tek başına, içerik üretimini iki katına çıkaracağını mı yoksa bunların yalnızca bu hedefe giden yolun bir parçası olduğunu mu düşünüyorsunuz?

Sadece email’leri gönderip ne olacağını görmek varken bu tarz şeyleri yazıp not almak salakça gözükebilir. Eğer tavrınız buysa, işin özünü kaçırıyorsunuz. Hipotezleriniz, size geçmişi yeniden yazma ve bu sayede kendinizi bir dahi olarak gösterme şansı verilmeden önce, var sayımlarınızın kesin birer yansımasıdır.

Örneğin, kullanıcılarınıza zaten haftada bir mail gönderdiğinizi ve ikinci bir maili gönderirseniz bundan rahatsız olacaklarını, dolayısıyla CTR’ın düşeceğini belirten bir hipotezi bir kenara not aldığınızı düşünün. Sonrasında deney yürüttünüz ve CTR’ların yükseldiğini gördünüz. Eğer ortada geçmişi yeniden yazma isteğinizi körükleyecek yanlış hipotenizin kanıtları yoksa, takımdaki diğer insanlara sizin startup dünyasına gönderilen ilahi bir kişi olduğunuzu ve bundan dolayı tam olarak beklediğiniz şeyin bu olduğunu söyleyebilirsiniz. Hipotezler sizi dürüst tutar. Şimdi, herkese ne kadar zeki olduğunuzu kanıtlamaya çalışmak yerine, neden var sayımlarınızın yanlış olduğu hakkında tartışabilirsiniz. Belki de sizinle iletişimde olmak isteyen kullanıcılarınızın sayısını azımsadığınızı fark ettiniz, ve bu iç görü email’in çok daha ötesine giden faydalara sahip.

Eğer hipotez oluşturma olayı bu işi bir bilimmiş gibi hissettiriyorsa, bu büyük ihtimalle güzel bir şeydir.

Deneyi Yürütmek İçin ihtiyaç Duyduğunuz Kaynaklar Hakkında Acemi Olmayın
Ne zaman bir deney yürütseniz, bu startup’ınızın normal olay akışını sarsıp, bozar. Önce, gerçekleşebilecek herhangi bir aksaklık, talihsizlik, terslik veya kazaya hazır olabilmeleri için tüm takımınızı deneyden haberdar etmelisiniz. İkinci olarak, startup’ınızın hali hazırla kaynakları zorluyorsa bunun farkında olun ve deneylerinizi planlarken bunu göz önünde bulundurun. Eğer Salı günleri sunucularınızın halihazırda arıza çıkarmanın eşiğinde olduğu bir günse, o gün %30 daha fazla trafik çekmenize sebep olacak bir şey yapmaktan mümkün olduğunca kaçının. Üçüncü olarak, eğer deneyi yürütmeden önce deneyin bileşenlerini tamamlamak için belirli bir süreye ihtiyacınız varsa, ihtiyaç duyulan zaman gereksinimlerini gözünüzden kaçırmayın. Hofstadter Kanunu’nu hatırlayarak kendinizi iyi hissedebilirsiniz:

Hofstadter Kanunu:
“İşler her zaman beklediğinizden daha fazla zaman alır, Hofstadter Kanunu’nu hesaba kattığınızda bile.”

İlk Sonuçlar Yüzünden Yılmayın

Hayatımda sayısız kez deneyimlediğimiz bir fenomen var: şuanda üzerinde çalıştığım deneyler her şeyi daha iyiye götürecek. Şuanda kendimi adadığım deneyler şirketimin problemlerine net cevaplar üretecek gibi gözüküyor. Eğer bu zamanımı çalmaya yetecek kadar önemliyse, o zaman bu kaçış hızına erişmemizi sağlayacak şey olmalı.

Daha önceki yazılarda da belirttiğim gibi birçok şey başarısız olur. İyimser olmak gayet normal fakat deneyler vasat sonuçlar ürettiğinde her seferinde yıkıma uğrayamazsınız. Bu sebeptendir ki tanımlanmış bir hedef birçok farklı açıdan saldırıya tabii tutulmalıdır. Atakların çoğu ne yazık ki işe yaramayacak.

Başarıdan ve Yenilgiden Bir Şeyler Öğrenin
Bir deneyiniz başarısız olduysa bile şüphesiz ki gelecek deneylerde kullanılmak üzere kullanıcılarınız ve ürününüz hakkında birçok bilgi elde ettiniz. Edison lambasını üretmeye çalışırken binden fazla kere yanılmıştı. Bunun hakkında kendisine sorulduğunda iddiaya göre şöyle demiş: “1000 kere başarısızlığa uğramadım. Neyin bir lamba yaratmayacağını 1000 kere başarılı bir şekilde keşfettim.” Başarılardan öğrenebilirsiniz, hatalardan da öğrenebilirsiniz. Sadece vaz geçtiğiniz an öğrenmeyi bırakmış olursunuz.

05: DENEYİNİZİ OPTİMİZE EDİN

Deneyler optimize edilmek içindir. Deneyler akıcıdır. Bunlar, bir kere yapıp yolunuza devam edeceğiniz şeyler değildir. Deneylerinizi yeniden düzenlersiniz, yeniden yaparsınız; yalnızca bunu yapmanız uygun olduğunda deneyden vazgeçersiniz, onlardan yorulduğunuzda değil.

Kontrol Grubu Belirleyin
Mümkünse her zaman kontrol grubunuz olmalı çünkü bu grup gözlemlenmesi zor olan çevresel değişikliklere açıklama getirebilir. Eğer emailleri kullanıcılarınızın sadece %80’ine yollarsanız, yollamadığınız %20’lik grupla bu grubu karşılaştırarak içerik üretiminin nasıl değiştiğini gözlemleyebilirsiniz. Daha önceden öngöremeyeceğiniz; sitenizdeki içerik üretiminde geniş çaplı bir düşüşe sebep olabilecek, şirketinizin kontrolü ya da bilgisi dışında gelişen bir olay olabilir. Kontrol grubunuz olmadan, gerçekle uzaktan yakından alakası olmamasına rağmen, email stratejinizin içerik üretimini düşürdüğü sonucuna varabilirsiniz. Aşağıdaki tabloya bakın. Kontrol grubunuz olmadan içerik üretiminin email stratejiniz yüzünden herkes için %10 düştüğünü düşünebilirsiniz(aslında %5 yükselmesine rağmen).

pint

A/B TESTTEN FAYDALANIN
GH
‘ler A/B Test‘lerini(ey-bi diye okunur hep) her zaman çok severler çünkü bu testler resmen büyülüdür. Email’lerinizin açılması için “konu” kısmında ne yazması gerektiğini bildiğinizi düşünüyor olabilirsiniz, fakat size gerçeği söyleyecek olan A/B Test’tir. Email’lerinizde, alıcıların açıp içerik üretmeye başlaması için hangi “karşılama sayfası”(landing page)’nın linki olması gerektiğini bildiğinizi düşünüyor olabilirsiniz, fakat gene size gerçeği söyleyecek olan A/B Test’tir.

Hatırlayın, eğer A/B Test yapmayı planlıyorsanız o zaman bunu bir deneye başlamadan önce kararlaştırmanız gerekiyor. Diğer türlü, bu örnekte olduğu gibi, email’lerinizi herkese gönderecektiniz ve sonra email göndermediğiniz insan olmadığı için asla etkisinin ne olacağını ölçemeyecektiniz.

Bir Deneyden Vazgeçtiğinizde
Ben genellikle “kaldıra甑ımın en başta düşündüğümden daha zayıf olduğu kanıtlanana dek asla bir deneyden vazgeçmem. Zaten mantıksal olarak, aşırı miktarda kaynak harcanmamış bir deneyin daha iyi sonuçlar üretebileceğini düşünemiyorum.

06: REPEAT

Şimdi yeni bir deney ya da daha önceki bir deneyin optimize edilmiş versiyonunu seçmenin vakti geldi. Bu adımların üzerinden tekrar gidin. Eğer buradaki adımları uygularsanız, başarı uygulamanızın bir yan ürünü olacaktır, şans ürünü değil.

BU YAZININ ÖZETİ

Adım 1: Eyleme geçirilebilir hedefler tanımlayın

Adım 2: Hedeflerinizi gözlemlemek için Analitik implement edin

Adım 3: Mevcut güçlerinizden faydalanın

Adım 4: Deney yürütün

Adım 5: Deneyinizi optimize edin

Adım 6: Tekrarlayın

2 – Bir Growth Hacker’ın Profili

EFSANE 01: GROWTH HACKER OLMAK İÇİN YAZILIMCI OLMAK ZORUNDASIN

Udemy‘nin kurucu ortaklarından ve aynı zamanda bir Growth Hacker olan Gagan Biyani diyorki: “Growth hacking’in webdeki bir çok tanımı gereksiz derecede kısıtlayıcı. Growth hacker‘ların tipik bir mühendis olması gerektiğine inanmıyorum, aksine saygı değer Growth Hacker‘ların çoğu gerçekten kod yazmaz.”

Aslında yapılan bu yanlış tanımlamalar makul görülebilir çünkü birçok growth hacking hedefine ulaşmak için kodlamaya bağımlı olunmak zorundadır, fakat bu basitçe bir growth hacker‘ın programcı olması gerektiği anlamına gelmez. Bir GH genellikle kendi takımı içerisinde bir programcıya ihtiyaç duyar, kendisi programcı olmak zorunda değildir. Aşağıdaki hikaye bu duruma bir örnektir:

Bir GH 3 kişilik küçük bir startup’a sahip: kendisi, bir front-end geliştirici ve bir de back-end geliştirici. Takım daha yeni kuruldu ve henüz herhangi bir growth hacking işlemi gerçekleştirmediler. Bu iki geliştirici büyüme hakkında gerçekten çok fazla düşünmediler. Büyümenin önemli olduğunu biliyorlar, ve öğrenme konusunda da gerçekten heyecanlı ve istekliler, fakat şimdiye kadar daha önceden hiçbir büyüme takımının içinde yer almamışlardı. Takım ilk kez bir araya geldi ve GH takımdaki diğer elemanlara etkinlik bazlı analiz(event-based analytics) hakkında bilgiler verdi ve bunların neden önemli olduğunu açıkladı. Daha sonra GH ürün üzerindeki hangi etkinlikleri(event) izlemek(track) istediğine dair bir liste verdi(kayıtlar, yönlendirmeler, etkileşimler, vs) ve bunu gerçekleştirmeleri için onlara kendi seçtiği bir araç olan KISSmetrics‘i gösterdi. KISSmetrics üzerinde istenilen etkinlikleri nasıl izleyebilecekleri konusunda yardımcı olacak dokümantasyonları nerede bulabileceklerini de söyledi ve geliştiricileri kodu implement etmeleri için yalnız bıraktı.

Aradan birkaç hafta geçti ve GH, takımı toplanmaya çağırdı. KISSmetrics içerisinde bir funnel(dönüşüm tüneli) oluşturmak için elde ettikleri dataları kullandı. Onlara bir funnel’ı neyin iyi yaptığını öğretti ve dönüştürme işleminin her bir adımında neleri hedeflediklerini açıkladı. Takım şuna odaklandı: Tekil ziyaretçilerin(unique visitor) siteye kayıt olma dönüşüm oranlarını(signup conversion rates) artırmak. GH‘nin hipotezi şuydu ki siteye gelen insanlar copywriting yeterince anlaşılır ya da beklendiği kadar güçlü olmadığı için siteye kayıt olmadan uçuyorlardı(bounce). Bu yüzden GH yeni bir copywriting yarattı ve front-end geliştirici de bunu sitede daha güzel gözükecek bir biçimde yeniden yayınladı. Dönüşüm oranları funnel’in bu adımında %7 oranında arttı.

Bu takım bir bütün olarak growth hacking’den sorumludur, fakat kendinize şu soruyu sorun: Bu üç elemandan hangisi büyümeyi gerçek bir olasılığa dönüştüren yakıt görevindeydi ? Tek başına mühendisler dönüşümü %7 oranında artıramazlardı. Tabii ki de, bazı programcılar bu hikayedeki her şeyi yapabilir, fakat anlatmaya çalıştığım mesele bu değil. Bu hikaye GH‘nin yazılımcı olmak zorunda olmadığına dair bir hikaye.


EFSANE 02: GELENEKSEK PAZARLAMACILAR GROWTH HACKER OLAMAZ

Growth hacking kötü bir biçimde bir çeşit dine dönüştü ve pazarlamacılar da bu dinle müttefik olmak yerine buna karşıt olarak algılanıyorlar. Aksine, bir GH aktivitelerini sadece büyümeye kısıtlamış ve odaklamış bir pazarlamacıdır aslında. Evet, bu odaklanma zaman geçtikçe pazarlamaya daha az benzeyen bir alt kültürün oluşmasına sebep oldu, fakat ikisinin kökeni tamamen birbirine karşıt değil.

Yukarıdaki bir GH ve iki mühendisin hikayesini düşünün. Geleneksel pazarlamacılar becerileri arasında genellikle copywriting’e sahiptir. Dolayısıyla bu konu hakkında hiçbir bilgisi olmayan birine göre daha avantajlıdırlar. Yukarıdaki örnekte, eğer bir pazarlamacı copywriting becerilerini bir kenara bırakıp odak alanını yalnızca büyümeye endeksleseydi ve copywriting değişiminden kaynaklanan gelişmeleri izleyebilmek gayesiyle çeşitli cohort grupları(birbirine benzer özelliklere sahip insanların oluşturduğu gruplar, örneğin yaş, doğum günü, cinsiyet, ya da herhangi bir karakteristik) için funnel analizi yapabilmek amacıyla olay tabanlı analizler implement etseydi, o zaman growth hacking yapmış olacaktı. Yeterince güçlü analitik ve teknik bir kafaya sahiplerse ve gerçekten bunu istiyorlarsa, geleneksel pazarlamacılar bir GH olmaya en hazır insanlardır(popülasyonun diğer kısımlarına oranla).

Hatta, Sean Ellis, growth hacking’in fikir babası, kendini Dropbox’daki ilk pazarlamacı olarak adlandırıyordu. Pazarlamacı, henüz ortada kendi işini tanımlayan başka bir ünvan yokken, kendisiyle ilişkilendirilen ünvandı. Bugün iş dünyasında yer alan en iyi GH‘lerin çoğu ünvan olarak CMO(Chief Marketing Officer) ya da VP of Marketing ünvanlarını kullanıyorlar. Gitgide birçok şirket Growth Lead, VP of Growth hatta Growth Hacker ünvanını kullanmaya başlıyor, fakat bu insanlar eskiden pazarlamacı olarak adlandırılıyorlardı. Bu yüzden, GH‘ler olarak kökenlerimizi unutmamamız gerekiyor.


EFSANE 03: GROWTH HACKER OLABİLMEK İÇİN ETİK DIŞINA ÇIKMALISIN

Ne zaman odağınızı tek bir hedefe endeklerseniz (bu durumda büyüme), o  zaman başkalarının yararına olmayan kararlar alma riskini göze alırsınız. Her GH bu sınırı bir yerde çizmeli, ve ne yazık ki diğer disiplinler gibi growth hacking de kötü aktörlere sahip.

Path, kendi kullanıcılarının telefon listelerini ele geçirmek amacıyla uyguladığı agresif yöntemler ve elde ettikleri listelerdeki kişilere gönderdikleri mesajlar yüzünden işi azıttığı için suçlanmıştı. Çoğu insan Path’in çizmeyi aştığını düşündü. Bu doğru olabilir, fakat AirBNB’nin aynı şekilde ölçüyü kaçırdığını düşünmek yanlış olur çünkü başkalarına hizmet verdikleri gibi kendilerine de hizmet veriyorlardı. Craigslist, AirBNB’nin bu aksiyonunu engelleyecek karşı önlemleri istediği zaman alabilirdi. Path kullanıcıları kendi isimlerine gelen spamları iptal edemezdi.

Fakat asıl nokta şu ki birçok GH kendisine neyin etik olduğunu sormak zorunda bile değildir. Onlar, dönüşüm oranlarını artıracak zararsız ürün özellikleri inşa ediyorlar, ve bu ürünleri halka kendi bildikleri dağıtım kanalları aracılığıyla yayıyorlar. Bu zekice; etik dışı değil. Her GH Jedi mi yoksa Sith mi olması gerektiğine karar vermek zorundadır.


GERÇEK 01: GROWTH HACKER’LAR AŞIRI DERECEDE ANALİTİK KAFALIDIRLAR

Tamam, bir GH‘nin ne olmadığı konusunu paylaştık yukarıda, şimdi sırada GH‘nin ne olduğunu konuşmakta. Bir GH‘nin ,özgeçmişi ne olursa olsun, temel özelliklerinden biri tabiri caizse analitik aşkı, bağımlılığı ve anlayışıdır.

Analitik, GH‘nin damarlarından akan kan gibidir adeta. Neredeyse yaptıkları her şey ön planda ya da arka planda analitik bir elemente sahiptir. Analitik olmadan, bir GH kendini çıplak hisseder. GH‘nin analitiği nasıl kullandığına dair birkaç örneği aşağıda bulabilirsiniz:

Analitik Growth Hacker’ı Dürüst Tutar

       pngUzunca bir süredir pazarlama dünyası hislerin ve duyguların yeri oldu. Herhangi bir billboard‘un ROI‘si nedir ? Kim bilir. Ama “cool” gözüküyorlar değil mi ? Çoktan devir değişti. Artık herhangi bir toplantıda ne kadar karizmatik olduğunuzun, fikirlerinizin ne kadar güçlü gözüktüğünün, ya da üst yönetimden kaç kişinin bir kampanyayı onayladığının bir önemi yok. Analitik ne kadar akıllı ya da deli olduğunuzu ortaya çıkaracak.

Bu durumu örnekleyen çok güzel bir olay var. Dan McKinley, Etsy‘deki baş mühendislerden biri, kendilerinin sonsuz kaydırma çubuğu(scroll) fiyaskosunu anlatıyor. Beş ay boyunca üzerinde çalıştıkları Etsy ürünleri için sonsuz kaydırma çubuğu özelliğini sonunda yayınlıyorlar. Böylece sitede arama yapan bir kullanıcının karşını bir liste geliyor ve sayfada aşağı doğru hareket ettiği zaman(scroll) yeni sonuçlar beliriyor ve liste bu şekilde uzayıp gidiyor(infinite). Tabii ki de ilk önce bu olayı kutluyorlar. Çak bir beşlik yapıyorlar adeta. Tipik. Ve sonrasında dört gözle bekledikleri sayılar(veriler) nihayet geliyor ve görüyorlar ki insanlar daha az ürün almaya başlamışlar. Söylemeye gerek bile yok ki sonsuz kaydırma özelliğinden anında kurtuluyorlar. Kullanıcıların gerçekten böyle bir şey isteyip istemediğine dair ellerinde somut bir veri yokken sadece kendi varsayımlarıyla yola çıkarak ürettikleri bu özellik aslında kullanıcılar tarafından hiç de hoş karşılanmamıştı. Aşağıda Dan’ın bu konudaki konuşmasından alınma iki tane slayt mevcut. “Hot” yeterli değil.

Analitik Growth Hacker’ın Odağını Yönlendirir

22Ürününüzü ve aktivitelerinizi izleyen bir sisteminiz olduğunda, sayılar odağınızı öngörülemeyecek bir biçimde yönlendirebilir. Yönlendirme döngünüz(referral loop) üzerinde daha fazla kaynak harcamayı asla hayal edemezdiniz. Sadece ne olacağını görmek için ürüne koyduğunuz yeni bir özellik çöpe gidebilirdi. Sonra, verinin içine daldınız ve fark ettiniz ki yeni kayıtların %20’den biraz daha fazlası bu döngüden geliyor ve bu döngüden gelen kullanıcıların CLV(customer lifetime value)‘leri ortalama bir kullanıcıdan daha yüksek. Bu döngüyü daha verimli yapabileceğinizi biliyorsunuz, bu yüzden takımınızın odağını takip eden iki hafta boyunca bu özelliğe endeksliyorsunuz. Analitik, yapılacaklar listenizi önem sırasına göre yeniden düzenlemenize ilginç bir şekilde yardımcı oluyor.

Analitik Başarıyı Tekrarlanabilir Kılar

33Analitiği ciddiye almadığınızda geçmiş başarılarınızı tekrar edemezsiniz. Eğer bildikleriniz sadece şirketin 4. çeyrekte, 3. çeyrektekinden daha fazla para yaptığıysa hiçbir şey bilmiyorsunuz demektir. 4. çeyrek neden daha iyiydi ? Ürününüze kayıt olan daha çok kullanıcı mı vardı, yoksa kayıt olanların daha fazla bir kısmını mı satın alan kullanıcılara dönüştürdünüz ? Son zamanlarda yapılan yeni bir dizayn sayesinde kullanılmaya başlanan yeni bir özellik mi vardı ? Peki ya tıklama başına bedel(cost per click)‘leri çok arttığı için Google reklamlarından vazgeçen bir rakibiniz yüzünde Google AdWords kampanyalarınız pozitif bir ROI sağlamaya mı başladı ? Eğer bu başarınızın arkasındaki temel öğeleri bilirseniz, işe yarayan bu öğeleri kullanarak başarınızı tekrar edebilirsiniz.( ya da işe yaramayan şeylere son verebilirsiniz)

Analitik Growth Hacker için Geleceği Tahmin Eder

44Şirketler gelecek hakkında bir sürü bahse giriyorlar. Rekabetin neler yapacağını tahmin etmeye çalışıyorlar. Pazar’ın ne isteyeceğini öngörmeye çabalıyorlar. Dürüst olmak gerekirse gelecek her zaman bir ölçüde tahmindir tabii ki, fakat analitiğe dayalı tümevarımsal usavurma(o ne lan?) dünün verilerine bakarak yarın hakkında daha akıllı kararlar almamızı sağlar.

Yarın Güneş doğacak mı ? Teknik olarak, tümden gelim yöntemiyle bu soruyu cevaplayamayız, fakat tümevarım yöntemiyle akıl yürütebiliriz. Buna göre Güneş yarın da doğacaktır çünkü şimdiye kadar hep doğmuştur. Grafiklerinize baktığınızda belirli bir yöne doğru ilerleyen bir trend görüyorsanız bu trendin aynı yönde ve aynı şekilde ilerleyeceğine dair hiçbir garantiniz yok. Diğer faktörler sabit kalırsa, büyük ihtimalle aynı yönde ilerlemeye devam edecektir. Bu tam olarak bir bilim olmasa da akıldan tahmin etmekten kesinlikle daha iyi bir yöntem.

Bu noktada önemli olan iki konsept var: ilişki(correlation) ve nedensellik(causation). Eğer Analitiğiniz A ve B diye iki değişkenin benzer rota çizdiğini gösteriyorsa o zaman bu bilgi bu değişkenlerin gidişatını değiştirmek için kullanılabilir. Deneyler yaparak birinin diğerine sebep mi olduğunu yoksa aralarında sadece bir ilişki mi olduğunu ayrımını saptayabilirsiniz. Bir GH bir nedenselliği açığa çıkardığında, ki çoğunlukla Analitik yardımıyla fark edilir, elinin altında çok güçlü bir silah elde etmiş olur.


GERÇEK 02: GROWTH HACKER’LAR T-ŞEKİLLİDİR.

Konu GH‘nin sahip olduğu becerilere geldiğinde, büyük T harfi gibi şekillenmeleri gerekir. Demek istediğim şu: harfin üstündeki yatay çizgi GH‘nin aşina olması gereken her çeşit beceri ve disiplini temsil ediyor. Bir sürü farklı alan hakkında en azından bir şey bilmeniz gerekiyor. Birazcık psikoloji bilmeniz gerekiyor. Viral döngülerden birazcık anlamanız gerekiyor. Birazcık “drip email” kampanyaları hakkında bilgi sahibi olmanız gerekiyor. …… hakkında biraz bilgi sahibi olmanız gerekiyor… pekala, ne demek istediğimi anladınız. Bu yazı dizisi içerisindeki kavramlardan duymadığınız tek bir kavramın bile kalmaması gerekiyor.

Fakat ne yazık ki bu yeterli değil. T harfinin dik çizgisini temsil eden birkaç beceri setine de sahip olmanız gerekiyor. Bu beceriler dominant olduğunuz beceriler olmalı. Bu alanlarda uzman olmalısınız. Derine inmelisiniz. Onboarding hakkında belki de her şeyi biliyorsunuzdur, ve ürününüze kayıt olan kullanıcıların %85’i müşteri kaybetme oranınızı düşüren MHX(must have experience)’i deneyimliyordur. Bu bir çok hatayı telafi edebilir. Eğer funnel’ın herhangi bir parçasını alarak o parçayı dramatik bir biçimde daha verimli bir hale getirirseniz, o zaman etrafında büyümeyi başlayabileceğiniz bir şeye sahip olmuş olursunuz.

Profesyoneli diğerlerinden ayıran nokta şu: profesyoneller T şeklinden memnun değillerdir. Profesyoneller V şeklini isterler. Giderek daha fazla disiplinde ustalaştıklarında engin bilgilerini temsil eden bir veya iki tane dikey çizgiye sahip olmazlar. 10-20 tane çizgiye sahip olurlar. Bu da V şeklini yaratır.

Growth hacking gizemli gibi gözüküyor, fakat gerçekten pek bir gizemi yok. Bir GH bir sihirbazdan daha az gizemlidir ve daha ziyada maratoncuya benzer. Burada alavere dalavere yoktur, onun yerine büyümeye has yeteneklerde uzmanlaşmak için çok çalışma vardır. Maratonu bitirmek istiyorsanız aylar öncesinden hazırlık yapmanız gerekiyor. Daha da ötesi,  adam akıllı idman yapmalısınız. Aynı şekilde, eğer bir ürünü büyütmek istiyorsanız önce T, sonra V, kim bilir belki de sonra U şekline bürünmek zorundasınız ve bunu da aylar süren çalışmalar sonunda elde edebilirsiniz. Maratonu bitirmenin ya da ürünü büyütmenin herhangi bir kısa yolu yok.


GERÇEK 03: GROWTH HACKER’LAR DA SAĞ BEYİNLİDİR

GH‘ler Analitik hakkında o kadar çok konuşurlar ki sağ-beyinli olduklarını unutmak çok kolaydır. Analitiğin aşırı derecede önemli olduğu kadar meraka, yaratıcılığa, anekdotsal kanıta ve nitel gerçeklere olan düşkünlük de en az o kadar önemli. Eğer Analitik ve anekdot arasında seçim yapmak zorunda kalsaydım Analitiği seçerdim. Neyse ki böyle bir seçim yapmak zorunda değilim, ve böyle yanlış bir seçim yapmaya da hiç gerek yok zaten. Ürünlerin uçan makinelere benzetecek olursak uçmaları için hayal gücü ve pozitif bilimin doğru miktarda karıştırılması gerekir. İki yönde de aşırıya kaçıp hataya düşmeyin.

Fazla Merak Kediyi Öldürür, Fakat…

55Meraksızlık ürününüzü öldürür. GH yeni fikirler üretmeye ve yeni şeyler denemeye heveslidir. Eğer bütün prosedürleri daha önceden belirlenmiş ve yapmanız gereken tek şeyin bu prosedürleri takip etmek olan bir iş istiyorsanız orta seviye bir yönetici olun. Eğer emirlere uymak istiyorsanız, orduya katılın. Eğer bir ürünü büyütmek istiyorsanız, meraklı olun. Belki aklınıza gelen bir şey şu zamana kadar hiç denenmedi çünkü çok saçma gözüküyor, belki de bu zamana kadar hiç denenmedi çünkü kimse sizin kadar meraklı olup gerçekten bu fikrin işe yarayabileceğini fark edemedi. Aşağıda merakla ilgili bazı örnekleri bulabilirsiniz:

  • Her hafta, kullanıcılarımıza, hesaplarının deaktif olmalarını sonsuza kadar engelleyecek ne gibi aksiyonlar aldırabiliriz ?
  • Eğer kullanıcılarımızın, fiyatları kendilerinin belirlemesine(bedava dahil) izin verirsek ne olur?
  • Eğer ana sayfamızı her ayın birinde içinde bulunduğumuz endüstrinin kahramanlarından birine saygımızı ve sevgimizi gösterecek şekilde tasarlarsak ve bunun da kullanıcılar tarafından kolay paylaşılabilir olmasını sağlarsak ne olur ?
  • Eğer sitemizdeki bütün hata kodlarını klasik kült filmlerden meşhur alıntılar yaparak yeniden yazarsak ne olur ?
  • Eğer bir müşteri, müşteri servisi talebinde bulunduğu zaman o konuyla ilgili YouTube’dan derlenen harika videolardan oluşan bir “drip email” kampanyası tetiklense ve müşteriye yollansa ne olur ?

Bu fikirlerin hepsi aptalca mı ? Birçoğu büyük ihtimalle aptalca. Neden aklınıza gelen aptalca fikirleri hiç kimsenin okuyamayacağı bir metin dosyasına yazmaktan korkasınız? Merak, korkunun üstesinden gelmeye yarayan bir fonksiyondur. Yanlış olma korkusunun. Doğru olma korkusunun. Farklı olma korkusunun. Eğer gerçekten kötü fikirler hakkında düşünecek cesaretiniz yoksa, asla parlak olanlardan bir tanesini uygulama şansınız olmayacak.

Yumuşak, Geçici, Kabarık Şeyler Düşmanınız Değil

66Mantıkçılar ve matematikçiler “binary” dünyasında yaşamaya can atıyorlar. Her şey evet veya hayır olabilir. Veri açık ve temiz olabilir. Plan aşikar olabilir. Fakat ne yazık ki, birçok sorunun cevabının “belki” ve “bir nevi” gibi belirsiz cevaplar olduğu gri bir dünyada yaşıyoruz. Bir GH bunu asla unutmamalı.

Veriler, “checkout” akışında ikinci ekrandan üçüncü ekrana geçişte dönüşümde düşüş yaşandığını gösteriyor olabilir. Saatlerce sayılara bakabilir ve içlerinde kaybolabilirsiniz, ya da en yakın Starbucks’a gidip tamamen yabancı birine kredi kartınızı vererek sitenizde checkout yapmasını isteyebilirsiniz. İddiaya girerim ki bundan kesin bir şey öğrenirdiniz. Bir kişi kesinlikle istatistiksel bir çıkarım yapmak için yeteri kadar büyük bir örnekleme(sample) teşkil etmiyor, fakat bazı problemleri görmek için dağlar kadar veriye de ihtiyacınız yok. Starbucks’ta kredi kartınızı verip checkout yapmasını rica ettiğiniz kişinin checkout yapmaya çalışırken “CVV”‘nin ne demek olduğu hakkında bilgi vermediğiniz için zorlandığını ve bu alana ne yazması gerektiği hakkında hiçbir bilgisi olmadığı için tıkanıp kaldığını fark edebilirsiniz. Sitenize bu durumu düzeltecek bilgi verici bir açıklama koymak için ne kadar veriye ihtiyacınız oldu ? Bazen tek bir anekdot yeterlidir.


GERÇEKLER 04: GROWTH HACKER’LAR TAKINTILIDIR

Mütemadiyen büyüme hakkında düşünmenin ne demek olduğunu biliyor musunuz ? Eminim, bir hafta gibi kısa bir süre için eğlenceli olabilir. peki ya altı aylık bir süreçte o kadar eğlenceli olabilir mi ? Diğer her şeyi unutarak yakın gelecek için odağınızı sadece büyümeye endeksleyebilecek kapasiteye sahip misiniz ?

İşe Yarayan Taktik Büyük İhtimalle 213.cü taktik olacak, 7.ci taktik değil.

77Eğer growth hacking sadece 5 ya da 10 tane şey deneyip kullanıcı kayıtlarını ve akan paraları izlemek olsaydı, bu kadar literatüre ihtiyaç olmazdı. Gerçek şu ki growth hacking ürününüz için çalışan şeyleri bulduğunuz an kolay gözükmeye başlıyor. O şeyleri bulana kadar yüzlerce fikir batırmalısınız.

Yeteri Kadar Kağıt Kesiğiyle Rakiplerinizi Öldürebilirsiniz

88İnsanlar zaman zaman şu varsayımda bulunuyor: kazanmak için ihtiyacınız olan tek şey büyük bir buluş. Pazarınıza sahip olmak için büyük bir growth hack olabilir bu. Benim düşüncem şu ki, büyük bir kesik(büyük bir buluş) yerine küçük küçük kesiklerle rakiplerinizi öldürebilirsiniz(saf dışı bırakmayı kast ediyorum tabii ki de).

Küçük başarılar zamanla katlanarak büyük. Eğer sonuna kadar aynı şekilde dayanırsanız ve her geçen gün sayılarınızı daha da iyileştirmeyi becerirseniz hedeflediğini sonuçları elde edebilirsiniz.


BU YAZININ ÖZETİ

  • GH olmak için yazılımcı olmak zorunda değilsiniz.
  • Geleneksel pazarlamacılar odaklarını daraltıp, yetenek setlerini derinleştirirse GH olabilirler.
  • Birçok GH etik canavarı değildir.
  • GH‘ler ciddi ölçüde Analitiğe bel bağlarlar.
  • GH‘ler birçok farklı alanda bilgi ve hüner sahibidirler, fakat işlerini verimli bir şekilde yapabilmek için bunlardan bazılarında uzmanlaşmaları gerekir.
  • Analitiğe olan bağlarına rağmen GH‘ler sağ beyinlerini de kullanırlar. Sağ beyin tarafından temsil edilen yaratıcılık, merak ve nitel araştırmalara zaman zaman ihtiyaç duyarlar.
  • GH‘ler büyüme konusunda takıntılıdır. Bu, onların işe yarayan taktikleri keşfedene kadar inat etmelerine sebebiyet verir, ve elde ettikleri küçük başarılarla zaman geçtikçe ürünlerini ileriye götürmelerine olanak tanır.

NOT: Bu yazı sizi çıldırtacak derecede teknik terim ve İngilizce terim içeriyor olabilir. Şimdilik bu terimleri bilmenize gerek yok. İleriki yazılarda bu terimler ayrıntılı olarak ele alınacaktır. Bu noktada önemli olan büyük resmi görmeniz, ayrıntıları şimdilik sallayı verin gitsin.

1 – Growth Hacking mi dedin ? O da neyin nesi ?

Öncelikle isminden dolayı çok yanlış anlaşılmaya müsait bir terim olduğunu belirterek başlamak istiyorum. Öyle hacker’lıkla, coder’lıkla işimiz falan yok(bilmeniz avantaj ama mecburiyet değil), bırakın onları bir kenara şimdi.

Growth Hacking” terimi 2010 yılında Sean Ellis abimiz tarafından türetildi. Sean , birçok İnternet şirketinin inanılamayacak derecede büyümesine yardımcı oldu ve bu şirketlerden çoğu IPO(Initial Public Offering)‘larını aldılar(bu noktada biraz finans bilmek çok önemli, hem de öyle böyle değil). Söylemeye gerek bile yok ki Sean müşteri tabanlarını büyütmek isteyen İnternet şirketleri tarafından kendisine en çok danışılan kişi oldu. Kısa bir süre sonra bütün bu sistemleri kuran, süreçleri tasarlayan ve zihniyeti ve düşünce biçimini oluşturan kişi kendisi oldu fakat bunların kendisinden sonra gelecek kişiler tarafından da sürdürülebilmesini istiyordu. İşte asıl problemin ortaya çıktığı nokta burasıydı.

Kendisi yerine geçecek elemanı ararken sürekli pazarlama derecelerine ve tecrübelerine sahip adaylar CV’lerini yolluyorlardı fakat bu adaylarda eksik olan bir şey vardı. Sean, kendi uyguladığı stratejilerin tipik bir pazarlama eğitiminde yer almadığını biliyordu. Eğer CV gönderen bu insanları işe alsaydı, iş ve aday arasında iyi bir uyum olmayabilirdi.

Geleneksel bir pazarlamacının odağı çok geniştir, fakat yetenekleri ve becerilerinin çok değerli olmasına rağmen ilk evrelerinde olan startup’lar için çok da gerekli değillerdir. Startup’ın ilk fazında pazarlama takımını kurup yönetecek, dış tedarikçileri yönetecek, kurumsal hedeflere ulaşmak için stratejik pazarlama planları oluşturacak ya da pazarlamacıların yaptığı diğer bir sürü işi yapacak biri veya birilerine ihtiyaç yoktur. Startup’ın ilk evresinde ihtiyacınız olan tek şey: Büyüme‘dir. Büyü babam büyü.

Sean, pazarlamacı aradığını söylediği için pazarlamacılar başvurmuştu. Sonra, aradığı ünvanı değiştirdi ve kendi ürettiği “Growth Hacker” yaptı ve bu fikir de böylece doğmuş oldu.

Aşağıdaki görsel kendisinin ilanından alıntıdır.

ŞİMDİ PÜR DİKKAT: Growth Hacker, pazarlamacının yerine geçebilecek biri değildir. Growth Hacker pazarlamacıdan daha iyi biri de değildir. GH(bundan böyle Growth Hacker için kullanılacaktır) sadece pazarlamacıdan birazcık farklıdır ve hedefi her zaman BÜYÜMEDİR.

GH‘nin verdiği her karar büyümeye dayalıdır. Her stratejiye, taktiğe, inisiyatife büyüme umuduyla girişir. Büyüme, GH‘nin etrafında döndüğü güneştir (Edebiyat 101). Tabii ki geleneksel pazarlamacılar da büyümeyi önemserler, fakat aynı ölçüde değil. Hatırlayın (hatırlamadıysan hemen yukarıya git ve tekrar oku), GH tek bir hedef üzerinde takıntılıdır. Neredeyse diğer bütün şeylere aldırmadan, ilk aşamada en önemli olan tek bir görevde başarıya ulaşabilirler.

Büyümeye olan mutlak odaklanma, geleneksel pazarlama repertuvarında daha önceden yer almayan ve zaman geçtikçe bu iki disiplin arasındaki uçurumu daha da derinleştiren yeni birçok metodun, aracın ve “best practice”lerin ortaya çıkmasına sebep oldu. Üzgünüm geleneksel pazarlamacı dostlarım ama gerçek durum bu.


ÜRÜNÜ YENİDEN TANIMLAMA

Geleneksel pazarlamacılar geleneksel ürünleri anlamada yeteneklidirler, fakat İnternet “ürün” kelimesini radikal bir biçimde yeniden tanımladı. Binlerce yıl boyunca ürün dediğimiz şeyler fiziksel mallar olarak karşımıza çıktı, fakat şimdi yazılım ürünleri formunda görünmez bitler ve baytlar olarak karşımıza çıkıyorlar. Ürünler eskiden sadece arabalar, şampuanlar, yataklar, kanepeler, ve silahlar(ne yazık ki) gibi şeyler olarak karşımıza çıkıyordu. Günümüzde ise Twitter bir ürün. Online muhasebe yazılımınız da bir ürün. Tutamadığımız şeyler başlı başına birer ürün. Bu geçiş sayesinde GH çağı denen yeni bir çağ ortaya çıktı. İnternet yeni tür ürünlerin ortaya çıkmasına izin verdi ve bu da yeni bir düşünce biçimini beraberinde getirdi.

Bu yeniden tanımlama süreci sayesinde ilk kez olarak bir ürün kendi benimsenmesinde bir rol oynayabilir duruma geldi. Kulağa çılgınca geliyor değil mi? Evet, çılgınca. Facebook gibi bir ürün kendi ürününü arkadaşlarınızla paylaşıp kendi deneyimlerinizi yaratmanıza izin veriyor. Bir şampuan bunu yapamaz. Dropbox gibi bir ürün size bedava bulut depolama alanı verebilir, eğer bir arkadaşınızı siteye kayıt ettirirseniz. Koltuklar bunu yapamaz. Eğer ürünlerin İnternet tarafından üretilen bu yeni sınıflandırılmasının üstesinden gelemiyorsanız, Growth Hacking‘ın özünü kavrayamazsınız.

Sean Ellis, GH‘yi türeten adam, Dropbox’un büyümesinden sorumlu ilk insandı. “İnternet ürünleri” hakkında neyin yeni olduğunu anladı. Aşağıdaki büyüme şemasına bakın:

GH, yazılım ürünlerini yaymak için ihtiva ettikleri gizli potansiyeli anlamaktan ve bu potansiyeli gerçeğe dönüştürmekten sorumludur.


DAĞITIMI YENİDEN TANIMLAMA

Ürünün önemine rağmen, aktivitelerinizi sadece ürüne kısıtlamak ahmakça olabilir. Ürünü yeniden tanımlayan İnternet aynı zamanda dağıtımı da yeniden tanımladı, ve artık bütün dağıtımlar ürün içerisinde değil. Yalnızca, insanların online olarak nasıl bir akış izlediğini kavrayabilmiş olanlar bu bilgiyi kendi startup’larının büyümesi için kullanabilirler.

Amerika’da 1950’lerde inşa edilmeye başlanan otoyolları düşünün. Bu durumda McDonald’s bir şeyi fark etti. O da şuydu: eyaletler arası bu yeni yollar müşteri elde etmek için yeni bir kanal olabilir. Ve böylece bu olayın avantajını yakaladılar. İnsanların bu otobanlar üzerinden eyaletler arası yolculuk yapacaklarını bildikleri için otoban üzerindeki eyalet sınırlarını McDonald’s’ın tabelalarıyla doldurdular. Bu olay off-line growth hacking örneği olabilir.(Eğer varsa)

İnternet ise bu olayın günümüzdeki modern emsali. İnsanları, verileri ve fikirleri yönlendiren “görünmez online haritaların” özünü kavrarsanız, McDonald’s’ın yaptığı gibi kendi “tabelalarınızı” insanların gideceklerini bildiğiniz yerlere koyarak büyüme yakalayabilirsiniz.

Sizi doğru yönde düşünmeye sevk edecek temel örnekler:

  • Geleneksel-fiziksel(online dışındakilerin hepsi) işlere yol sağlayan otobanların yerine, artık dijital işlere yol sağlayan “arama motorlarına” sahibiz. Şirketlerin ve ürünlerin dijital dünyada herkes tarafından fark edilebilmeleri için Arama Motoru Optimizasyonu(SEO) konusunda uzmanlaşmaları gerekiyor.
  • Bizi yakındaki bir sinemaya götüren otoyollar yerine, online sinemanın “otoyolu” olan YouTube’a sahibiz. Bunu gerçekten anlayabilenler bütün gözleri birçok farklı yolla kendi ürünleri üzerinde toplayabilirler.
  • Arkadaşımızın evine ulaşmamızı sağlayan sokaklar yerine, Facebook kullanarak sosyalleşmeyi tercih ediyoruz. Bunun gerçekten farkında olanlar kendi ajandalarını açıkça ya da üstü kapalı bir biçimde iletişimin içine katabilirler.

Ürün dağıtımı için büyük fırsatlar yaratan bir sürü online altyapı örnekleri mevcut, fakat önemli olan nokta şu ki insanların online ortamda nasıl hareket ettiklerine dair net bir görüşe sahip olan insanlar hayal etmesi zor olan büyüme avantajına sahip olacaklar. Yukarıdaki örnekler dışında daha başka yüzlerce örnek verilebilir, ve bu nokta da “hacker” notasyonunun oraya çıktığı yerdir.


GROWTH HACKER’DAKİ HACKER’IN ANLAMI NEDİR?

Hacker kelimesi birkaç anlama ve yan anlama sahiptir ve bunlar GH‘nin anlamına katkıda bulunur.

Usta Hacker (Ingenious Hacker)

Hacker kelimesi bazen zeki, orijinal, özgün ve yaratıcı birini tanımlamak için kullanılabilir. Bu kişiler, diğer kişilerin gözünden kaçan veya fark edemedikleri çözümleri yaratmak için hali hazırla ellerinin altında ne varsa kullanırlar. “Life hacker” ifadesi bu tarz bir kullanıma örnek olarak verilebilir. Bu aynı tutum GH‘lerde de vardır ve büyümeyi başarmak istiyorlarsa usta ve zeki olmak zorundadırlar. Büyümeye giden yollar genellikle belirsizdir ve bu yolları bulmak fazlasıyla yaratıcılık gerektirir.

Yazılım Hacker’ı (Software Hacker)

Hacker kelimesi bazen de yazılım mühendisi birini tanımlamak için kullanılabilir ve bir GH yazılımcı olsun veya olmasın, hedeflerinin birçoğuna erişmek için teknoloji tabanlı çözümler kullanır. GH start-up’ı büyütmek için programlar, veritabanları, API‘ler, ve diğer ilgili araçları kullanır. Eğer bir GH aynı zamanda yazılımcıysa daha verimli bir şekilde yol kat edebilir, fakat bu gerekli bir şey değildir. Ancak, bir GH başarılı olabilmek için kesinlikle teknolojiyi derinlemesine anlamalıdır. Eğer bir GH yazılımcı değilse bile kod yazan insanları yeterince koordine edebilmek için programlamadan anlaması gerekmektedir. Hatırlayın, ürünler artık teknoloji tabanlı, ve teknolojide uzmanlaşmak büyümek için elzem olacak.

Yasa dışı Hacker (Illegal Hacker)

Hacker kelimesi ayrıca bir sisteme yetkisiz, izinsiz olarak giren (resmen sızan) bir kişiyi tanımlamak için de kullanılabilir. Bunlar bir şeyleri izinleri olmadan ya patlatmışlardır ya da manipule etmişlerdir. Bir GH kötü anlamda hack işlemi gerçekleştirmez, fakat tavsiye edilen veya beklenen şeylerin sınırlarını zorlar. Bilgisayar hackleme konusundaki popüler yöntemlerden biri “zero-day-exploits“dir. Bu yöntemle dijital bir üründe güvenlik açığı fark ettiğiniz zaman bu açığı anında sömürmeye başlarsınız. Açığı fark etmekle sömürmeye başladığınız zaman arasında sıfır gün vardır. İsmi de buradan gelir. Bir GH‘de bu tarz açıklardan fayda sağlamaya çalışır. Bir sosyal platform yeni bir API yayınladığında GH hemen API’yı kullanıp açıklarını belirleyerek bu açıkları tabiri caizse sömürür, ta ki API’daki bu açık o sosyal platform tarafından fark edilip düzeltilene kadar. GH her zaman büyüme sağlayabilecek sistem açıkları için fırsat kollar.


PEKİ “GROWTH HACKING” PRATİKTE KARŞIMIZA NASIL ÇIKIYOR?

Şimdiye kadar yazıda “growth hacking“in hep teorik ve filozofik taraflarından bahsedildi. Tarihine, tanımına ve fikirler pazarında bu kavramı neyin yeni yaptığına göz attık. Artık pratik örnek vermenin vakti geldi!

Growth Hacking‘in simgesi AirBNB şirketidir diyebiliriz. Bu site, evinizdeki kullanmadığınız odaları yabancı insanlara kiralamanızı sağlayan bir platformdur. Harika bir fikir, icrası da olağanüstü, fakat bu başarılarının arkasındaki en önemli neden uyguladıkları Growth Hacking yöntemleridir. Kendilerini bir şekilde “online haritadaki” doğru yere koymayı başardılar.

AirBNB, kullanıcı tabanını ciddi anlamda artırmak için milyonlarca kullanıcının konaklama yeri bulmak amacıyla arama yaptığı bir platform olan Craigslist‘ten faydalandı. Kullanıcıların AirBNB sitesinde odalarını listelemek için doldurdukları forma aynı zamanda odalarını Craigslist’te de listelemek isteyip istemediklerini soran bir opsiyon eklediler. Bu sayede odaları aynı zamanda Craigslist’te de listelenecekti ve bu da hem kullanıcıların odaları için hem de AirBNB platformu için inbound(dışarında içeriye, başka bir platformdan-bu örnekte Craigslist- esas platforma-bu örnekte AirBNB-) linkler yaratacaktı.

Geriye dönüp bakıldığında çok açık bir biçimde şunu düşünebilirsiniz: neden diğer şirketler Craigslist’i AirBNB’nin yaptığı gibi çapraz listelemelerle doldurup müşteri kazanmak için gürültülü ve kalabalık bir kanala dönüştürmemişlerdi ? Güzel soru. Cevap şu gerçekte yatıyor ki Craigslist kullanıma açık bir API’ye sahip değildi. Yani Craigslist, diğer şirketlere(AirBNB gibi) kendi servislerini yayınlamaları için kolay bir yöntem sunmuyordu. Ortada AirBNB’nin ne kolayca uygulayabileceği teknolojik bir çözüm vardı ne de kendi ilanlarını otomatik olarak Craigslist’te yayınlamak için kullanabilecekleri örnek döküman mevcuttu. Onun yerine, Craigslist formlarının nasıl çalıştığını öğrenmek için tersine mühendislik(reverse engineering) yapmaları gerekiyordu. Bu sayede Craigslist’in kod tabanına ulaşmadan kendi ürünlerini Craigslist ile uyumlu hale getirebileceklerdi. API’ler kolaydır, tersine mühendislik ise hiç de kolay değil!

Bu örneği kullanarak, yazının önceki kısmındaki teorik bilgilerin ne kadar doğru olduğunu fark edebilirsiniz.

1) İlk olarak, AirBNB geleneksel bir pazarlamacının zihninde canlandırması zor olan bir şeyi gerçekleştirdi. Şu anda mevcut olarak pazarlama bölümünde öğretilenler, bu tarz bir entegrasyonu(özellikle API’siz) başarmanızı sağlayacak donanımı ve konsepti ne yazık ki vermiyor.

2) İkinci olarak, AirBNB kendi ürününün esas dağıtım aracı olarak gene kendi ürününü kullanmıştır. Craigslist ile olan entegrasyon AirBNB’nin kendi uygulamasının haricinde bir şey değildi. Aksine, onun bir parçasıydı. Ürünlerine trafik çekmek için dergilere reklam vermediler. Ürün kendisine trafiği çekti.

3) Üçüncü olarak, AirBNB ihtiyacı olduğu dağıtım mekanizmasının Craigslist olduğunu fark etti çünkü Craigslist hali hazırda gayet güzel ve oturmuş bir platformdu. Bu platformun trafiğinden kendi sitesine trafik “çalarak” dağıtımı ve büyümeyi hedeflemişti. Hiçbir ürün çevreden izole bir ortamda varlığını sürdüremez. AirBNB’nin istediği kullanıcılar zaten hali hazırda başka platformlarda toplanmışlardı. Bunlardan en kritiği olarak da Craigslist’i gördüler ve buradaki kullanıcıların dikkatini kendi platformları üzerine çekmek için çalıştılar.

4) Dördüncü olarak, akıllı, orijinal ve yaratıcılardı. Daha önceden çapraz promosyon yapmak için Craigslist’i kullanan birine rastlamamışlardı. Bunu kendileri düşündüler. Düşündükleri bu yöntemin çalışacağına dair hiçbir garantileri olmamasına rağmen tüm cesaretlerini toplayıp bu güzel çözüm için uğraştılar.

5) Beşinci olarak, büyüme mekanizmaları çok büyük miktarda teknoloji tabanlıydı. Bu stratejiyi başaran takımın Craigslist’i tersine mühendislikle çözmek için hem iyi bir programlama tecrübesine hem de web ürünlerinin nasıl inşa edildiğine dair kapsamlı bir anlayışa sahip olması gerekiyordu.

6) Altıncı olarak, kullanıcı kazanmak için, var olan mevcut pazardaki açıklardan yararlandılar. Craigslist’in “public” bir API yaratmamasının bir sebebi vardı çünkü Craig Newmark kendi servisi üzerinde böyle bir şey yapılmasına izin vermek istemiyordu. AirBNB, Craigslist’ten API istemeyerek kabul edilebilir şeylerin sınırlarını zorladı ve API’siz yoluna devam etti.

Bugün bu numara artık çalışmıyor çünkü Craigslist bu açığı kapattı. AirBNB artık kendi ilanlarının Craigslist’te yayınlanmayacağına dair bir bildiriyi kendi sitesinde yayınladı. Bu aslında GH‘ler için büyük bir ders ve örnek oldu. GH‘lerin açıklarından yararlandığı bir sürü büyüme mekanizması kısıtlı bir yaşam süresine sahiptir. Zaten önümüzdeki 10 sene boyunca Craigslist’in AirBNB’ye böyle bir şey için izin vermesini beklemek saçma olurdu çünkü bu resmen Craigslist’in kendi kullanıcılarını bilerek AirBNB’ye kaptırması anlamına geliyordu. Bu geçici fırsattan son raddesine kadar yararlanarak kendi büyüme temelini oluşturdular ve bu sayede işlerine ivme kazandırdılar.


İNTERNET İŞLERİNİN GELECEĞİ

what-is-frowth-hacking-10Growth hacking, internet tabanlı şirketlerin gelecekleri konusunda belirtiler sunan ilgi çekici bir eğilim. Ürün takımı ile, ürüne kullanıcı çekmeye çalışan takım arasında her zaman bir bariyer olmuştur. Yazılımcılar inşa eder, pazarlamacılar da ürünü pazara sokar. Bu yöntem kısa bir süre için işe yaradı. Artık, büyümeden sorumlu olanların API’ın ne demek olduğunu bilmek zorunda oldukları gibi yazılımdan sorumlu olanlar da müşteri deneyimi konusunda bilgi sahibi olmak zorundalar. Bu ayrı dünyalar artık iç içe girdi ve daha da girmeye devam ediyorlar.

Bu çapraz etkileşim aslında mantıklı. Eğer büyüme bir organizasyonun gerçekten hayat kaynağıysa, o zaman büyüme neden organizasyonun her alanına iliştirilmesin ? Müşteri desteği bile büyümeyi önemseyen insanlar tarafından verilmelidir çünkü sinirli müşteriler kaybedilebilir. Ve tasarımcılar da bir gözü büyümede olacak şekilde tasarım yapmalıdırlar çünkü tek başına güzel bir tasarım her zaman müşteri çekmeye yetmez. İnternet şirketleri ve bu şirketleri kuran takımlar gelecekte, geçmişte olduklarından çok farklı bir yapıya bürünecekler.

Gelecek hakkında ekstra bir not daha. Gwoth Hacking şimdilik sadece start-up’lara özgü bir kavram olarak algılanıyor, fakat eninde sonunda Fortune 500 şirketlerinin de başvurduğu bir yöntem olacak. Start-up’lar growth hacking yapmaya bir şekilde mecburdurlar çünkü bu şirketler geleneksel pazarlamacıların taktik ve stratejilerini etkili bir biçimde kullanmaları için gereken kaynaklara ve bu kaynaklar arasındaki ilişkilere sahip değildirler. Fakat bu, growth hacking‘in büyük şirketlerce kullanılamayacağı anlamına gelmiyor. Eğer growth hacking kaynak olmadan başarılı olabiliyorsa, bir de kaynak olduğunda neler başarabileceğini tahmin etmeye çalışın!


BU YAZININ ÖZETİ

1) Pazarlamacılar önemlidir, fakat start-up’ın ilk evrelerinde onlara ihtiyaç yoktur. Pazarlamacılar yerine sadece büyümeye odaklı birine ihtiyaç vardır.

2) İnternet ürünlerinin doğası büyüme hakkında yeni düşünce biçimleri üretti. Ürün özellikleri artık direkt olarak büyümenin kaynağı olabilir.

3) Dağıtım kanalları yeniden çiziliyor ve insanların online hareketlerini anlayanlar insanların son duraklarının neresi olacağı hakkında kontrol sahibi olacaklar.

4) GH, kendi ürün ve dağıtım bilgisini kullanarak, akıllı, zekice, teknoloji tabanlı büyüme alanları bulur ve bu büyüme alanları genellikle herkes tarafından tavsiye edilenin veya beklenenin sınırlarını zorlar, beklenmeyen veya daha önce tavsiye edilmeyen şeyleri bulur.

5) AirBNB growth hacking‘in vücut bulmuş harika bir örneğidir.

6) Growth hacking bize pazarlama departmanından daha fazla olarak gizli trendleri gösterir. Büyüme önemlidir ve şirketler içindeki çoklu roller bir gün bunu yansıtacak.

7) Growth hacking öncelikle start-up’larda görülür ancak eninde sonunda büyük şirketlerde de görülmeye başlanacaktır.