İstatistiksel Öğrenme – I

İstatistiksel öğrenme (Statistical Learning) veriyi anlamak için kullanılan birçok yönteme verilen genel bir addır.

Diyelim ki biz bir istatistik danışmanıyız ve bir müşteri tarafından belirli bir ürünün satışlarını artırmak için görevlendirildik. Elimizde Reklam (Advertising) adında bir veri olsun ve şunları içersin: bu ürünün 200 farklı marketteki satış verileriyle birlikte üç farklı medya (TV, radyo ve gazete) için reklam bütçeleri. Müşterimiz için ürünün satışlarını direkt olarak artırmak mümkün değil. Fakat bu üç farklı medya için ayrılan reklam bütçelerini kontrol edebilir. Bu yüzden, reklam ile satış arasında bir ilişki olduğunu belirleyebilirsek, müşterimizin reklam bütçesini bu üç medya için uygun bölüştürmesine ve bu sayede dolaylı olarak satışları artırmasına yardımcı olabiliriz.

Bu problemde reklam bütçeleri giriş değişkeni (input variable), satış ise çıkış değişkenidir (output variable). Giriş değişkenlerinin hepsi Xn ile gösterilir. Mesela X1 TV’yi, X2 radyoyu, X3 de gazeteyi göstersin. İngilizcede bu giriş değişkenleri birden fazla kelimeyle ifade edilebilir: predictors, independent variables, features, bazen de sadece variable. Çıkış değişkeni ise satış’tır ve genellikle cevap değişkeni (response variable) veya bağımlı değişken (dependent variable) olarak adlandırılır.

Aşağıdaki görsel her bir medyaya ayrılan bütçenin satış ile ilişkisini gösteriyor. Mavi çizgi ise simple least squares fit denilen yöntemle oluşturulan tahminlemeyi gösteriyor. Bu ve bunun gibi bir sürü yöntemi ayrıntılı olarak inceleyeceğiz.

1

Bu kavramı biraz genelleştirelim. Diyelim ki sayısal (quantitative) bir output değişkeni (Y)’ni gözlemledik ve elimizde p tane farklı input değişkeni var (X1, X2, X3, …, Xp).  Y ve X(X1, X2, X3, …, Xp) arasında bir ilişki olduğunu varsayıyoruz ve şu şekilde ifade ediyoruz:

2

Bu formülde f input değişkenlerinden oluşan bilinmeyen bir fonksiyonu ve sondaki E’ye benzeyen ifade ise input değişkenlerden bağımsız ve ortalaması sıfır olan rastgele hata terimini (random error term) temsil ediyor. Yani aslında f, X’lerin sağladığı sistematik bilgiyi temsil ediyor.

3

Yukarıdaki görselde sol taraftaki grafik 30 birey için Years of Education (yani eğitim derecesi) ve Income (gelir)‘ın nasıl ilişkili olduğunu gösteriyor. Years of Education arttıkça, yani eğitim seviyesi yükseldikçe, Income da artıyor. Ancak input değişkeni/değişkenlerini output değişkenine bağlayan gerçek f  fonksiyonu genellikle bilinmez. Bu durumda elimizdeki verilerden böyle bir f fonksiyonu hesaplamaya çalışırız. Öyle bir f fonksiyonu bulalım ki Years of Education verildiğinde Income’ı mümkün olduğunca doğru bir şekilde tahmin edebilsin. Bu örnekte Income tamamen bizim uydurduğumu bir veri olduğu için gerçek f fonksiyonunu aslında biliyoruz. Gerçek f fonksiyonu sağdaki grafikte mavi eğri ile gösterilmiş. Dikey çizgiler hata terimlerini (error terms) temsil ediyor. Hata terimlerinin bazıları çizginin altında ve bazıları çizginin üstünde kalıyor (yani f fonksiyonuna göre olması gereken output değerinden daha yüksek veya daha düşük oluyor), ve genel ortalamaları bu yüzden neredeyse sıfıra eşit oluyor. Bu örnekte gerçek f fonksiyonunu bilmemize rağmen tahminlemede hala hata terimlerinin olması en başta garip gelebilir, ama aslında hiç de garip değil. Bu konuya daha sonra geri döneceğiz.

Genellikle f fonksiyonu bir değil birden fazla input değişkeni içerir. Örneğin Income değişkeni Years of Education ve Seniority ile tahmin edilmeye çalışıldığında aşağıdaki gibi bir grafik ortaya çıkabilir:

4

Bu grafikte mavi yüzey tahminlemeye çalıştığımız f fonksiyonunu gösteriyor, kırmızı noktalar ise gerçek değerleri gösteriyor. Kırmızı noktalarla tahinlediğimiz f fonksiyonu arasındaki dikey çizgiler ise hata terimlerini temsil ediyor.

Sözün özü, istatistiksel öğrenme (statistical learning) aslında bu f fonksiyonunu tahminlemeyi sağlayan bir çok yöntemden oluşan bir disiplindir.

Neden f’i Hesaplamaya Çalışıyoruz ?

f’i hesaplamak istememizin iki ana sebebi var: tahminleme (prediction) ve çıkarsama (inference).

Tahminleme (Prediction)

Birçok durumda input değişkenleri (X) hazır olarak vardır, ancak output değişkeni (Y) kolaylıkla elde edilemeyebilir. Bu durumda, hata terimleri ortalama olarak sıfır olacağından, Y yi şu şekilde tahminleyebiliriz:

5

Bu formülte   6  gerçek f için tahminimizi, 7 ise gerçek Y için tahminimizi gösteriyor. Bu durumda 6 genellikle kara kutu (black box) gibi düşünülür çünkü tahminleme yaparken 6‘in tam olarak nasıl bir fonksiyon olduğuyla ilgilenmeyiz. Tahminlemede bizi ilgilendiren asıl şey hesapladığımız 6‘in ne kadar kesin ve doğru tahmin yaptığı.

Örneğin, X1,X2,X3…Xp bir hastanın kan örneğinin özelliklerini temsil eden değişkenler olsun ve Y de o hastanın belirli bir ilaca karşı ciddi derece olumsuz reaksiyon gösterme riskini belirten değişken olsun. Bu durumda X’leri kullanarak Y’yi doğru tahmin etmek ve yüksek Y’li (riskli) hastalara bu ilacı vermemek asıl amacımızdır.

7‘nin gerçek Y‘yi tahminlemedeki kesinliği (accuracy) iki miktara bağlıdır: azaltılabilir hata (reducible error) ve azaltılamaz hata (irreducible error). Genellikle bulduğumuz 6 gerçek f için mükemmel bir tahminleme olmaz ve bu kesin olmama durumu (inaccuracy) tahminlememizde hataya neden olur. Bu durumda oluşan hata azaltılabilir (reducible) hatadır çünkü 6‘in kesinliğini en uygun istatistiksel öğrenme tekniğini kullanarak iyileştirebiliriz. Fakat, gerçek f için mükkemmel bir tahminleme oluşturabilsek bile ( yani 7 = f(X) olsa ), tahminlememiz hala bir takım hatalar içerecektir. Çünkü Y aynı zamanda hatanın, 8, bir fonksiyonudur ve bu hata X’leri kullanarak tahminlenemez. Bu yüzden, 8‘nin değişkenliği tahminlememizi kesinliğini etkileyecektir. Bu azaltılamaz hata (irreducible error) olarak adlandırılır çünkü f’i ne kadar mükemmel tahminleyebilirsek tahminleyelim, 8‘den dolayı kaynaklanan hatayı azaltamayız.

Azaltılamayan hata neden hep sıfırdan büyüktür? 8 miktarı Y’yi tahminlemeye yarayan fakat bizim hesaba katmadığımız değişkenleri içeriyor olabilir. Bunları ölçümlemediğimizden f fonksiyonumuz tahminleme yaparken bu değişkenleri doğal olarak kullanamayacaktır. 8 miktarı aynı zamanda ölçülemeyen değişkenlikleri de içeriyor olabilir. Örneğin, bir ilaca karşı olan olumsuz reaksiyon riski aynı hasta için günden güne, ilacın üretim değişkenliğine göre veya hastanın o günkü genel durumuna göre değişkenlik gösterebilir. İki kişinin aynı yemeği yiyip birinin zehirlenip diğerinin zehirlenmemesi gibi, bu tarz değişkenlikler genellikle ölçülemez.

9

Yukarıdaki formülde;

  • Y, gerçek output’u
  • 7, tahminlenen output’u

temsil ediyor.

Y‘nin gerçek fonksiyon olan f(X) + 8 ‘ye, 7‘nin ise 6(X)‘e eşit olduğuna dikkat edin.

Çıkarsama (Inference)

Genellikle ilgilendiğimiz bir diğer şey de Y‘nin X değişkenlerindeki değişimden nasıl etkilendiğidir. Bu durumda f’i hesaplamak isteriz, ancak amacımız genellikle Y için tahminleme (prediction) yapmak değildir. Daha ziyade X ve Y arasındaki ilişkiyi tespit etmeyi amaçlarız. Bu durumda 6 kara kutu (black box) olarak düşünülemez çünkü çıkarsamada 6‘in tam olarak nasıl bir fonksiyon olduğu bizim için önemlidir. Bu durumda şu tarz soruları cevaplayabiliriz:

  • Hangi X değişkenleri Y ile ilişkili
  • Y ile herbir X değişleni arasındaki ilişki nasıl
  • Y ile herbir X değişkeni arasındaki ilişki doğrusal bir denklemle (linear equation) yeterli oranda özetlenebilir mi yoksa aralarındaki ilişki daha mı kompleks (doğrusal olmayan ilişki (non linear) )

Örneğin, direkt pazarlama (direct marketing) kampanyası yapmak isteyen bir şirket düşünün. Amaç demografik verilere dayanarak kampanyaya pozitif cevap verebilecek bireyleri tespit etmek. Bu durumda demografik veriler X (predictors) ve kampanyaya cevap(pozitif ya da negatif) Y ile temsil edilir. Şirket her bir input değişkeninin Y ile olan ilişkisiyle ilgilenmez; input değişkenleriyle kampanyaya cevabı ne kadar doğru tahmin edebildiğiyle ilgilenir. Bu tahminlemeye bir örnektir.

Diğer taraftan, daha önceden bahsettiğim advertising probleminde ise tahminlemeden ziyada çıkarsama bizim için önemlidir. Bu durumda her bir input değişkeni X için output olan satış değişkeninin (Y) nasıl etkilendiğiyle ilgileniriz. Hangi medya satışlara katkıda bulunuyor? Hangi medyadaki bütçe artışı satışları daha çok etkiliyor ?, Satıştaki ne kadar artış TV reklamlarındaki artışla ilişkili? gibi soruların cevabını bu şekilde verebiliriz. Başka bir örnek olarak bir müşterinin belirli marka bir ürünü alma ihtimalinin fiyat, mağaza lokasyonu, indirim oranı, rekabet fiyatı vb. gibi değişkenlerce nasıl etkilendiğini belirlemeye etmeye çalışalım. Bu durumda her bir input değişkeninin output değişkeni olan alma ihtimalini nasıl etkilediğiyle ilgileniriz. Örneğin fiyattaki bir değişim müşterinin alma ihtimalini nasıl ve ne derece etkiler ? Bunun cevabını bu şekilde verebiliriz.

Son olarak bazı modellemelerde amacımız hem tahminleme yapmak hem de çıkarsama yapmak olabilir. Örneğin gayrimenkul sektöründe bir evin fiyatını lokasyonu, o lokasyondaki suç oranı, sahile olan uzaklığı, hava kalitesi, okula yakınlığı, o civardaki gelir düzeyi, evin büyüklüğü, vb.  gibi değişkenlerce tahmin etmeye çalışabiliriz. Herbir input değişkeninin fiyatı nasıl etkilediğiyle ilgileniyor olabiliriz. Bu bir çıkarsama problemidir. Ama aynı zamanda bir evin özellikleri verildiğinde o evin fiyatını tahmin etmeye çalışıyor da olabiliriz. Bu da bir tahminleme problemidir.

Nihai amacımızın tahminleme mi, çıkarsama mı, yoksa her ikisi de mi olduğuna göre f’i tahminlemede farklı metotlar kullanırız. Örneğin lineer modeller (linear models) göreceli olarak daha basit ve yorumlanabilir çıkarsamalar sağlarken, diğer yöntemlere nazaran daha az kesinlikte tahminlemeler üretebilirler. Aksine doğrusal olmayan modeller (non-linear models) daha kesin tahminlemeler sağlarken, lineer modellere göre çok daha karmaşık olduklarından yorumlanmaları ve çıkarsama için kullanılmaları çok daha zordur.

Peki f’i Nasıl Hesaplayacağız?

Bu yazıda ve bundan sonraki yazılarda f’i hesaplamamızı sağlayan birçok doğrusal (linear) ve doğrusal olmayan (non-linear) yöntemlerden bahsedeceğiz. Fakat bütün bu yöntemlerin bazı ortak özellikleri var. Bunları inceleyelim.

Öncelikle elimizdeki veriyi her zaman training ve test olmak üzere iki parçaya bölüyoruz. Hangi yöntemi uygularsak uygulayalım yöntemimize f‘i nasıl hesaplayacağını öğretmek(train veya teach) için training veri setini kullanırız. Metodumuz bu veri setinden bilmediğimiz f‘i öğrenmeye çalışır ve bunun sonucunda tahmini bir f fonksiyonu üretir. Bu tahmini f fonksiyonu 6 ile ifade edilir. Yani öyle bir 6 bulmalıyız ki ürettiği tahmini 7 değerleri gerçek Y değerlerine mümkün olduğunca yakın olsun. 6‘i hesaplamada kullanılan bir çok istatistiksel öğrenme metodu parametrik (parametric) ya da parametrik olmayan (non-parametrik) olarak iki gruba ayrılabilir.

Parametrik Metodlar ( Parametric Methods)

Parametric metodlar model tabanlı iki adımdan oluşur:

1. İlk olarak, gerçek f‘in fonksiyonel formu ya da şekli ile ilgili bir varsayımda bulunuruz. Örneğin, f‘in doğrusal (linear) bir fonksiyon olduğunu varsayarsak tahminlemeye çalıştığımız fonksiyon şu şekli alır:

f(X) = β0 + β1×X1 + β2×X2 + . . . + βp×Xp

Bu bir doğrusal modeldir. f‘in doğrusal olduğunu varsaydıktan sonra, f‘i hesaplama problemini büyük ölçüde basitleştirmiş oluruz. Rastgele p boyutlu bir f(X) fonksiyonu hesaplamak zorunda kalmaktansa, sadece p+1 katsayıyı (coefficients, β0,β1,β2,…,βp) hesaplamaya çalışırız.

2. Modeli seçtikten sonra, training verisini kullanarak modeli eğiten (train) bir prosedüre ihtiyaç duyarız. Yukarıdaki doğrusal model örneğinde β0,β1,…βp parametrelerini modeli eğiterek(training veya fittin g olarak adlandırılır) hesaplamak isteriz. Bu parametreler için öyle değerler bulmalıyız ki tahminimiz gerçek Y değerine mümkün olduğunca eşit olsun:

Yβ0 + β1×X1 + β2×X2 + . . . + βp×Xp

Bu uydurma (fitting) işlemi için en yaygın yaklaşım ordinary least squares olarak adlandırılan bir yaklaşımdır. Fakat bunun dışında daha bir sürü yaklaşım vardır. Hepsini ileriki yazılarda ayrıntılı olarak işleyeceğiz.

Model tabanlı yaklaşımlar parametrik olarak adlandırılır: parametrik modeller f‘i hesaplama problemini sadece bazı parametreleri hesaplama problemine indirger. Bir miktar parametreyi hesaplamak, tamamen rastgele bir f fonksiyonu bulmaktan çok daha kolaydır. Fakat parametrik metotların en büyük potansiyel dezavantajı seçtiğimiz modelin genellikle bilmediğimiz gerçek f’le tam olarak eşleşmemesidir. Eğer seçtiğimiz model gerçek f’ten çok farklıysa o zaman tahminlememiz sağlıklı ve güvenilir olmayacaktır. Bu problemi çözmek için daha esnek (flexible) modelleri kullanabiliriz çünkü bu modeller f‘e bir çok farklı şekilde uydurulabilir (fitting). Fakat genel olarak, daha esnek bir modele fit etmek daha çok parametre hesaplamayı gerektirir ve bu modeller verideki hatayı (error) ve gürültüyü (noise) çok yakından takip etmesinden dolayı overfitting denilen duruma yol açabilir.

Örneğin elimizdeki income verisine parametrik bir metot uygulayalım ve aşağıdaki gibi doğrusal bir fonksiyona uyduralım (fitting):

income ≈ β0 + β1×education + β2×seniority.

İki input değişkeni ile output değişkeni arasında doğrusal bir ilişki olduğunu varsaydığımızdan, uydurma (fitting) problemi β0, β1 ve β2′yi hesaplama problemine indirgenmiş olur ve bunları da least squares linear regression metoduyla hesaplarız. Aşağıdaki grafik veriye uygulanan least squares fit‘i gösteriyor.

12

Yukarıdaki grafikten görülebileceği üzere modelimiz tam olarak istediğimiz gibi bir tahminleme yapmıyor çünkü gerçek f doğrusal olmayan, eğrisel bir forma sahip ve bu da doğrusal modellerle yakalanamaz. Gerçek f‘in doğrusal olmadığını aynı verinin yazının başlarında paylaşılan doğrusal olmayan model grafiğinden görebilirsiniz.

Parametrik Olmayan Metotlar ( Non-parametric Methods)

Parametrik olmayan metotlar gerçek f‘in fonksiyonel formuyla ilgili bir varsayımda bulunmazlar. Bunun yerine veriye mümkün olduğunca uyacak (fitting) bir f fonksiyonu hesaplamaya çalışırlar ve bunu yaparken mümkün olduğunca az keskin hatlı ve kıvrımlı fonksiyonlar üretmeye çalışırlar. Bu metotların parametrik metotlara kıyasla en büyük avantajı veriye daha düzgün ve net bir şekilde uyan (fitting) bir f fonksiyonu hesaplayabilmeleridir. Fakat bu metotlar iki büyük dezavantaja sahip: f’i hesaplama problemini parametrik metotlar gibi daha az sayıda parametre hesaplamaya indirgemedikleri için, net ve doğru bir şekilde f’i hesaplayabilmek için çok daha büyük boyutta veriye ihtiyaç duyarlar.

13

Yukarıdaki grafik parametrik olmayan bir metotla aynı veriye fit etmeyi gösteriyor.  Thin-plate spline olarak adlandırılan bu metot, f hakkında bir varsayımda bulunmuyor. Eldeki veriye en çok fit edecek şekilde bir f fonksiyonu hesaplamaya çalışıyor ve bu da yukarıdaki şekilde sarı ile gösteriliyor. Doğrusal fit ile karşılaştırıldığında bu metot gerçek f‘e çok daha yakın bir hesaplama sağlıyor. Doğrusal olmayan bir fit için smoothness düzeyini belirlememiz gerekiyor. Aşağıdaki grafik aynı metotun daha az smooth bir versiyonunu gösteriyor. Daha az smooth daha fazla fit‘e sebep oluyor ve hesaplanan f eldeki veriye daha net bir şekilde uyuyor. Bu istenmeyen bir durum aslında çünkü eldeki veriye mümkün olduğunca yakın bir hesaplama yaptığımız için yeni bir veri üzerinde hesaplamamız o kadar da net sonuçlar vermeyebilir! Genellikle f’i training veri setini kullanarak hesaplamaya çalıştığımızdan hesapladığımız 6 fonksiyonu training veri setindeki verilere en çok uyacak şekilde hesaplanacaktır ve bu da 6 fonksiyonunun test veri setinde (yani yeni veri setinde) hatalı tahminler yapmasına sebep olacaktır.

14

Tahminlemenin Kesinliği ile Modelin Yorumlanabilirliği Arasındaki Dengeyi Doğru Belirleme

f’i hesaplamak için kullanılan bazı metotlar, f‘i hesaplamada daha az farklı şekil oluşturduklarından, daha az esnek (less flexible) tirler. Örneğin linear regression göreceli olarak daha az esnek bir metottur çünkü sadece doğrusal fonksiyonlar üretebilir. Thin plate splines gibi metotlar ise daha fazla esnektir çünkü f‘i hesaplamada daha çok sayıda farklı şekil oluşturabilirler.

Peki esnek modeller f’i daha iyi hesaplayabiliyorsa neden esnek olmayan modelleri kullanıyoruz ? Bunun birkaç sebebi var. Eğer amacımız çıkarsama (inference) ise, daha az esnek (inflexible, restrictive) modeller daha kolay yorumlanabildiğinden tercih sebebimiz olabilir. Eğer ana amacımız tahminleme (prediction) yapmak ise, o zaman daha esnek bir modeli tercih edebiliriz. Ancak bazen esnek olmayan modeller daha kesin tahminlemeler yapabilir! Çünkü daha esnek modeller potansiyel olarak overfitting problemine sebep olabilirler.

Gözetimli (Supervised) vs. Gözetimsiz (Unsupervised) Öğrenme

Çoğu istatistiksel öğrenme problemi iki kategoriye ayrılır: gözetimli (supervised) ve gözetimsiz (unsupervised).

Gözetimli öğrenmede, output değişkenimiz(Y) belirlidir ve input değişkenleriyle bu Y output değişkeni arasında bir ilişki bulmaya çalışırız. Y output değişkeni öğrenme işleminde bize yol gösterir (supervising). Linear regression, logistic regression, generalized additive models, boosting ve support vector machines(SVM) gözetimli öğrenme kategorisinde yer alır.

Ancak gözetimsiz öğrenme daha zorlu bir süreçtir. Bu durumda Y output değişkeni yoktur. Dolayısıyla öğrenme sırasında modele yol gösterecek bir değişken yoktur. Clustering gözetimsiz öğrenme kategorinde yer alır. Aşağıdaki grafik bir clustering grafiğini gösteriyor. Eldeki verilere dayanarak bir entity’nin hangi kategoriye gireceğini tahmin etmeye çalışıyoruz. Aşağıdaki üçgen, artı ve daire farklı grupları gösteriyor.15

Bütün bu metotları ileriki yazılarda ayrıntılı olarak işleyeceğiz.

Regresyon (Regression) vs. Sınıflandırma (Classification) Problemleri

Değişkenler niceliksel (quantitative) ve niteliksel (qualitative) olmak üzere iki ana grupta toplanabilir. Output değişkenimiz niceliksel bir değişkense problemimiz regresyon problemi, niteliksel bir değişkense sınıflandırma problemi olarak adlandırılır.

Kaynaklar:

  • Data Mining and Analysis: Fundamental Concepts and Algorithms
  • An Introduction to Statistical Learning: with Applications in R

Principal Component Analysis 4 Dummies: Eigenvectors, Eigenvalues and Dimension Reduction

George Dallas

Having been in the social sciences for a couple of weeks it seems like a large amount of quantitative analysis relies on Principal Component Analysis (PCA). This is usually referred to in tandem with eigenvalues, eigenvectors and lots of numbers. So what’s going on? Is this just mathematical jargon to get the non-maths scholars to stop asking questions? Maybe, but it’s also a useful tool to use when you have to look at data. This post will give a very broad overview of PCA, describing eigenvectors and eigenvalues (which you need to know about to understand it) and showing how you can reduce the dimensions of data using PCA. As I said it’s a neat tool to use in information theory, and even though the maths is a bit complicated, you only need to get a broad idea of what’s going on to be able to use it effectively.

View original post 1,578 more words

Veri Madenciliği 3 – Veri Hazırlama Bölüm 1

Neden veriyi hazırlıyoruz?

Bütün veri madenciliği araçları için biraz veri hazırlama işlemi yapmak gerekir. Buradaki ana amaç veri setlerinin bilgi içeriklerinin veri madenciliği araçları tarafından en iyi şekilde analiz edilmesini sağlamak için veriyi bir takım dönüşüm işlemlerinden geçirmektir. Veri hazırlama işlemi yapıldıktan sonra hatalı tahmin oranlarının hazırlanma işleminden öncekine oranla düşmüş (ya da en kötü aynı oranda kalmış) olması gerekir.

Veri hazırlığı aynı zamanda veri madenciliği yapan kişiyi de daha iyi ve daha hızlı modeller üretebilmesi için hazırlar. GIGO (Garbage In Garbage Out) konseptini hatırlayacak olursak verimli modeller üretebilmenin ön koşulu iyi bir veriye sahip olmaktır.

Verinin kullanılan yazılım aracına uygun şekilde formatlanması gerekir. Ayrıca kullanılan metoda göre elinizin altında yeterli miktarda veri bulunmalıdır. Teoride her şey çok mükemmelmiş gibi gözükse de pratikte veri ne yazık ki son derece kirli olarak karşımıza çıkıyor:

Eksik (incomplete) Veri: Pratikte eksik veriyle çok sık karşılaşıyoruz. Bazı değişkenlerin ve/veya değerlerin eksik olması, ihtiyaç duyulan değerlerin bulunmaması, veya spesifik değil de toplam değerlerin bulunması eksik veriye örnek olarak verilebilir. Örneğin,
occupation = “”

Gürültülü (noisy) Veri: Gene aynı şekilde pratikte karşılaşılan veriler çok fazla gürültü içeriyor. Hatalı veya aykırı (outlier) veriler gürültülere birer örnek olarak verilebilir. Örneğin,
Salary=”-10″,
Age=”222″

Tutarsız (inconsistent) Veri: Veri içerisindeki tutarsızlıklara da çok sık rastlıyoruz. Kodlamada ya da isimlendirmede birbirleriyle uyuşmayan veriler buna örnek olarak verilebilir. Örneğin,
Age=”42, Birthday=”03/07/1997″
Eskiden “1,2,3” olarak yapılan değerlendirmenin artık “A,B,C” olarak yapılması
Kayıtların kopyalarının aslıyla uyuşmaması

Veri Hazırlığındaki Ana İşler

Veri Temizleme (data cleaning): Eksik değerleri doldurma; gürültülü, kirli ve pürüzlü veriyi pürüzsüz hale getirme(yumuşartma: smoothing); aykırı gözlemleri belirleme veya ayıklama ve tutarsızlıkları giderme işlemleridir.
Veri Entegrasyonu (data integration): Birden fazla veritabanının, veri küpünün (data cube), tablonun veya dosyanın entegrasyonu işlemidir.
Veri Dönüşümü (data transformation): Normalizasyon ve yığınlama (aggregation) işlemleridir. Bu aşamada veri standart hale getirilmeye çalışılır.
Veri Azaltma (data reduction): Veriyi orijinal halini temsil edecek ve aynı veya benzer analitik sonuçları üretecek şekilde hacimsel olarak küçültme, azaltma işlemleridir. Azaltılan veri, normal veriyi temsil etme özelliğini korumalıdır.
Veri Ayrıştırma (data discretization): Veri azaltma (data reduction) işleminin bir parçasıdır ve özellikle numerik verilerde dikkatle uygulanmalıdır.

Bilgi Keşfi Süreci’nin bir parçası olarak Veri Hazırlığı

Aşağıdaki şekildeki Selection, Preprocessing ve Transformation adımları veri hazırlığının aşamalarıdır. Görebileceğiniz üzere veri hazırlığı bütün bilgi keşfi sürecin büyük bir kısmını oluşturur. Yani bu aşama veriyi temizleme, entegre etme, seçme ve dönüştürme işlemlerinden oluşur.

Knowledge Discovery Process

CRISP – DM (Cross Industry Standard Process for Data Mining)

CRISP – DM kapsamlı bir veri madenciliği metodolojisi ve süreç modelidir ve yeni başlayanından uzmanına kadar her kişi için veri madenciliği projesi yürütme işinde tam bir yol haritası görevi görür. Bu model işin anlaşılmasıyla başlar. Hedefin ne olduğunu, iş ihtiyacının ne olduğunu ve neyi bulmaya çalıştığımızı bu aşamada netleştirmeliyiz. Daha sonra süreç bu iş için gerekli verilerin toplanıp kavranmasıyla devam eder.  Bu iki aşama birbirini geri bildirimli olarak çalışır. Daha sonra kavranan veri, hazırlanma aşamasına geçirilir. Hazırlanan veri de modellemede kullanılır; dolayısıyla bu iki aşama da birbirlerini besleyecek ve geliştirecek şekilde geri bildirimli çalışır. Modelleme tamamlandığında değerlendirme aşamasına geçilir ve bu aşamada da yapılan modelin istatistiksel olarak ne kadar geçerli olduğu, doğru sonuçlar üretip üretmediği ve iş ihtiyacını ne kadar karşılayıp karşılamadığı ölçülür. Geçerliliği kanıtlanan modellerde konuşlandırma aşamasına aktarılır ve analizler için kullanılabilir hale getirilir.

2779128

Cross Industry Standard Process for Data Mining

CRISP-DM’in Aşamaları ve Görevleri

Aşağıdaki görselde CRISP-DM’in aşamalarını ve bu aşamaların içerdiği görevleri görebilirsiniz. Bu yazının konusu olan veri hazırlama işlemi aşağıdaki şekilde Veriyi Anlama ve Veri Hazırlığı aşamalarını kapsar. Bu aşamaların görevlerini incelerseniz hepsinin veriyi hazırlamaya yönelik olduğunu görebilirsiniz.

2779091

CRISP – DM: Veriyi Anlama0a

Veriyi anlama aşaması veri toplama işlemiyle başlar ve veriye aşina olma, veri kalitesi problemlerini belirleme, veriden ilk iç görüleri çıkartma veya ilginç alt setleri belirleyip gizli bilgilerin keşfi için hipotez oluşturma işlemleriyle devam eder. Bu aşamada eldeki ilk verideki ilginç bilgilerin neredeyse %80’i SQL kullanılarak keşfedilebilir. SQL ile keşfedilen bu ilginç bilgiler hipotezler oluşturmamıza ve bunlardan modeller oluşturup veri madenciliği yapmamıza temel oluşturabilir. Bu aşamadaki her bir adımın açıklaması ve içeriği şu şekildedir:

Veriyi Topla: Elde edilen veri setlerini listeleme (lokasyon, elde etmek için kullanılan metod, karşılaşılan problemler ve ulaşılan çözümler)
Veriyi Açıkla: Toplanan verilerin yüzeysel olarak özelliklerinin incelenmesi ve sonuçların raporlanması, elde edilen verinin formatını, türünü, miktarını (örneğin bir tablodaki satır veya kayıt sayısı), değişken adlarını(tablodaki sütunları), ve diğer yüzeysel özelliklerini keşfetme; elde edilen verinin gereklilikleri sağlayıp sağlamadığının değerlendirilmesi

Veriyi Keşfet: lginç Sorgulama, görselleştirme ve raporlama tekniklerini kullanarak veri madenciliği sorularını çözümleme sürecidir. Bu süreç korelasyonları belirleme, her bir değişkenin ve değerlerinin iş terimi olarak anlamlarının anlaşılması, her bir değişken için temel istatistiklerin (örneğin dağılım, ortalama, maksimum, minimum, standart sapma, varyans, ortanca değer, eğiklik (skewness)) hesaplanması, değişkenlerin özelliklerinin detaylıca incelenmesi; dağılım, ikili veya daha fazla değişken arasındaki ilişkiler, önemli alt popülasyonların özellikleri, basit istatistiksel analizler
Veri Kalitesini Doğrula: Özel değerlerin belirlenmesi ve anlamlarının kataloglanması, gerekli olan bütün verileri içeriyor mu? Hata var mı, varsa yüzde kaç?, eksik değişkenlerin ve boş alanların belirlenmesi, eksik verinin anlamı, değişkenlerin anlamlarıyla almış olduğu değerler birbirleriyle örtüşüyor mu? değerlerin yazım kontrolünün yapılması (aynı değerin bazen küçük harfle bazen de büyük harfle başlaması), değerlerin akla yatkınlığının denetlenmesi

CRISP – DM: Veriyi Hazırlama0b

Bu aşama toplanan ilk veriden final veri setini (daha sonradan oluşturacağımız modelleri bu final veri seti besleyecektir) oluşturmak için gereken bütün aktiviteleri kapsar. Bu aktiviteler büyük olasılıkla birçok kez tekrarlanacak ve tekrarlanma biçimleri tamamen probleme özgü olacaktır. Tablo, kayıt ve değişken (veya kolon veya attribute) seçimi ve modelleme araçları için bu verilerin dönüştürülmesi ve temizlenmesi işlemleri aktivitelere örnek olarak verilebilir. Bu aşamadaki her bir adımın açıklaması ve içeriği şu şekildedir:

Veri Seç: Veri seçimi kriterlerinin yeniden gözden geçirilmesi, hangi veri setlerinin kullanılacağına karar verme, ihtiyaç duyulan ek verilerin toplanması (kurum içi ya da kurum dışı), örnekleme tekniklerini kullanmayı gözden geçirme, neden bazı verilerin eklenip bazılarının dışarıda bırakıldığını açıklama
Veriyi Temizle: Gürültüyü düzeltme, silme veya görmezden gelme, özel değerlerle ve anlamlarıyla nasıl ilgilenilmesi gerektiğini kararlaştırma (örneğin medeni durum için 99 değeri), gruplama seviyesi, eksik değerler, aykırı gözlemlerin tespiti
Veriyi İnşa Et: Türetilmiş değişkenler (derived attributes: bu değişkenler mevcut olarak bulunan bir veya daha fazla değişken kullanılarak oluşturulan değişkenlerdir, örneğin area = length * width ), eksik değerlerin nasıl inşaa edileceğini veya nasıl bir yaklaşık değer verileceğini belirleme
Veriyi Entegre Et: Kaynakları entegre etme ve sonuçları depolama (yeni tablolar ve kayıtlar vs), birbirleriyle ilişkili iki veya daha fazla tablonun birleştirilmesi
Veriyi Formatla: Değişkenleri yeniden düzenlemek (bazı araçların değişken sıralamasında bazı şartları vardır, mesela ilk değişkenin birincil anahtar (primary key) olması veya son değişkenin tahmin edilmeye çalışılan değişken olması gibi)

Ölçüm (measurement) Türlerini Hatırlayalım

İstatistikte bazı ölçüm türlerini hatırlamamızda fayda var.

Nitel Ölçümler
Bu ölçümlerin sayısal bir değeri yoktur; bu değişkenlerle sayısal bir hesaplama yapılmaz.

Nominal Ölçüm: ID numaraları, insanların isimleri vb.
Kategorik Ölçüm: Göz rengi, posta kodu vb.
Sıralı(ordinal) Ölçüm: sıralamalar (örneğin bir yiyeceğin lezzetinin 1 ile 10 arasında derecelendirilmesi), rütbeler, puanlar, uzunluk (kısa, orta, uzun)

Nicel Ölçümler
Bu ölçümler sayısal ölçümlerdir ve bu ölçümlerle matematiksel işlemler yapılır. Ayrık ve sürekli olmak üzere iki çeşidi olduğunu bir önceki yazıda görmüştür.

Aralıklı(interval) Ölçüm: tarih aralıkları, sıcaklık aralıkları, IQ puanları vb.
Oran(ratio) Ölçümü: Sıcaklık, uzunluk, zaman, vb.

2779500

Veri Dönüşümü

Bazı veri madenciliği araçlar nominal değerlerle işlem yapabilir; fakat bazı araçlar da tüm alanların numerik olmasını gerektirebilir. Sıralı değerlerde matematiksel işlemler ve/veya karşılaştırmalar (küyüktür, küçüktür gibi) yapabilmek için bu değerleri numerik verilere dönüştürmek gerekiyor. Örneğin üniversite yıl sonu ağırlıklı puanı (GPA) şu şekilde numerik verilere dönüştürülür:

A+  –> 4.0
A-   –> 3.7
B+  –> 3.3
B     –> 3.0

Bu sayede kategorik puanlar numerik değerlere dönüştürüldüğünden matematiksel işlemler yapılabilir.

.

Sürekli Değişkenleri (Continuous Variable) Kesikli Hale Getirme(Ayrıklaştırma: Discretization)

Ayrıklaştırma veya ingilizce adıyla discretization(veya binning) numerik verilerin kategorik karşılıklarına dönüştürülmesi işlemine verilen addır. Örneğin Age değişkeninin değerlerini 20-39, 40-59 ve 60-79 gibi aralıklara gruplama işlemi buna bir örnek olarak verilebilir. Numerik değişkenler genellikle sıklık dağılımlarına göre ayrıklaştırılır. Ayrıca bu işlem verideki gürültüyü ve doğrusalsızlığı (non-linearity) azaltarak tahminleme modelinin kesinliliğini artırabilir. Ve şunu da söylemeden geçmeyelim: bu yöntem aykırı gözlemlerin tespitini, geçersiz veya eksik numerik değerlerin tespitini kolaylaştırır.

Bazı veri madenciliği algoritmaları, örneğin Naive Bayes ve CHAID’ın çoğu versiyonu, ayrık değerler gerektirir. Ayrıca bu işlem sonucunda veri boyutu önemli ölçüde azalabilir ve bu sayede veri sonraki analizler için hazırlanmış olur. Bu yöntem eldeki verinin özetini oluşturmak için son derece kullanışlı ve yararlı bir yöntemdir. İngilizcesi “discretization” dır ve aynı zamanda “binning” olarak da adlandırılır. “Binning” kelimesi Türkçeye “veri gruplama” olarak çevrilebilir.

Discretization veya Binning iki türde olabilir: gözetlenmeyen(unsupervised) veya gözetlenen(supervised)

Gözetlenmeyen(unsupervised) Ayrıklaştırma

Bu yöntem numerik değişkenleri kategorik karşılıklarına gönüştürür fakat bunu yaparken hedef sınıfın (target class) bilgilerini kullanmaz. Eşit genişlikte gruplama ve eşit derinlikte gruplama gözetlenmeyen ayrıklaştırmanın iki metodudur.

Eşit Genişlikte Gruplama (Equal-width Binning)

Bu gruplama yönteminde sürekli bir değişken eşit genişlikteki N aralığa bölünür. Eğer bir değişkenin aldığı en küçük değer ve en büyük değer sırasıyla A ve B ise ve N aralığa bölünmek isteniyorsa genişlik şu formülle hesaplanır: W = (B-A) / N

0d

Eşit genişlikte gruplama yöntemi bazı avantajlara ve dezavantajlara sahip. Uygulanması son derece basit ve kolaydır. Verinin mantıklı bir soyutlamasını oluşturur. Fakat diğer yandan denetlenmeyen (unsupervised) bir yöntem olması, N sayısının ne kadar olması gerektiğinin tam olarak bilinememesi ve aykırı gözlemlere son derece hassas olması dezavantajlarıdır. Örneğin aşağıdaki örnekte bir şirketteki çalışanların maaşlarının bu yöntemle aralıklara bölünmesiyle elde edilen sonucu görebilirsiniz. Bu sonuçta 1,800,000-2,000,000 aralığında bir aykırı gözlem vardır ve maaşların çoğu 0-200,000 aralığında olduğundan pek yararlı bir yöntem olmamıştır.

0e

Eşit Derinlikte(ya da Yükseklikte) Gruplama (Equal-depth Binning)

Bu yöntemde değerler yaklaşık olarak eşit sayıda eleman içeren N aralığa bölünür. Kümelenmeyi önlediği için ve pratikte “neredeyse eşit” yükseklikte gruplama daha sezgisel kesim noktaları verdiğinden özellikle tercih edilir.

Bu yöntemde dikkat edilmesi gereken hususlar:

  • Sık değerleri farklı haznelere (bölmelere) dağıtmayın
  • Özel değerler için ayrı bölmelere oluşturun
  • Okunabilir kesim noktaları belirleyin (örneğin yuvarlanmış sayılar)

Örneğin elimizde sıcaklık verileri olsun:
64 65 68 69 70 71 72 72 75 75 80 81 83 85

Bu verileri eşit derinlikte gruplama yöntemi kullanarak grupladığımızda aşağıdaki sonucu elde ederiz:

0f

Burada eşit yükseklikler 4 olup son grup için değer 2 olmuştur. Aralıkların bir önceki yöntemde olduğu gibi eşit genişlikte olmak zorunda olmadığını belirtelim.

Gözetlenen (Supervised) Ayrıklaştırma

Bu ayrıştırma yöntemi numerik verileri kategorik karşılıklarına dönüştürür ve ayrım noktalarını seçerken hedef sınıfın (target class) bilgisini kullanır. Entropi temelli ayrıştırma bu yöntemin bir örneğidir.

Entropi Temelli Ayrıklaştırma (Entropy Based Discretization)

Entropi kelime anlamı olarak “düzensizlik”, “karışıklık”(impurity) demektir. Bu metot bölme yaklaşımını kullanır. Entropi ( veya bilgi içeriği) sınıf etiketlerine dayanarak hesaplanır. Sezgisel olarak, her bir grubun mümkün olduğunda saf(pure) olabilmesi, yani her bir gruptaki değerlerin aynı sınıf etiketine karşılık gelmesi için, en iyi ayrım noktalarını bulmaya çalışır. Maksimum bilgi kazanımı (information gain) getiren ayrımları bulmakla karakterize edilir.

Entropi hesaplamanın formülü şu şekildedir:

Entropi

Evet, yanlış görmediniz. Entropi hem H ile hem de E ile ifade edilebiliyor.

Entropi ingilizce olarak “impurity” demektir; yani Türkçeye kirlilik ve katışıklık olarak çevirebiliriz. Ancak buradaki kirlilik şu anlama gelmektedir: bir grup içerisinde farklı özelliklere sahip çok fazla veri bulunması, çeşitlilik. Aşağıdaki görselde de görebileceğiniz üzere fazla kirli ve katışık grupların entropisi yüksektir; sıfır kirlilik ve katışıklığa sahip grupların entropisi sıfırdır.

0h4

Entropi hesaplanırken önce tahminlenmeye çalışılan hedef değer için entropi hesaplanır. Daha sonra belirli ayrım noktaları için entropi değeri hesaplanır. En son olarak da bilgi kazanımı (information gain) hesaplanarak en iyi ayrım noktası belirlenir. Şimdi bütün bu adımları bir örnekte açıklayalım.

0gYandaki gibi bir veri setimizin olduğunu düşünelim. Bir sporu yapmanın fahrenayt cinsinden hava sıcaklığına bağlı olarak nasıl değiştiğini belirlemek istiyoruz. Bize en iyi ayrımı veren, yani bir insanın bu söz konusu sporu yapıp yapmayacağını en iyi tahminleyebilen, hava sıcaklığı değeri nedir? Bu sorunun cevabını entropi yöntemini kullanarak hesaplayalım.

İlk adım olarak tahminlemek istediğimiz değişkenin, yani sporu yapıp yapmadığının, entropisini hesaplayalım. Bu veri setinde bu sporu yapan ve yapmayan insanların sayısı aşağıdaki gibidir.

Yes = 9, No = 5

Toplam olarak 14 değer vardır. Entropiyi hesaplarken bu değerlerin yüzdelerine ihtiyacımız var. Y için yüzde değer 9/14 = 0.64 iken N için yüzde değer 5/14 = 0.36’dır.

E (Play) = E(9, 5) = E(0.64, 0.36) = -0.64 x log2(0.64) – 0.36 x log2(0.36) = 0.942

Bu bulduğumuz değer hedef değerin entropisidir. Şimdi bu veri setini diyelim ki 71.5 ve 77 dereceleri için ikiye bölmek istiyoruz. Hangisi daha fazla bilgi kazanımı sağlıyor? Hemen hesaplayalım.

Verimizi 71.5 ayrım noktasıyla ikiye ayıralım. Bu değere eşit bir değer olmadığından bütün değerler ya bundan küçüktür ya da bundan büyüktür. Aşağıdaki tabloda bu değerden küçük ve bu değerden büyük için söz konusu sporu yapma sayılarını görebilirsiniz.

0g1

Bu ayrım noktası için entropiyi şu şekilde hesaplarız:

0h

Bir de farklı bir değer için, mesela 77, entropi hesaplaması yapalım.

0g2

0h1

Şimdi her iki değer için de bilgi kazanımını hespalayalım:

Information Gain = E(S) – E(S,A)

 71.5 için kazanç = 0.942 – 0.939 = 0.003

77 için kazanç     = 0.942 – 0.915  = 0.027

Yukarıdaki hesaplamaya göre veriyi 77 ayrım noktasından ikiye bölersek 71.5 ayrım noktasından ikiye bölmeye kıyasla 9 kat daha fazla bilgi kazanımı sağlarız. Dolayısıyla veriyi 77 den ikiye bölmek daha karlıdır.

Hedeflemek istediğimiz veri setinin entropisini (0.942) hesaplamadan da en iyi ayrımı bulabilirdik; çünkü her bir ayrım noktası için hesapladığımız entropiyi her seferinde sabit bir değer olan 0.942’den çıkartarak bilgi kazanımını bulduğumuz için en küçük entropiye sahip olan ayrım noktası bilgi kazanımını maksimize edecektir. Bu örnekte de 0.915, 0.939’dan daha küçük olduğundan bilgi kazanımını daha çok arttırır.

Entropi metodu mümkün olan bütün ayrımlar için entropi hesaplanması ve bulunan değerlerden en küçüğünün seçilmesine dayanır. 

Bu ayrıklaştırma yönteminin belirli bir durma noktası(kriteri) olması gerekir. En yaygın durma kriteri Minimum Description Length Principle(MDLP) olarak adlandırılan prensibe dayanan bir durma kriteridir. Bu prensip Karar Ağacı ve Naive Bayes algoritmaları için başarılı ayrım noktaları üretmesine rağmen diğer yöntemler için aynı başarıyı gösteremiyor. MDLP’den kısaca şu şekilde bahsedebiliriz:

S: veri setini, A: değişkeni, T: ayrım noktasını gösteriyor olsun. Bu S veri setinin A değişkeni için T ayrım noktasının entropisinin  E (A,T;S) olarak hesaplanacağını yukarıda görmüştük. Bir A değişkeni için, MDLP metodu bütün ayrım olasılıkları içerisinden minimum entropiyi üreten ayrım noktası olan T(a)’yı bulur. Daha sonra bu veri setinin A değişkenini T(a) noktasından ikiye böler ve her bir parça için tekrar bütün ayrım olasılıklarını hesaplayıp içlerinden minimum entropiyi üreten ayrım noktasını bulur. Bunu veriyi sürekli bulduğu ayrım noktasından ikiye bölerek yapar ta ki aşağıdaki koşul sağlanana kadar:

0h3

Bu koşulda N sayısı S’in içindeki veri sayısı, Gain(A; T ; S) = Ent(S) – E(A; T ; S), (A; T ; S) = log2(3^k – 2) – [kEnt(S) – k1Ent(S1) – k2Ent(S2)] ve k,k1 ve k2 S,S1 ve S2’de temsil edilen sınıf sayısıdır.

Bu konuda daha ayrıntılı bilgi için: http://www.cse.yorku.ca/~aan/research/paper/pakdd99.pdf

Ayrıklaştırmada Dikkat Edilmesi Gereken Konular

Gözetlenmeyen yöntemler

Eşit Genişlik yöntemi çok daha kolaydır ve birçok sınıf için uygundur. Eşit olmayan dağılımlar için korkunç derecede hatalı sonuçlar üretebilir.

Eşit Derinlik (yükseklik) yöntemi daha iyi ve kaliteli sonuçlar verir.

Gözetlenen yöntemler

Bu yöntemler sınıflandırma (classification) için çok daha iyi ve uygundur.

Kaynaklar:

  • ‘Data preparation for data mining’, Dorian Pyle, 1999
  •  ‘Data Mining: Concepts and Techniques’, Jiawei Han and Micheline Kamber, 2000
  • http://www.the-modeling-agency.com/crisp-dm.pdf
  •  ‘Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations’, Ian H. Witten and Eibe Frank, 1999
  •  ‘Data Mining: Practical Machine Learning Tools and Techniques second edition’, Ian H. Witten and Eibe Frank, 2005

Veri Madenciliği 2 – Kısa Bir İstatistik Tekrarı

Veri madenciliğine daha fazla girmeden önce istatistik bilgilerimizi tazelememiz gerekiyor. Burada bütün istatistik konularını anlatmam tabii ki imkansız; ancak bazı temel kavramların üzerinden geçmeye çalışacağım.

Herbert George Wells, İngiliz yazar, 1940 yılında şöyle demiş:
“Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write”

Günümüzde bu cümlenin ne kadar geçerli ve doğru olduğuna şahit oluyoruz. E hadi başlayalım o zaman!

Kısa Bir İstatistik Tekrarı

Bir değişken herhangi bir aralıkta veya sonsuzlukta birden fazla değer alabilen miktara verilen isimdir. Örneğin nüfus bir değişkendir çünkü ne sabittir ne de değişmezdir; değeri zamanla değişebilir. İşsizlik oranı bir değişkendir çünkü %0 ile %100 arasında herhangi bir değer alabilir.

Rassal değişken (random variable) her incelendiğinde değişen bilinmez bir değer olarak düşünülebilir. Rassal bir değişken ya ayrık (discrete) ya da sürekli (continuous) olabilir. Bir değişkenin olası değerleri zıplamalar ya da keskin aralar içeriyorsa bu değişken ayrık bir değişkendir. Örneğin, nüfus ayrık bir değişkendir; çünkü değeri her zaman tam sayı olarak ölçülür: 1, 2, 3… Fakat bir değişkenin olası değerleri zıplamalar ya da keskin aralar içermiyorsa bu değişken sürekli bir değişkendir. Örneğin, işsizlik sürekli bir değişkendir; çünkü tam birimlerle ölçülmesi gerekmez: %1.77, %8.99, gibi.

Betimleyici istatistikler (descriptive statistics) bir veri koleksiyonunun özelliklerini nicel (quantitative) terimlerle açıklamak için kullanılır. Betimleyici istatistikler bir veri setini nicel olarak özetlemeyi hedefler. Bazı istatistiki özetler betimleyici analizlerde özellikle yaygındırlar: frekans dağılımı (frequency distribution), merkezi eğilim (central tendency), saçılım (dispersion), birliktelik (association), vb.

Her veri seti belirli değerlerin ne kadar sıklıkta görüldüğüne göre açıklanabilir. İstatistikte, frekans dağılımı bir veya birden fazla değişkenin aldığı değerlerin sıklıklarının tablolaştırılarak sunulmasıdır.

Örneğin aşağıdaki tablo diyelim ki bir şirketin aylara göre hisse başına TL fiyatını göstersin.

SeeThru1408x640

Tek değişkenli frekans dağılımları (univariate frequency distributions) genellikle her bir değerin ne kadar sıklıkla bulunduğunu gösterir. Bir frekans dağılımı isteğe göre gruplanabilir ya da gruplanmayabilir. Küçük veri setleri için gruplanmamış frekans dağılımları daha uygunken büyük veri setleri için gruplanmış frekans dağılımları daha uygundur.

2

3

Merkezi Eğilim (central tendency)

Merkezi eğilim, istatistikte nicel (sayısal) bir verinin “merkezi bir değer” etrafında toplanma yatkınlığını ölçme işlemidir. Bir merkezi eğilim ölçümü bu merkezi değeri tanımlayan birçok yoldan biridir. Merkezi eğilim ölçümünü veren üç önemli betimleyici istatistik vardır:

  • Ortalama (mean)
  • Orta değer (median)
  • Tepe değer (mod)

Ortalama (mean)

Aritmetik ortalama en sık kullanılan ortalama tipidir ve genellikle basitçe “ortalama” olarak ifade edilir. Matematik ve istatistikte aritmetik ortalama (veya basitçe ortalama (mean) ) bir veri setindeki bütün elemanların toplamının eleman sayısına bölümüyle elde edilir. Eğer veri seti bir istatistiki popülasyonsa, ortalama popülasyon ortalaması (population mean) olarak adlandırılır. Eğer veri seti bir örnek (sample) ise, oralama örneklem ortalaması (sample mean) olarak adlandırılır. Eğer bir dizi veriyi

X = (x1, x2, …, xn)

şeklinde ifade edecek olursak örneklem ortalaması x̄ olarak gösterilir. Bir Yunan alfabesi harfi olan μ ise komple popülasyonun ortalamasını gösterir.

Orta Değer (median)

İstatistikte, bir örneklemin ya da popülasyonun daha büyük değerlere sahip yarısını daha küçük değerlere sahip öbür yarısından ayırmak için kullanılan sayısal bir değerdir. Sınırlı bir numaralar serisinin orta değeri, serinin küçükten büyüye sıralandıktan sonra tam ortasındaki değerin alınmasıyla bulunabilir. Eğer bu seri çift sayıda değer içeriyorsa o zaman orta kısımda bir değer bulunmayacaktır. Bu durumda ortadaki iki değerin ortalaması orta değer olarak alınır. Örneğin yukarıdaki hisse fiyatlarını artan şekilde sıralayacak olursak:

67.05, 66.89, 67.45, 67.45, 68.39, 68.39, 70.10

orta değer 67.45 olacaktır.

Çekreklikler Q1 ve Q3 (Quartiles)

Çeyreklikleri bulmak için veri setini küçükten büyüğe sıralarız ve veri setinin orta değerini (buna global orta değer diyelim) bu sıra üzerinde yerleştiririz. Birinci çeyrek (first quartile – Q1), global orta değerin solunda kalan (yani ondan küçük olan) değerlerin orta değeridir. Üçüncü çeyrek ise, global orta değerin sağında kalan (yani ondan büyük olan) değerlerin orta değeridir.

Tepe Değer (mod)

İstatistikte tepe değer bir veri listesinde en çok gözlemlenen değerdir. Tepe değer tek bir değer olmak zorunda değilidir; aynı sıklığa sahip birden fazla değer olabilir. Gene hisse fiyatlarımızı artan şekilde sıralarsak,

67.05, 66.89, 67.45, 67.45, 68.39, 68.39, 70.10

en çok gözlemlenen iki tepe değer vardır: 67.45 ve 68.39. Bu yüzden bu veri setinin tepe değeri tek değil iki tanedir. Bu veri setine çift tepe değerli (bimodal) denir. Bir popülasyon ya da örneğin bir, iki, veya ikiden fazla tepe değeri olabilir.

İstatistiki Saçılım (Statistical Dispersion)

İstatistikte istatistiki saçılım (ayrıca istatistiki değişkenlik, veya çeşitlilik) olasılık dağılımındaki yada değişkenlikteki dağınıklık (yayılım) olarak adlandırılır. Özellikle, bir saçılımlık ölçümü veri setindeki değerlerin ne kadar dağınık olduğunu ölçümlemede kullanılır. Yaygın olarak kullanılan istatistiki saçılım ölçümü şunlardır:

  • Varyans (variance)
  • Standart Sapma (standard deviation)

Saçılımlık merkezi yatkınlıkla birlikte dağılımın en çok kullanılan özellikleridir.

Varyans (variance)

İstatistikte varyans, rassal bir değişkenin veya dağılımın her bir değerinin ortalama değerden farkının karesinin ortalaması olarak ifade edilir. Bu yüzden varyans verinin ortalama değerden ne kadar saptığının bir ölçüsüdür.

Eğer rassal bir değişken olan X’in beklenen değeri (expected value = mean) E[X]=μ ise, X’in varyansı:

4

formulü ile ifade edilir.

Varyansın özellikleri

  • Varyans her zaman pozitif bir değerdir; çünkü farkların kareleri ya sıfırdır ya da sıfırdan büyüktür.
  • Sabit bir değerin varyansı sıfırdır, ve bir veri setindeki bir değişkenin varyansı eğer bütün elemanlar aynı değere sahip ise sıfırdır.
    Var(a) = 0
  • Bir veri setindeki her bir veri sabit bir sayı (a) kadar artırılır veya azaltılırsa veri setinin varyansı değişmez.
    Var(X + a) = Var(X)
  • Bir veri setindeki her bir veri sabit bir kat sayıyla çarpılırsa veri setinin varyansı eski varyansının, kat sayının karesiyle çarpımına eşittir.
    5

Örneklem Varyansı (Sample Variabnce)

Eğer bir X rassal değişkeninin n tane değerine sahipsek, örneklem varyansı popülasyon varyansını ölçümlemek için kullanılabilir.

X = (x1, x2, x3, …, xn)

Örneklem varyansı şu şekilde hesaplanır:

6

Formüldeki paydada olan (n-1) değeri varyans hesaplamasında “serbestlik derecesi” (degree of freedom) olarak adlandırılır.

Yukarıdaki örnek verimizin örneklem varyansı (sample variance) şu şekilde hesaplanır:

7

Standart Sapma (Standard Deviation)

İstatistikte, rassal bir değişkenin veya dağılımın standart sapması o değişkenin varyansının kareköküne eşittir.

8

Yani, standart sapma σ (sigma) (X − μ)2 değerlerinin ortalamasının kareköküdür.

 Gene örneğimize dönecek olursak standart sapmamız:

9

 olarak hesaplanır.

Ortalama Mutlak Sapma (Mean Absolute Deviation)

Bir X değişkeninin değerlerinin ortalama değerden ortalama olarak ne kadar saptıkları şu şekilde ölçülür:

10

Bu değer her zaman sıfırdır. Pozitif ve negatif sapmalar birbirlerini götürürler ve toplam her zaman sıfır olur. Bu yüzden saçılımı (dispersion) ölçmeye bir yararı yoktur.

Ortalama Mutlak Sapma ise şu şekilde hesaplanır:

11

Farkların mutlak değeri her zaman pozitif olacağından bu değer her zaman sıfır olmak zorunda değildir.

Mutlak değer almaya alternatif olarak farkların karesi de alınabilir ve bu yöntemle elde edilen sapmaya “kareli ortalama sapması” (mean squared deviation – MSD) denir:

12

Farkların karesini aldığımız için tekrar aynı ölçü birimine dönmek için bir de karekökünü aldığımızda bu sapmaya da “kareli ortalamaların kökü sapması” (root mean squared deviation – RMSD) denir:

13

İstatistiksel nedenlerden ötürü, RMSD yerine onun çok hafifçe değiştirilmiş versiyonu olan standart sapma (Sx) ölçümlerde çok daha fazla kullanılır.

14

15

Birliktelik (association)

İki değişkenli istatistik (bivariate statistics) iki değişkenin, birinin diğerine sebep olduğunu ima etmeksizin, birbirleriyle nasıl ilişkili olduklarını incelemek için kullanılabilir.

Çok değişkenli istatistik (multivariate statistics) ikiden fazla değişkenin, birinin diğerlerine sebep olduğunu ima etmeksiniz, birbirleriyle nasıl bir ilişki içerisinde olduğunu incelemek için kullanılabilir.

İki değişkenli ve çok değişkenli istatistiklerin ölçülmesinde iki yaygın ölçümleme vardır:

  • Kovaryans (covariance)
  • Korelasyon Katsayısı (correlation coefficient)

İki değişkenli istatistik 

Aşağıdaki şekilde (a) güçlü ve pozitif korelasyon, (b) sıfır korelasyon, (c) a’ya göre daha az güçlü pozitif korelasyon, (d) güçlü ve negatif korelasyon, ve (e) d’ye göre daha az güçlü negative korelasyona örnektir.

16

İki rassal değişken olan X ve Y için;  17   ve 18 olmak üzere kovaryans:

19

olarak hesaplanır.

Cov (X, Y) negatif, sıfır veya pozitif olabilir. Sıfır kovaryana sahip iki değişken ilişkisiz (uncorrelated) veya bağımsız (independent) olarak ifade edilir.

Eğer X ve Y birbirinden bağımsızsa o zaman kovaryansları daima sıfırdır; ancak her kovaryansı sıfır olan değişkenler birinden daima bağımsız olmak zorunda değildirler.

Eğer X ve Y gerçek değerli rassal değişkenler ise ve a ve b sayısaları sabit (rassal olmayan) birer sayıysa o zaman aşağıdaki formüller kovaryans formülünden türetilebilir:

20

Gene aynı şekilde eğer X ve Y gerçek değerli rassal değişkenler ise ve a ve b sayısaları sabit (rassal olmayan) birer sayıysa o zaman aşağıdaki formüller varyans ve kovaryans formüllerinden türetilebilir:

21

İlişkisiz rassal değişkenlerin toplamlarının varyansı, ayrı ayrı varyanslarının toplamına eşittir:

22

Çünkü, eğer X ve Y ilişkisizse kovaryansları 0’dır.

Örneklem Kovaryansı

Kovaryans iki değişken olan X ve Y’nin değerlerinin birbirleriyle ne kadar yakın bir ilişkide değiştiklerinin bir ölçüsüdür. Popülasyon kovaryansı örneklem kovaryansı ile tahmin edilebilir. Örneklem kovaryansı şu şekilde hesaplanır:

23

Korelasyon Katsayısı (correlation coefficient)

Kovaryansın dezavantajı büyüklüğünün (magnitude) kolayca yorumlanamamasıdır; çünkü kovaryans X ve Y değişkenlerinin ölçü birimlerine bağlıdır. Ortalama değerden sapmaları standardize ederek bu dezavantajı gideren ve bu yüzden daha sık kullanılan ölçüm korelasyon katsayısı olarak adlandırılır.

24

Korelasyon katsayısı simetriktir, yani:

25

Örneklem korelasyon katsayısı şu şekilde hesaplanır:

26

Korelasyon katsasının değeri -1 ile +1 arasında (-1 ve +1 de dahil) bir değerdir.

  • rx,y= 0 ise X ve Y ilişkisizdir (uncorrelated)
  • rx,y= 1 ise X ve Y doğru yönde tamamen ilişkilidir. Biri artarken diğeri de kesinlikle artar veya biri azalırken diğeri de kesinlikle azalır.
  • rx,y= -1 ise X ve Y ters yönde tamamen ilişkilidir. Biri artarken diğeri kesinlikle azalır.

 

Parametre ve İstatistik

Bir parametre (parameter) popülasyonu betimleyen bir sayıdır. Bir parametre sabit bir sayıdır, ama pratikte bu değeri bilmeyiz.

İstatistik (statistic) ise bir örneklemi betimleyen bir sayıdır. Bir istatistiğin değeri örneklemden elde edilir; fakat aynı popülasyonun farklı örneklemleri için farklı değerler elde edilebilir.

İstatistiği (statistic) sıklıkla bilinmeyen bir parametreyi hesaplamak için kullanırız.

Örnek

Ülke çapında rastgele seçilen 2500 yetişkine aşağıdaki ifadeye katılıp katılmadığı soruluyor:

“Yeni kıyafetler almayı seviyorum, fakat alışveriş yapmak çoğunlukla moral bozucu ve çok zaman alıcı”

Diyelim ki bu yetişkinlerden 1650’si bu ifadeye katılıyor.

Örneklemin bu ifadeye katılan insanlarının oranı (proporsiyonu):

27

28= .66 bir istatistiktir (statistic). Buna eş gelen parametre (P) ise bütün ülke nüfusundaki bu ifadeye katılan insanların proporsiyonudur. P parametresinin değerini bilmiyoruz, bu yüzden 28  istatistiğinden bu parametreyi hesaplamaya çalışıyoruz.

Bu araştırmayı yapan şirketin tekrarlan 2500 insandan oluşan rastgele bir örnekleme yaptığını düşünelim. Bu yeni örneklem farklı insanlardan oluşmuş olacak. Neredeyse kesin bir olasılıkla bu örneklemdeki ifadeye katılan insanların sayısı 1650 olmayacak. Yani 28 ’nin değeri örneklemden örnekleme değişecek.

Rastgele seçimin ilk avantajı yanlılığı(bias) elimine etmesidir. İkinci avantajı ise eğer aynı popülasyondan aynı boyutta birçok örneklem oluşturursak, örneklemler arasındaki varyasyon tahmin edilebilir bir örüntü oluşturacaktır. Bütün istatisksel çıkarımlar tek bir fikir üzerinde toplanır: bir prosedürün ne kadar güvenilir olduğunu görmek için, onu çok kere tekrarlarsak ne olacağını sormak.

Örneklem Dağılımı

Diyelim ki ülke çapındaki tüm yetişkinlerin %60’ı yukarıdaki alışverişle ilgili olan ifadeye katılıyor. Yani P = 0.6 (parametre).

Bu popülasyondan, 100 kişiden oluşan basit rastgele örnekleme (simple random sampling) yaptığımızı düşünelim. Ve bu örneklemdeki ifadeye katılan insanların oranını (28, istatistik) popülasyonun bu parametresini hesaplamada kullanalım.

28’nin dağılımı ne olur?

Bu soruyu cevaplandırmak için, bu popülasyondan her seferinde farklı 100 kişi seçerek bir sürü örneklem oluşturmamız gerekir.

Her bir örneklem için örneklem istatistiği 28 ’yi hesaplamamız ve bu değerlerden oluşan bir histogram yapmamız gerekir.

Oluşan dağılımın şeklini, merkezini, yayılımını, aykırı gözlemlerini ve diğer sapmalarını gözlemleyelim.

Çok sayıda basit rastgele örneklemin sonuçları düzenli bir örüntüye sahiptir.

Mesela aynı popülasyondan 100 kişiden oluşan 1000 örnekleme yaptığımızı düşünelim. Bu örneklemlerinin oranlarının dağılımı aşağıdaki gibi olacaktır:

29

Bir istatistiğin örneklem dağılımı (sampling distribution) aynı popülasyondan aynı boyuttaki bütün olası örneklemlerden elde edilen istatistiklerin dağılımıdır.

Normal Dağılım (Normal Distribution)

Normal olarak adlandırılan eğriler simetriktir, tepe noktalıdır ve çan şeklindedir. Normal eğriler normal dağılımları açıklarlar.

30

Belirli bir normal dağılım için Kesin yoğunluk eğrisi (exact density curve) ortalaması ve standart sapması verilerek açıklanabilir. Ortalama değer (mean) simetrik bir eğrinin tam ortasındaki değerdir ve bu değer aynı zamanda orta değerdir (median). Standart sapma ise normal eğrinin ne kadar yayıldığını gösterir.

31

Standart Normal Dağılım (standard normal distribution) ortalaması 0 olan ve standart sapması 1 olan bir normal dağılım çeşididir.

Eğer bir değişken olan X in ortalaması m ve standart sapması s is ve normal dağılıma sahipse, standardize edilmiş olan

32

değişkeni standart normal dağılıma sahiptir.

Standart Normal Tablo ise z değerine karşılık gelen eğri altındaki alanı verir.

3

Bir örnekle açıklayalım.

Stok endeklerinin yıllık getiri oranı (annual rate of return) yaklaşık olarak normal bir dağılıma sahiptir. 1954’ten beri Standard & Poor’s 500 stok endeksi yıllık ortalama %15 getiri oranına sahip ve standart sapması da %16.5. Bu normal dağılımı uzun bir zaman boyunca yıllık getiri oranlarının dağılımı olarak alalım. Eğer endekslerin getiri oranı sıfırın altında ise market düşüşte demektir. Buna göre marketin düşüşte olduğu yılların oranını bulabilir miyiz?

Problemi şu şekilde ifade edebiliriz:

Yıllık getiri oranını x olarak ifade edelim. X değişkeni ortalaması 12 ve standart sapması 16.5 olan normal bir dağılıma sahip olacaktır. Bizden istenen x değişkeninin 0’dan düşük olduğu yılların tüm yıllara oranı: x < 0

Normalleştirme:

X değişkenini standart normal z skoruna dönüştürmek için normalleştirmeyi bulmak istediğimiz değerden (0’dan) ortalama değeri (12) çıkartıp sonucu standart sapmaya bölerek (16.5) yaparız:

n

Aşağıdaki şekilde bu değerler için normal dağılımı ve bu z skoru için istenilen alanı görebilirsiniz:

b

Z Tablosundan -0.73 değerine bakacak olursak değerin 0.2327 olduğunu görürüz. Yani bu demek oluyor ki bu z değerinin solunda kalan (yani bu değerden küçük olan) değerlerin toplam dağılım içindeki oranı 0.2327. Yani marketin düşüşte olduğu zamanların oranı %23.27’dir.

Peki yıllık getiri oranlarının %12 ile %50 arasında olduğu yılların oranı nedir?

c

Dağılımın şeklini çizelim:

e

Z’nin 0 ile 2.3 değerleri için grafiğin altında kalan alan (mavi bölge), z’nin 2.3’ten küçük olduğu alanlardan z’nin 0’dan küçük olduğu alanin çıkartırlmasıyla bulunabilir.

0.9893 – 0.50 = 0.4893

Şimdiye kadar, örneklem tahminlerini (estimator) popülasyon tahminlerini (estimator) belirlemek için kullandık:

f

Bu tahminleyiciler bazı özelliklere sahip.

İkisi de eğilimsiz (ön yargısız, unbiased) tahminleyicidir. Eğilimsiz bir tahminleyicinin ortalama değeri tahminlemeye çalıştığı parametreye eşittir.

Diyelim ki bir parametreyi hesaplamaya çalışıyoruz ve bunun için bir güven aralığı (confidence interval) oluşturmaya çalışıyoruz. Bu parametreyi örneklem verisinden tahminleyebileceğimizi varsayalım. Bu bilgiyi kullanarak bir güvenlik aralığı oluşturabiliriz.

Bir örnekle açıklayalım.

Amerikan ekonomisinde “community bank” olarak adlandırılan bankalar var. Bu bankalar 1 milyar dolardan az bir varlığa sahiptir. Bu bankalardan Amerika’da yaklaşık olarak 7500 adet bulunmakta. Birçok endüstri çalışmasında bu bankalar 1 milyar dolardan fazla varlığa sahip olan bankalardan ayrı olarak Kabul edilir. Bir milyar dolardan daha fazla varlığa sahip olan bankalar “large institutions” olarak adlandırılır. Amerikan Bankalar Birliği Konseyi yıllık bir “community bank” anketi yapmakta. En son çalışmada örneklem olarak kullanılan 110 bankanın ortalama varlığı  = 220 milyon dolar olarak hesaplanıyor. Amerika’daki bütün “community bank”ların ortalama varlığı, m, için ne söyleyebiliriz?

Örneklem ortalaması olan 555, popülasyon ortalaması olan 5555 (mü diye okunur)’yü tahminlemede kullanılabilir.

Büyük sayılar yasası diyor ki örneklemin boyutu arttıkça örneklem ortalaması popülasyonun ortalamasına yaklaşır.

Bu yüzden, örneklem boyutu olan 110 bütün “community bank”ların ortalamasını tahminlemek için mantıklı gözüküyor. Ama bu tahminleme ne kadar güvenilir?

Değişkenliğini belirtmeksizin yapılan bir tahminleme çok değerli olmayacaktır. Bir tahminlemenin değişkenliği örneklem dağılımlarına bakılarak cevaplanır.

Merkezi Limit Teorem’ine (Central Limit Theorem) göre:

Eğer ülkedeki bütün “community bank”ların varlık ortalaması 5555 ve standart sapması 10 ise, boyutu 110 olan çok sayıda örneklemenin ortalama değeri şu dağılıma sahip olacaktır:

g

Bu yüzden, merkezi limit teoremine göre, tekrarlanan 110 elemanlı örneklemlerin ortalama değerleri yaklaşık olarak normaldir, merkezi bilinmeyen popülasyon ortalaması olan m’dür, standart sapması da

 h

milyon dolardır.

Kaynaklar:

http://faculty.elgin.edu/dkernler/statistics/ch03/

https://onlinecourses.science.psu.edu/stat100/

Veri Madenciliği 1 – Veri Madenciliğine Giriş 101

Motivasyon: “Necessity is the Mother of Invention”

Otomatize edilmiş veri toplama araçları ve “olgunlaşmış” veri tabanları; veri tabanlarında, veri ambarlarında ve diğer bilgi depolama alanlarında depolanmış durumda olan çok büyük miktarda veriye sebep oldu. Özellikle dijital medyada kaydedilen ve saklanan verinin boyutu olağan üstü bir şekilde arttı ve git gide de artıyor. Yılda 2 exabite(10^18)’ın üzerinde veri üretiyoruz. Sabit bir fiyattan depolama kapasitesi her 9 ayda bir ikiye katlanıyor. Verinin içinde boğuluyoruz ama bilgi (knowledge) için can atıyoruz.

W.H. Auden’in dediği gibi:

“The greatest problem of today is how to teach people to ignore the irrelevant, how to refuse to know things, before they are suffocated. For too many facts are as bad as none at all.”

Çözüm ise veri ambarı (data warehousing) ve veri madenciliği (data mining).

 1                                                    2

Bazı Büyük Veri (Big Data) Örnekleri

Avrupa’da Very Long Baseline Interferomerty (VLBI) olarak adlandırılan ve radyo astronomide kullanılan bir gök bilimsel interferometre var. VLBI astronomik bir radyo(sinyal) kaynağından gelen sinyalleri, mesela quasar (galaksi dışındaki yıldızımsı gök cisimleri), dünyadaki birden çok radyo teleskop aracılığıyla topluyor ve kaydediyor. VLBI’de kullanılan toplam 16 teleskop var ve bu teleskopların her biri 1 Gigabit/saniye gibi son derece yüksek hızda ve boyutlarda veri üretiyor. Bu verinin depolanması ve analiz edilmesi ne kadar büyük bir problem değil mi?

AT&T her gün milyarlarca arama isteği işliyor. Bu o kadar çok veriye sebep oluyor ki bütün veriler depolanamıyor ve depolanamadığı için de analizler “akan veri”(streaming data) üzerinden yapılmak zorunda. (on the fly).

Alexa internet arşivinde 7 yıllık veri bulunuyor ve bu verinin boyutu 500 Terabyte civarlarında.

Google hergün 4 milyarın üzerinde arama isteğini alıyor ve bu da bir sürü 100 Terabyte demek oluyor.

Internat Archive (www.archive.org) neredeyse 300 terabytle’lık veriye sahip.

Dünyadaki veritabanlarında depolanan veri miktarı her 20 ayda bir iki katına çıkıyor. Diğer büyüme oranları ise bundan daha fazla. Bu verilerden çok küçük bir miktarı insanlar tarafından inceleniyor. Bu yüzden böylesine devasa verilerden anlamlar çıkarmak için Knowledge Discovery’ye ihtiyaç duyuluyor.

Jerome Friedman diyor ki:

“Verinin boyutu her 10 katına çıktığında onu analiz etme biçimimizi tamamen yeniden şekillendirmek zorundayız”

Veri Madenciliği

Veri madenciliği veri tabanı sorgularından (database query) farklıdır. Geleneksel analizde, “X ürününün satışları Kasım ayında arttı mı?”, “X ürününün satışları Y ürününde bir promosyondan dolayı düştü mü?” gibi analizler yaparken veri madenciliğinde ise “X ürününün satışını belirleyen faktörler nelerdir?” gibi daha karmaşık ve sonuç odaklı analizler yaparsınız.

3

  Aristotle Onansis: “The key in business is to know something that nobody else knows.”

 

 

        Sir Isaiah Berlin: “To understand is to perceive patterns.4

Örnek Bir Uygulama

Diyelim ki X kişisi Amazon.com’dan bir kitap aldı.

Görev: Bu kişiye almaya yatkın olabileceği başka kitaplar öner.

Amazon kitap satın alımları üzerinden bir kümeleme (clustering) işlemi yapıyor:

“Advance in Knowledge Discovery and Data Mining” kitabını alan müşteriler ayrıca “Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations” kitabını da aldı.

Öneri sistemleri son derece başarılıdır.

5

Veri Madenciliği Nedir?

Veri tabanında bilgi keşfi (Knowledge Discovery in Databases-KDD) verideki:

  • üstü kapalı (saklı)
  • geçerli (bulunan örüntüler yeni veriler üzerinde de geçerli olacak şekilde)
  • özgün (beklenen değerlere kıyasla)
  • potansiyel olarak kullanışlı (başarılı aksiyonlara neden olabilecek)
  • anlaşılabilir (insanlar açısından)

örüntülerin (pattern) bulunması ve tanımlanması olarak tanımlanabilecek, basit olmayan bir süreçtir.

Veri madenciliği, KDD’nin yalnızca bir adımıdır.

Veri madenciliği için bazı alternatif terimler kullanılabilir:

  • Knowledge discovery (mining) in databases (KDD),
  • Knowledge extraction
  • Data/patterns analysis
  • Data archeology
  • Data dredging
  • Information harvesting
  • Business intellingece, etc.

 

KDD Süreci

Veri Madenciliği ve Bilgi Keşfi (Knowledge Discovery – KD) süreci bazı adımlardan oluşur. Bu adımlar şu şekilde özetlenebilir:

  • Veri Temizliği (data cleaning): eksik değerlerin, gürültülü(noisy) verinin ve tutarsız(çelişkili) verinin temizlenmesi sürecidir.
  • Veri Entegrasyonu (Data integration): Birden fazla veri kaynağından alınan verilerin birleştirilmesi sürecidir.
  • Veri Seçimi (data selection): Yapılacak olan analize uygun(alakalı) verilerin seçilmesi sürecidir.
  • Veri Dönüşümü (data transformation): Veriyi toplama (örneğin günlük satışları haftalık ya da aylık satışlara dönüştürme), veya genelleştirme (sokağı şehire; yaşı genç, orta, ve yaşlıya dönüştürme) gibi işlemler sürecidir.
  • Veri Madenciliği (data mining): Elde edilen veriye akıllı algoritmalar uygulayarak örüntüleri (patterns) keşfetme sürecidir.
  • Örüntü Değerlendirme (pattern evaluation): Elde edilen örüntülerin değerlendirilmesi ve hipotezlerin geçerliliğinin test edilmesi sürecidir.
  • Bilgi Sunumu (knowledge presentation): Bulunan bilgileri (knowledge) görselleştirme (visualisation) ve sunum (representation) tekniklerini kullanarak kullanıcılara sunma sürecidir.

6

Bir KDD sürecinin %60-80 gibi bir dilimi yalnızca veriyi hazırlamak için harcanırken geriye kalan %20’lik kısmı veri madenciliği için kullanılır.

Bir veri madenciliği projesi daima verinin geleneksel sorgulama araçları (traditional query tools) ile analizinden başlamalıdır. İlginç bilgilerin %80’i SQL kullanılarak çıkartılabilir. Örneğin “Her ay kaç tane işlem 15 numaralı ürünü içeriyor?” ve “Mertricks tarafından alınan bütün ürünleri bana göster” gibi. Geriye kalan %20’lik kısmının keşfi ise ileri tekniklerin kullanımını gerektirir. Örneğin “hangi ürünler sık olarak birlikte alınıyor?” ve “müşterilerimi nasıl sınıflandırmalıyım ki gelecekte kredi başvurusu yaparlarsa kime kredi verip kime vermemem gerektiğini bileyim” gibi.

İstatistik, Otomatik Öğrenme (Machine Learning) ve Veri Madenciliği

İstatistik daha çok teori odaklıdır ve hipotezlerin test edilmesine (hypotheses testing) odaklanır.

Otomatik Öğrenme, daha deneyimseldir (heuristic) ve öğrenme ajanının performansını iyileştirmeye odaklanır. Aynı zamanda robotik (robotics) ve gerçek zamanlı öğrenme (real-time learning) gibi alanları da kapsar ama bu alanlar veri madenciliği dışındaki alanlarıdır.

Veri madenciliği ve bilgi keşfi, teoriyi(istatistik) ve deneyimi(otomatik öğrenme) birleştirir ve bilgi keşfinin bütün süreçleri olan veri temizliği, öğrenme, entegrasyon ve görselleştirme alanlarını içerir.

Bu kavramların arasındaki sınırlar son derece belirsizdir.

Veri madenciliği bazen “ikincil veri analizi” olarak adlandırılır. Veri madenciliğinde kullanılan algoritmaların çoğu istatistikçiler ve veri madencileri tarafından ortaklaşa kullanılır. Veri madenciliği örüntü tespitini (pattern detection) hedeflerken istatistik bulunan örüntülerin gerçekliğini belirlemeyi hedefler. Örneğin, aynı hastalıktan muzdarip olan insanlar kümesinin bulunması, fakat bu hastalığın tamamen rastgele olup olmadığının tespiti.

Rhine Paradoksu

Rhine Paradoksu bir bilimsel araştırmanın nasıl yapılmaması gerektiğinin harika bir örneği.

David Rhine bir parapsikologdu. 1950 yılında bir hipotez geliştirdi ve hipotezi de şuydu: Bazı insanlar 6. Hisse (Extra-Sensory Percetion-ESP) sahiptir.

Bunu test etmek için bir deney tasarladı ve deneklere 10 adet kartın arka yüzlerinde kırmızı mı yoksa mavi renk mi olduğunu tahmin etmelerini istedi. Deneyinin sonucunda gördü ki neredeyse her 1000 kişiden 1’i 6. hisse sahipti, çünkü 10 kartın 10’unun da rengini doğru bilmişti!

Daha sonra bu testi geçen insanlara 6. Hislerinin olduğunu söyledi ve onları tekrar test etmek için farklı bir deneye davet etti. Fakat bu sefer fark etti ki bu deneyde deneklerin neredeyse hepsi 6. Hislerini kaybetmişti. Ve testi nasıl mı sonuçlandırdı?

“İnsanlara 6. Hisleri olduğunu söylememelisiniz; çünkü bu 6. Hislerini kaybetmelerine neden oluyor.”

Peki gerçekte ne oldu?

Kırmızı veya mavi renklerden oluşan 10 kartın tam olaram 1024(2^10) kombinasyonu vardır. Bu yüzden her 1000 kişiden 1’inin 10 kartın rengini doğru tahmin etme olasılığı 1000/1024 = 0.98 yani %98’dir! Sanırım daha fazla açıklamaya gerek yok 🙂

Veri Madenciliği Uygulamaları

Pazar analizi ve yönetimi

  • Hedef kitle seçimi, müşteri ilişkileri yönetimi, pazar basket analizi, çapraz satış, pazar segmentasyonu, vb.
  • Aynı karakteristiklere sahip olan (örneğin ilgi alanı, gelir seviyesi, harcama alışkanlıkları, vs.) müşterileri bulma ve kümeleme
  • Zaman boyunca müşterilerin satın alma örüntülerini (purchasing pattern) belirleme

Risk analizi ve yönetimi

  • Tahminleme (forecasting), müşteri tutumu (customer retention), kalite kontrolü, rekabet analizi, kredi puanlama

Sahtekarlık tespiti ve yönetimi

Geçmişte gerçekleştirilen sahtekarlık işlemlerini kullanarak model geliştirme ve belirli davranışlarda bulunan müşterileri önceden tahminleme.

  • Araba sigortası: sigorta parası almak için “sahte olarak” kaza yapan insanların tespiti
  • Kara para aklama: şüpheli para transferlerini tespit etme
  • Telefon araması modeli: aramanın hedefi, süresi, günü, saati, vs. Beklenen normlardan sapan örüntülerin analizi.

British Telecom’un başına bununla ilgili bir olay gelmiş. Olayda, belirli kişilerden oluşan bir takım grup sürekli mobil telefonlarından grup içindeki kişileri arayarak birkaç milyon dolarlık bir kaçakçılık gerçekleştirmişler. Mesela, hapisanedeki mahkumlardan biri dışarıdaki bir arkadaşına terk edilmiş bir ev için telefon hattı kurdurtuyor. Aramalar mahkumun 3 eyalet ötedeki kız arkadaşına yönlendiriliyor. Bu sayede telefon şirketi bunu 90 gün sonra fark edinceye kadar bedava telefon görüşmesi yapıyorlar.

Veri Madenciliğinin Görevleri

Burada veri madenciliğinin görevlerinden kısaca bahsedeceğim. Çok ayrıntıya inmiyorum çünkü gelecek yazılarda hepsini ayrıntılı olarak ele alacağım.

Birliktelik (association)

Karşılıklı ilişki (correlation) ve nedensellik (causality)

Çok boyutlu veya tek boyutlu birlikteliklerin tespit edilmesi. Örneğin;

yaş(X,”20..29″) ^ gelir(X,”20..29K”) –> satın_alır(X, “PC”)
[support = %2, confidence = %60]*

veya

satın_alır(T, “bilgisayar”) –> satın_alır(x, “software”)
[support = %1, confidence = %75]*

*support ve confidence kavramları daha sonraki yazılarda açıklanacaktır.

Sınıflandırma (classification) ve Tahminleme (prediction)

Sınıfları veya konseptleri tanımlayan ve ayrıştıran modellerin(fonksiyonları) bulunması. Örneğin, iklime göre ülkeleri sınıflandırma, kilometre başına yakıt tüketimine göre arabaları sınıflandırma, vb.

Sunum: karar ağacı (decision tree), sınıflandırma kuralı, yapay sinir ağları (neural network)

Tahminleme: bazı bilinmeyen veya eksik olan sayısal verilerin tahminlenmesi.

Aşağıdaki tablo bir “öğretici küme” (training set) örneğini temsil ediyor. Bu veri üzerinde karar ağacı sınıflandırma algoritmasını uyguladığımızı düşünelim.

8

Elde edeceğimiz sonuç aşağıdaki gibi bir sonuç olacak. Yani aşağıdaki sonuçlar diyor ki yaş faktörü bilgisayar alınmasındaki en önemli faktör. Yaşı 31..40 arasında olanların hepsi bilgisayar alıyor. Yaşı 30’dan küçük olan insanlar için ikinci bir ayrım yapılıyor ve öğrenci olup olmadığı sorgulanıyor. Eğer öğrenciyse bilgisayar alıyor; öğrenci değilse bilgisayar almıyor. Yaşı 40’tan büyük olan insanlar ise kredi derecelendirmelerine göre ayrıma uğratılıyor. Kredi derecesi mükemmel olanlar bilgisayar almazken normal düzeyde olanlar bilgisayar alıyor.

7

Küme Analizi (Cluster analysis)

Sınıflandırma’nın aksine küme analizinde kümelerin etiketleri (label) bilinmiyor. Küme analizi genellikle sınıfların belirlenmesi ve tanımlanması için kullanılıyor. Kümeleme (clustering) işlemi şu prensip ile çalışıyor: bir sınıf (class) içindeki benzerlikleri maksimize et ve sınıflar arasındaki benzerliği minimize et.9

 

Aykırı Gözlem (Outlier) Tespiti   

Verinin genel davranışına uymayan örneklere aykırı gözlem (outlier) adı veriliyor. Bunlar gürültü (noise) veya istisna (exception) olarak düşünülebilir; fakat sahtekarlık gibi nadir olayların (aykırılıkların) analizinde oldukça kullanışlıdırlar.

10628591_10152636063464277_8277957579391294586_n

Trend ve değişim (evrim, evolution) Analizi

Trend ve sapma analizleri: regresyon analizi (regression analysis)

Sıraları örüntü madenciliği (sequential pattern mining), dönemsellik analizi

Benzerlik tabanlı analiz

Görselleştirmenin Gücü

Tüm işlemler sonucu elde ettiğimiz sonuçları görselleştirmemiz gerekmektedir. Aşağıda görselleştirmenin birkaç güzel örneğini görebilirsiniz.

11

12

13

10

Kaynaklar:

*Data Mining: Concepts and Techniques. Jiawei Han and Micheline Kamber. Morgan Kaufmann Publishers
*Data Mining: Practical Machine learning tools with JAVA implementations. Ian H. Witten and Eibe Frank. Morgan Kaufmann Publishers

Şimdilik Hoşça Kal Growth Hacking! Merhaba Veri Madenciliği!

Growth Hacking Konusunu Şimdilik Sonlandırıyoruz

Growth Hacking konusu hakkında birçok yazı paylaşmıştım sizinle. Artık Growth Hacking konusunu sonlandırıyoruz. Ama şimdilik. Bu konuyla ilgili son 7gelişmeler, trendler ve uygulamalarla ilgili yazıları paylaşmaya devam edeceğim. Yani yazılarda anlatılmak isteneni kavradıysanız Growth Hacking’in bir sonunun olmadığını ve her zaman yeni şeylerin keşfedildiğini anlamışsınızdır. Dolayısıyla bu konu ile ilgili paylaşımların sonunun gelmesi hiçbir şekilde mümkün değil.

Ancak ana odağı artık başka bir konuya kaydırıyorum: Veri Madenciliği. Son zamanlarda çok popülerleşmeye başlayan bir kavram aslında. “Bu da nedir?” diye merak mı ediyorsunuz? O zaman sizi aşağıya doğru alalım.

Giriş

5Bilgi Endüstrisinde (Information Industry) çok büyük miktarlarda veri bulunuyor.  Anlamlı ve kullanışlı bir bilgiye (information) dönüştürülmediği müddetçe bu verinin hiçbir anlamı yok. Böylesine büyük bir veriyi analiz etmek ve anlamlı bilgiler çıkarmak artık bir zorunluluk haline geldi.

Bilgi çıkarma işlemi yapmamız gereken tek işlem değil, bu süreç aynı zamanda Veri Temizleme (Data Cleaning), Veri Entegrasyonu (Data Integration), Veri Dönüştürme (Data Transformation), Veri Madenciliği (Data Mining), Örüntü Değerlendirme (Pattern Evaluation) ve Veri Sunumu (Data Presentation) gibi işlemleri de içermekte. Bu işlemlerin hepsi yapıldıktan sonra, elde ettiğimiz bilgileri artık Sahtekarlık Tespiti (Fraud Detection), Pazar Analizi (Market Analysis), Üretim Kontrolü (Production Control) vb. birçok alanda kullanabiliriz.

Veri Madenciliği Nedir ?

Veri madenciliği basitçe tanımlayacak olursak büyük veri setlerinden anlamlı ve kullanışlı bilgiler çıkarma(elde etme) sürecidir. Yani aslında kelim3e anlamı gibi, veriyi çok büyük bir maden olarak düşünürsek bu madeni kazıyarak içindeki değerli maddeleri bulmaya çalışıyoruz. Bulduğumuz bilgileri şu alanlarda kullanabiliriz:

  • Pazar Analizi
  • Pazarlama stratejilerinin verimliliği
  • Belirli bir pazarlama stratejisi için büyük bir müşteri veri tabanından hangi müşterilerin hedef olarak seçileceğinin belirlenmesi
  • Müşteri yaşam döngüsünü yönetme ve müşteriyi elde tutma
  • Sahtekarlık Tespiti
  • Üretim Kontrolü

“Söyle bana, neler olabilir” Rolü

Veri madenciliğinin ilk rolü veriye “söyle bana, neler olabilir” dediğiniz tahminleme rolüdür. Veri ambarınızda (data warehouse) 6kilitli bir şekilde duran gizli bilgileri açığa çıkarıyoruz.

“Bana ilginç bir şey söyle” Rolü

Tahminlemeye ek olarak, veri madenciliği daha önceden bilmediğiniz ilginç bilgileri elde etmek için de kullanılır. Örneğin, iki ürünün satışı arasında olağan dışı bir ilişkinin olması ve bu ilişkinin bu iki ürünü yerleştirme biçiminize göre nasıl değiştiğini fark etmek.

Neden Veri Madenciliğine İhtiyaç Duyuluyor ?

Bilgi Teknolojilerindeki gelişmelerden kaynaklanan bir veri bolluğuna sahibiz. Büyük Veri veya daha sevdiğim bir tabiriyle İri Veri (Big Data) kavramının2 ortaya çıktığı yer de burası aslında. Artık veri çok yüksek hızlarda, çok yüksek hacimlerde ve çok çeşitli şekillerde (resim, müzik, yazı, vs.) geldiğinden bu verilerden anlamlı bir bilgi çıkartmak gerekiyor.

Bu çıkartılan bilgiler karar almada büyük bir rol oynamakta ve rekabet avantajı sağlamakta.

Pazar Analizi ve Yönetim

  • Müşteri Profilleme: Kimler hangi tür ürünleri alıyor.1
  • Müşteri Gereksinimlerini Tespit Etme: Müşteriye göre ürün belirleme. Hangi faktörler müşterileri çekiyor?
  • Çapraz Pazar Analizi: Farklı ürün satışları arasındaki Birliktelik (Association) ve İlişki (Correlation)
  • Hedef Pazarlama: Müşterileri ortak karakteristiklere göre kümeleme.
  • Müşteri Satın Alma Örüntüsünü Belirleme: Müşterilerin satın alma biçimlerini belirleme.

Kurumsal Analiz ve Risk Yönetimi

  • Finansal Planlama ve Varlık Değerlendirmesi: Nakit akışı analizi ve tahminleme.
  • Kaynak Planlama: Özetleme, kaynakları karşılaştırma ve harcamaları asgari düzeye indirme.
  • Rekabet: Rakipleri gözetleme ve pazar trendlerini belirleme

Sahtekarlık Tespiti

Kredi kart servisleri ve telekomünikasyon sektöründe sahtekarlıkları tespit etmek.

Neler Göreceğiz ?

Veri madenciliği alanı istatistik, yapay zeka, veri tabanı ve veri ambarı konularıyla bağlantılı olduğu için bu alanlarla ilgili konuları ele alacağız ve inceleyeceğiz. Dalışa hazır mısınız?

8 – Üyeleri Aktifleştirmek

Artık ziyaretçileriniz var, fakat problem de burada ortaya çıkıyor. Onlar sadece ziyaretçiler. Ürününüze gelmeleri için bir yol buldunuz ama yaptığınız sadece buysa inanılmaz derecede yüksek hızlarla sitenizden “bounce” edeceklerdir(sekip gidecekler). Asıl amacınız onları aktifleştirmek. Aktivasyon ziyaretçilerin ürününüz ile ilgili sizin istediğiniz bir aksiyonu almalarını sağlama sanatıdır. Aktivasyon ziyaretçileri yalnızca rastgele birşeylere tıklatarak “bounce” etmelerini engellemek değildir. Aktivasyon, sizin önceden belirlediğiniz yapmaları gereken şeyleri yaptıklarında gerçekleşir. Bazı olası aktivasyon hedefleri:

  • Email adreslerini almak
  • Bir hesap yaratmalarını sağlamak
  • Bir şeyi okumalarını sağlamak
  • Bir şeye yorum yapmalarını sağlamak
  • Bir şey paylaşmalarını sağlamak
  • Bir şey almalarını sağlamak
  • Bir şey doldurmalarını sağlamak
  • Bir şey izlemelerini sağlamak
  • Biriyle etkileşime geçmelerini sağlamak
  • Birine arkadaşlık isteği göndermelerini sağlamak
  • Ve daha bir çoğu

Bu aktivasyonlardan bazıları mantıklı görünürken bazıları saçma görünebilir, fakat hedefleriniz tamamen ürününüze bağlı olarak şekillenir. Eğer ürününüz reklamlardan para kazanan bir blog ise o zaman 1,3,4 veya 5. yöntemlere odaklanabilirsiniz. Eğer email adreslerine sahipseniz onlara gelecek makaleler hakkında mesajlar atabilirsiniz. Eğer sitenizde çoktan var olan bir makaleyi okurlarsa yazı kalitenizi görüp daha fazla okumak isteyeceklerdir. Eğer bir makalenin altına yorum yaparlarsa geri gelmeye daha meyilli olurlar, özellikle diğer insanlar cevaplar yazdıkça. Eğer makalenizi Twitter’da paylaşıyorlarsa bu makalenize daha çok okuyucu getirecektir. Bütün bunlar reklam verenlerden daha fazla para talep edebilmenize neden olacaktır. Başka bir ürün tamamen farklı bir hedefe sahip olabilir.

Ayrıca şunu kavramak çok önemli ki daha az hedefe sahip olmak demek onlara daha fazla erişebilme şansı demek. Eğer 5 aktivasyon hedefiniz varsa o zaman bu yazıdaki taktikleri kullanarak herhangi birine verimli bir şekilde erişmek çok zordur. Ürününüzün bir kısmı için yalnızca bir tek ana aktivasyon hedefiniz olmalı.

AKTİVASYON TAKTİKLERİ 01: KARŞILAMA SAYFALARI (LANDING PAGES)

İnsanlar sitenizi ziyaret ettiğinde doğru karşılama sayfası stratejileri onları aktive etme şansınızı ciddi derecede artırır. Bir “karşılama sayfası” ana sayfanızdan farklı bir sayfadır. Ana sayfanızla aynı elementlere sahip olabilirler fakat hepsine değil. Bir karşılama sayfası ürününüzün içerisinde yaratmış olduğunuz, belirli kampanyalara doğru insanları yönlendirdiğiniz bir sayfadır. Neden karşılama sayfası kullanmanızı açıklayan birkaç ayırt edici karakteristik:

KISITLI NAVİGASYON

Birisi belirli bir kampanyadan karşılama sayfanıza gelmişse o zaman navigasyona1 elementlerinin çoğunu gizleyebilirsiniz çünkü bunlar insanların dikkatini dağıtarak sizin belirlediğiniz aksiyonları almalarını engelleyeceklerdir. Karşılama sayfanıza geldiklerine göre zaten ilgi göstermişler dolayısıyla dikkatlerini dağıtmadan iyice odaklamalısınız.

TEK “CALL TO ACTION”(EYLEME ÇAĞRI)

Tıpkı navigasyon elementlerini kısıtladığınız gibi bir karşılama sayfası yalnızca bir call toa2 action içermeli. Birçok call to action karışıklığa sebep olacaktır ve dolayısıyla çok spesifik bir kampanyadan gelmedikleri sürece hiçbir aksiyon almadan gideceklerdir.

MÜNASIP BİR DİL

Karşılama sayfanıza gelen bir insanın nereden geldiğini bildiğinizden deneyimi o insanaa3 göre ayarlayabilirsiniz. Genel ziyaretçi kitlenize hitap etmese bile bu insanlara hitap edecek bir dil kullanmalısınız. Karşılama sayfanızın dili ve görüntüsü hangi kaynaktan geldiklerine göre değişen beklentilerine uygun olmalıdır.

Son zamanlarda çok popüler olan ve kendine has özellikler barındıran spesifik bir karşılama sayfası türü var. Bunlar lansman sayfası(launch page) veya çok yakında(coming soon) sayfasıdır. Lansman sayfasında ürününüz henüz piyasaya çıkmamışken insanlardan email adreslerini alarak ürününüz piyasaya çıktığı anda onları bilgilendirdiğiniz bir sayfadır. Bu tarz bir karşılama sayfası kullanırken aklınızda bulundurmanız gerek bazı şeyler:

BUNU TRAFİK ÇEKMEK İÇİN KULLANIN, AKTİVASYONLAR İÇİN DEĞİL

En iyi trafik çekme zamanlarından biri ürününüz piyasaya çıkmadan önceki zamandır.a4 Eğer lansman sayfanızı başkalarıyla paylaşırlarsa onlara üründen haberdar olacak ilk insanların onlar olabileceğini belirtin, veya ürününüz hakkında tweet atan ilk kişilerden olduklarında ürünü ilk deneyen insanların onlar olabileceğini söyleyin. Bu konuda yaratıcılık size kalmış.

BAŞLIK (HEADLINE) VE ALTBAŞLIK (SUBHEAD) HER ŞEYDİR

Henüz lanse olmadığınızdan karşılama sayfanıza ekleyebileceğiniz fazla bir detaya sahipa5 değilsiniz. Bu şu anlama gelir: başlık ve altbaşlığınız çok önemli. Eğer bu birkaç kelime insanların dikkatlerini çekmiyorsa “bounce” edeceklerdir.

DUYGUSAL GÖRSELLER KULLANMADAN OLMAZ

Başlık ve altbaşlığın yanında, çok duygu dolu bir görsele de ihtiyacınız var. Tam ekrana6 arkaplan imajı kullanımı yaygın bir uygulama. İçeriğinizin azlığına rağmen onlara duygunuzu aktarın.

LİSTENİZİN KÜÇÜLMESİNE İZİN VERMEYİN

Ürününüzün lansmanıyla ilgilenen insanların listesini oluşturduğunuzda listenina7 küçülmesine izin vermemelisiniz. Eğer onlara aylardır mail atmadıysanız ve birden ürününüzün lansmanıyla ilgili bir mail atarsanız, tıklama oranlarınız(click through tare or simply CTR) çok düşük olacak. Onlarla sürekli iletişimde kalarak iletişimi sıcak tutun, veya lasnamnınıza bir aydan fazla süre varsa email adreslerini almayın bile.

LANSMAN SAYFANIZI BETALI.ST VE ERLIBIRD.COM’E GÖNDERİN

Yeni ürünler için arayışta olan insanlardan oluşan ekosistemler mevcut. Lansman sayfanızı bua8 ekosistemlerden olan betali.st veya erlibird.com’a gönderebilirsiniz ve eğer güzel bir lansman sayfanız varsa bu siteler aracılığıyla email listesi oluşturmaya hızlıca başlayabilirsiniz.

Eğer hızlıca karşılama sayfası yaratmaya çalışıyorsanız o zaman unbounce.com gibi bir servisi kullanabilirsiniz, ve eğer lansman sayfası yaratıyorsanız o zaman launchrock.co gibi bir servisi kullanabilirsiniz.

AKTİVASYON TAKTİKLERİ 02: COPYWRITING

Eğer insanların belirli aksiyonlar almasını istiyorsanız, ve “bounce” etmelerini istemiyorsanız, kullandığınız kelimeler sandığınızdan da önemli. Görseller üzerinde takıntılı derecede çalışmalar yapıyoruz ve  bu da copywriting’i geri plana atabiliyor. Görsellerin önemli olduğu kadar, birinden bir şeyi bilmesini istiyorsanız, bir şeyi anlamasını istiyorsanız veya bir şey yapmasını istiyorsanız o zaman büyük ihtimalle kelimeleri kullanmak zorundasınız. Copywriting hakkında birkaç içgörü:

BAŞLIĞINIZ BENZERSİZ DEĞER ÖNERİNİZDEN (UNIQUE VALUE PROPOSITION) BAHSETMELİ

Neden ürününüz benzersiz? Rakiplerinizin yapmadığı ya da yapamadığı neyia9 yapıyorsunuz? Eğer insanlara benzersiz olduğunuzu söylemezseniz o zaman gerçekten benzersiz olduğunuzu varsayacaklardır.

ALTBAŞLIK BENZERSİZ DEĞER ÖNERİNİZİ DAHA DA AÇIKLAMALI

Altbaşlık ana başlığınızın altındaki daha küçük boyutlarda yazdığınız başlıktır.a10 Başlığınızda yazdığınız şeyin neden doğru olduğunu alt başlıklarınızla belirtebilirsiniz. Bunları şüpheleri yok etmek için ve ana başlığı açıklamak için kullanın.

UZUN COPYWRITING PAHALI ÜRÜNLER İÇİN İYİDİR

Eğer 500TL’lik bir şey satıyorsanız o zaman daha uzun bir copywriting’e ihtiyacınız var. Bua11 ziyaretçileri bilgilendirmeye, sorularını cevaplamaya ve genellikle onları aktif kullanıcılara dönüşmeye ikna etmede size yardımcı olacaktır.

KISA COPYWRITING DAHA UCUZ ÜRÜNLER İÇİN İYİDİR

Eğer 20TL’lik bir ürün satıyorsanız uzun bir copywriting yanıtladığından daha fazla soruyaa12 sebep olacaktır. İnsanlara yardım ettiğinden daha fazla akıllarını karıştıracaktır. Düşük maliyetli ürünler için, kısa, net bir copywriting daha iyidir.

FARKLI KİTLELER FARKLI TÜR KELİMELERE CEVAP VERİRLER

Başkasının copywriting stilini tamamen olduğu gibi kopyalamayın. Kelimeleriniz hitapa13 ettiğiniz kitleye göre ayarlanmış olmalı. Eğer doktorlara konuşuyorsanız jargon kullanmalısınız, ya da başka bir kitleye hitap ediyorsanız jargon belkide doğru seçim değildir. Eğer çocukları hedefliyorsanız argo kullanabilirsiniz, ama eğer büyükannelere hitap ediyorsanız argo kullanmamalısınız.

MÜŞTERİ GELİŞTİRMEYİ COPYWRITING’DE KULLANIN

Kitlenizi online olarak araştırırken hangi kelimeleri hali hazırda kullandıklarını görmeyea14 başlayacaksınız. Eğer onların kullandığı kelimeleri copywriting’inizde kullanırsanız o zaman onları aktive etmeyi başarabilirsiniz.

SOSYAL KANITLAR COPYWRITING’DİR

İnsanlar sürü mentalitesiyle hareket ettikleri için diğer insanların referansları onlarıa15 etkileyecektir. Eğer bir şeyi herkes yapıyorsa ben de yapmalıyım diye düşünürüz. Sosyal kanıtlar veya testimoniyaller, ziyaretçilerinizi aktive etmenize yarayan bir tür copywriting’dirler.

MİKRO KOPYALARI (MICROCOPY) UNUTMAYIN

Bunlar ziyaretçilerin arayüzü nasıl kullanacaklarına dair ipuçları sunan küçük kutular vea16 yazılardır. Doğru yerde küçük ipuçları insanların arayüzünüzü öğrenmelerini kolaylaştırır. Kafası karışan ziyaretçiler genellikle yapmalarını istediğiniz şeyi yapmazlar.

Copywriting hakkında daha fazla öğrenmek isterseniz:

Copyhacker.com

AKTİVASYON TAKTİKLERİ 03: CALLS TO ACTION (EYLEME ÇAĞRI)

Şimdiye kadar birkaç kere bahsettik bundan. Birine istediğiniz bir şeyi yaptırmanın en iyi yollarından biri onlara net bir “call to action”(eyleme çağrı) vermektir. Hiçbir şeyi onların hayal gücüne bırakmayın. Nereye tıklayacaklarını söyleyin ve tıklayacakları butonu da belirgin yapın. Onlara kimi arayacaklarını söyleyin ve telefon numarasını belirginleştirin. Ziyaretçileri onlara ne yapmalarını istediğinizi söyleyerek aktive etmeye çalışın. Birkaç güzel örnek:

AKTİVASYON TAKTİKLERİ 04: ALIŞTIRMA(ONBOARDING)

İnsanlar sitenize geldiklerinde bu tıpkı bilmediğiniz bir şehrin ortasına haritasız ve yön bilgisiz bir şekilde bırakılmanız gibidir. İşiniz bu insanlara yön vermek ve nereye gitmelerini istiyorsanız oraya yönlendirmek. Bunun en iyi yönemlerinden biri alıştırma(onboarding) yönetimidir. Onboarding ekranın üstünde konumlanmış görsel yönlendirmeler olabilir veya ziyaretçileri bir sayfadan başka bir sayfaya aktaran sayfalar dizisi olabilir. Onboarding’i dijital bir tur olarak düşünün. Açıklayıcı bir video onboarding stratejinizin bir parçası olabilir.

İnsanlar sabırlı değildirler, ve ürününüzü nasıl kullanmaları gerektiğini bulacak kadar önemsemiyorlar. Eğer ziyaretçileri aktifleştirmek istiyorsanız, onların belirli aksiyonları almasını istiyorsanız, o zaman onboarding tecrübenizi dikkatlice tasarlamalısınız.

AKTİVASYON TAKTİKLERİ 05: OYUNLAŞTIRMA(GAMIFICATION)

Oyun oynamakla ilgili bir şey var: insan beyniyle bütünleşik olması. İlerlemeyi, ödüller almayı, skor tahtasında sıralanmayı, görevleri bitirmeyi, yükselmeyi, bunu yaparken zevk almayı seviyoruz. Gamification oyun mekanizmalarını ürününüz içerisine yerleştirdiğinizde oluşur, ve bu üyeleri aktive etmek için kullanılabilir. Gamification bir insanın normalde yapmayacağı şeyleri yapması için kullanılabilir. Birkaç örnek:

İLERLEME(PROGRESS)

İnsanlara oluşturdukları profillerin ne oranda dolu olduğunu söylemek a17çok yaygın bir uygulama. Bu bizi bilgilerimizi %100 doldurmamıza iter çünkü bitmeyen, eksik kalan şeylerden nefret ederiz. Yalnızca bilgileri alırken bir ilerleme çubuğu ekleyin ve işte ürününüzü oyunlaştırdınız.

ÖDÜLLER

Ödüller önemlidir, anlamsız ya da absürd olsalar bile. Eğer ürününüz içerisinde bir şeyia18 ödül olarak verebiliyorsanız o zaman insanların belirli aksiyonları almaları için oyunlaştırılmış teşvikler yaratmışsınız demektir. Foursquare’i düşünün.

SKOR TAHTASI

Birine kendi skorunu göstererek rekabet etmesini tetikleyebilirsiniz. Skor tahtalarıa20 insanları belirli aksiyonlar almaları için aktive edebilir.

AKTİVASYON TAKTİKLERİ 06: FİYATLANDIRMA STRATEJİLERİ

Birine bir şeyi aldırtmak gerçekten eşsiz bir tür aktivasyon. Bir ziyaretçiye belirli bir aksiyonu aldırtıyorsunuz, ve bu aksiyon bir satın alma. Bu konuda bir sürü bestpractice mevcut. Hepsi size uymayabilir ama bazıları mutlaka uyacaktır.

MÜKEMMEL FİYAT AYRIMI(PERFECT PRICE DISCRIMINATION)

İnsanlara bir şeyi satın aldırtmak için fiyatlandırma çok önemli. Müşterinin satın almaa24 gücüne göre değişik fiyatlandırmalar yapmaya mükemmel fiyat ayrımı denir.

ÇOKLU KATMAN

Satın almaları aktive etmek için diğer bir popüler strateji 3 fiyatlandırma aşamasıa21 olmasıdır. Daha pahalı bir opsiyonun olduğu gerçeği başlı başına size paranızı boşuna harcamadığınızı ve güzel bir satın alma yaptığınızı hissettirebilir. Opsiyonlar insanlara satın almaları için güven verir.

FİKİR VERİCİ KATMAN ADLANDIRMASI

Fiyat katmanlarınızı altın, gümüş ve bronz gibi muğlak kelimelerle adlandırırsanız, oa22 zaman insanlara onlar için hangi katmanın uygun ve iyi olduğunu anlamalarına yardım etmemiş olursunuz. Katmanları, örneğin, “Başlangıç”, “Profesyonel”, veya “Takım” olarak adlandırırsanız o zaman insanlara doğru katmanda olduklarına dair güven verebilirsiniz.

BEDAVA DENEME SÜRÜMLERİ

İnsanlar paralarıyla geri alınamaz hatalar yapmaktan korkarlar. Eğer onlara geri paraa23 garantisi verirseniz, veya bir tür bedava deneme sürümleri verirseniz, o zaman riski onlardan alıp kendinize taşırsınız. Riski onlardan aldığınız için insanlar daha rahat davranabilirler.

İNDİRİM KODLARI

En güçlü kuvvetlerden biri indirim kodlarıyla birine satın alma yaptırmaktır. Fakat indirima24 kodlarını daha efektif yapan bir numara vardır. Eğer bu kodlara zaman limiti koyarsanız insanları satın alma kararı yapmaya zorlarsınız. Udemy bu tarz bir aktivasyon taktiğinin mükemmel bir örneği. İnsanlar düzenli aralıklarla belirli bir zaman için geçerli olan indirim kodları içeren mailler gönderirler.

PAKETLEME (BUNDLING)

İnsanlara satın alma yaptırmanın bir diğer yöntemi de ürününüzü diğer ürünlerlea25 paketleme yöntemidir. Eğer insanları değer ile çevrelerseniz o zaman satın alma kararı vermeye daha meyilli olurlar. Hacker Bundle bu aktivasyon taktiğini kullanan güzel örneklerden biri.

BU YAZININ ÖZETİ

  • Ürününüze ziyaretçi çekmek yeterli değil. Onları aktifleştirmek gerekiyor.
  • Aktivasyon, birinin ürününüzün başarısı için gerekli olan bir aktivasyonu almasıyla gerçekleşir.
  • Ürününüzün belirli bir kısmı için yalnızca bir aktivasyon hedefiniz olmalı.
  • Aktivasyon hedefleri ürününüze bağlı olarak değişebilir.
  • 6 aktivasyon taktiğinden bahsettik:
    1. Karşılama sayfaları
    2. Copywriting
    3. Eyleme Çağrı (Call to Action)
    4. Alıştırma (Onboarding)
    5. Oyunlaştırma (Gamification)
    6. Fiyatlandırma Stratejileri

7- Ziyaretçi Elde Etmek İçin Ürün Taktikleri

Growth Hacking’in en heyecan verici yanlarından biri de yeni ziyaretçiler çekmek için ürünün kendisini kullanma olanağıdır. Ziyaretçileri funnel’ınızın tepe noktasına çekmek ya da itmek güzel, fakat trafik çekmek için ürünün kendisini kullanmanın sihirli bir yönü var. İyi yapıldığında yalnızca itme ve çekme taktiklerinin başaramayacağı bir şekilde katlanarak artan bir etkiye sebep olabilir.

Örneğin, bir infografik yaratarak çekme taktiğinden yararlanırsanız trafik çekmeyi bekleyebilirsiniz, fakat bu infografiğe gelen ziyaretçiler her geçen gün azalacak ve en nihayetinde çok küçük sevilerde kalacaktır. Bunu, bu yazıda listelenen bazı taktiklerle karşılaştırın. Ürünün kendisini kullanarak, sitenize gelen herbir ziyaretçinin beraberinde kendi ilişki ağını funnel’ınıza getirmesi mümkün. Bu nokta, viral döngülerin ortaya çıktığı yerdir. Eğer ürün taktiğini kullanarak sitenize gelen herbir ziyaretçi için, bu ziyaretçilerin beraberinde birden fazla kişi daha getirmelerini sağlayabilirseniz o zaman 1’in üzerinde bir viral katsayı(viral coefficient) yaratmış olursunuz (bu sayı bazen K olarak gösterilebilir). Bu sayede üstel(exponential) bir büyümeye erişmiş olursunuz. Artık VİRAL oldunuz.

Ancak, bu noktada sizi uyarayım: Çoğu ürün viral olmaz. Eğer B2B kurumsal bir ürünü growth hack’lemeye çalışıyorsanız o zaman 1’e yakın bir viral katsayıya erişeceğinizden bir hayli şüphe duyarım. Bu sadece yanlış bir şey yapıyor olduğunuzdan değil, aynı zamanda bazı marketlerde bu taktiktikleri kullanmanın çok zor olduğundandır.

Öyleyse bu taktikleri nasıl değerlendirmelisiniz? Eğer 1’in üzerinde bir K faktörü elde etmek gerçekten çok zorsa o zaman ürün stratejisini kullanarak ziyaretçi elde etmekten vaz mı geçmeliyiz? Kesinlikle hayır. Şanlı şöhretli 1+’ya hiçbir zaman yaklaşmayacak olsa bile sıfırın üzerindeki herhangi bir K faktörü diğer pazarlama eforlarınızın hepsini positif olarak etkileyecektir. Açklamama izin verin.

Eğer K faktörünüz 0.5 ise o zaman bu ürününüze gelen herbir yeni ziyaretçi funnel’ınıza beraberinde yarım kişi getiriyor demektir. 10 yeni ziyaretçi aslında 15 ziyaretçi demek oluyor. Bu viral değil çünkü yükselmeye devam edip eksponansiyel artışa neden olmayacak, fakat hala ürününüze daha önceden hiç görmeyen yeni ziyaretçileri çekiyorsunuz. Bu ışık altında çekme metodlarından infografik yaratmayı bir düşünün. Bir inforgrafikten ötürü bu ay ürününüze 500 insan getirdiyseniz bu aslında 0.5 bir K faktörüyle 750 insan getirdiniz demek oluyor. Bir ürün taktiğini kullanarak çekme taktiklerinden biri olan infografiğin etkisini güçlendirdiniz. Bu tam olarak ürün taktikleri hakkında nasıl düşünmeniz gerektiğini gösteriyor. Bu taktikler funnel’ınıza gelen herhangi bir şeyi güçlendirirler.

0.5’lik bir K faktörü aynı zamanda şu anlama da geliyor: eğer itme taktiklerinden olan reklam satın almayı kullanıyorsanız o zaman belirli bir sayıda ziyaretçi çekmek için daha az harcama yapabilirsiniz çünkü her 10 tıklama gerçekte 15 ziyaretçi demek olacak. Tasarruf etmek kesinlikle iyi bir şey, ama bu aynı zamanda tıklama başına daha fazla para ödemenize olanak da sağlar, ve bu da büyük olasılıkla rakiplerinizin verebildiğinden daha fazla para verebilmenizi sağlar. Son yazıda ne dediğimi hatırlayın. Reklamlar yalnızca iş modeli rekabetleridir ve ürün aktivitelerinizi güçlendirecek olan ürün taktikleriniz aynı zamanda iş modelinizin verimliliğini de arttıracaktır.

ÜRÜN TAKTİKLERİ 01: AĞ DAVETLERİ

Birçok insanın çoktan çeşitli yerlerde kendi sosyal ağlarını oluşturdukları bir dünyada yaşıyoruz artık. Facebook üzerinde bir grup arkadaşa sahibiz. Twitter üzerinde insanları takip ediyoruz. İş ilişkilerine LinkedIn üzerinden bağlıyız. Gmail üzerinde bir email listesine sahibiz. Arkadaşlarımızın ve ailemizin telefonlarını tuttuğumuz mobil telefonlarımız var. Ziyaretçi kazanmak için açıklayacağımız ilk ürün taktiği daha önceden var olan, önceden tanımlanmış ilişki ağlarını kendi avantajınıza dönüştürme yeteneğinize dayanıyor aslında.

Telefon Rehberleri

Eğer bir mobil uygulama geliştiriyorsanız o zaman kullanıcıların telefon rehberindeki numaralara kendi ürününüz hakkında mesaj göndermek için izin almaktan yalnızca birkaç tıklama ötedesiniz demektir. Genellikle telefon rehberlerini sosyal ağ olarak düşünmeyiz fakat bunlar aslında bizim en samimi ilişki ağımız olabilir. Umano, popüler online makaleleri dinleyebilmenizi sağlayan yeni bir servis, bu taktikten faydalanıyor. Servislerini birkaç kez kullandıktan sonra karşınıza ürünü arkadaşlarınızla paylaşmanız için bir kutucuk çıkarıyor, ya da bunu ayarlar menüsünden kendiniz yapıyorsunuz(aşağıda). Sizin için herkesi nasıl önceden seçtiklerini fark edin, ve böylece ya manuel olarak bazı insanları listeden çıkartacaksınız veya hepsini çıkarta basacaksınız. Bu birçok ağ davetleri taktikleri için yaygın bir uygulamadır. Şunu da belirmek gerekir ki telefon numaralarını arayabilir ya da onlara mesaj atabilirsiniz, böylece bu size bir kere izin aldıktan sonra insanlara nasıl mesaj atacağınıza dair birkaç opsiyon sağlar. Telefon numaralarıyla ilişkilendirilmiş mail adresleri de olabilir ve bu mail adreslerini de kullanabilirsiniz.

Email Listeleri

İnsanların çoktan geliştirdiği ve kendi avantajımıza çevirebileceğimiz bir diğer ağ da email listeleridir. Bu yöntem birkaç yıl önce çok daha popülerdi, fakat bunun farklı varyasyonları hala mümkün. Linkedin size mail listenizi siteye yüklemenize izin veriyor ve onlarda listenizdeki insanlara mailler atarak trafik yaratıyorlar.

Sosyal Kişi Listeleri

Telefon ve email listelerinin yanında faydalanabileceğimiz üçüncü tür ağ da sosyal kişi listeleridir. Twitter, Facebook, LinkedIn, Instagram, Pinterest ve daha birçoğu “sosyal grafikler” yarattığımız ağlardır. Hali hazırda var olan ilişkilere sahibiz ve bu ilişkiler yeni bir ürüne davet edilebilir. Bütün sosyal ağları hedeflemek zor olabilir çünkü insanlar arkadaşlarına erişmenize izin vermeyecektir fakat bir tanesi bile yeter. Tek bir sosyal ağa odaklanma aynı zamanda kendi ürününüzde teknik kararlar vermenizde size yardımcı olabilir. Eğer ürününüze ziyaretçi davet etmek için öncelikli olarak Facebook’u kullanmayı seçerseniz o zaman ürününüze kayıt olmak isteyen kullanıcılardan Facebook kişi listelerine erişim izni vermelerini isteyebilirsiniz.

ÜRÜN TAKTİKLERİ 02: SOSYAL PAYLAŞIMLAR

Sosyal paylaşımlar fark edilir bir biçimde insanları kendi hali hazırda var olan ilişki ve arkadaşlık ağları aracılığıyla ürününüze davet etmek değildir. Bu taktik daha ziyade insanlara sosyal ağlar üzerinde sizin ürününüz hakkında paylaşımlarda bulunmasına izin vermenizle alakalı. Örneğin, birinden ürününüzü kullanabilmesi için Facebook arkadaşlarını ürününüze davet etmesini istemek yerine onlara sizin ürününüz hakkında kolayca paylaşımda bulunabileceği bir opsiyon sunmalısınız. Ve eğer sizin hakkınızda paylaşım yapan kişinin profili herkese açıksa o zaman yapmış olduğu paylaşım herkes tarafından görülebilir. Bunun en belirgin örneğini popüler bloglarda görüyoruz. The Next Web (aşağıda) apaçık bir şekilde içeriklerin değişik platformlarda paylaşılabilmesi için bir opsiyon sağlıyor.

Çoğu sosyal ağ kendi platformlarında kolay paylaşım yapabilmeniz için size hali hazırda kod parçacıkları(code snippet) sunuyor. Aynı zamanda birçok popüler sosyal ağı içeren tek bir arayüzler de mevcut. Bunun için Flare son derece basit bir çözüm sunuyor.

En başta fark edilemese bile sosyal paylaşım stratejilerini implement ederken aklınızda bulundurmanız gereken bir diğer şey de trafiğinizin doğal olarak nereden geldiğini dikkate almaktır. Eğer inbound trafiklerinizin çoğunu Twitter’dan alıyorsanız, fakat insanlara ürününüzü sadece Facebook üzerinden paylaşmalarına izin veriyorsanız o zaman çok bariz bir fırsatı kaçırıyorsunuz. İnsanlara en çok nereden trafik çekiyorsanız orada paylaşım yapmalarını sağladığınızdan emin olun. Bunun yararını katlanarak göreceksiniz.

ÜRÜN TAKTİKLERİ 03: API ENTEGRASYONLARI

Sosyal paylaşımdan bir sonraki adım ürününüzü gerçekten hali hazırda var olan bir sosyal ağ ile API seviyesinde entegre etmektir. İnsanlara sadece paylaşımda bulunmaları için sormak yerine, paylaşımı deneyimin içine entegre edebilir ve her seferinde kullanıcının iznini almak zorunda kalmadan arka planda gerçekleşmesini sağlayabilirsiniz. Bunun mükemmel bir örneği Spotify’dır. Spotify’ın ürününü büyüktem için Facebook’u yoğun olarak kullandığı bir sır değil, ve bunu API entegrasyonu ile yaptılar. Spotify’a Facebook Connect seçeneği ile bir kere bile olsa bağlandıysanız ve Spotify’a gerekli izinleri verdiyseniz, o zaman Spotify üzerindeki aktiviteleriniz otomatik olarak hem Facebook üzerinde paylaşılacaktır hem de Spotify uygulaması içerisinde de paylaşılacaktır. Eğer Spotify ve Facebook kullanıyorsanız(ki bu devirde kullanmamak neredeyse imkansız) bir Facebook arkadaşınız Spotify’a katıldığında Spotify size FB arkadaşınızın Spotify’a katıldığına dair bildirim gönderir, aynı zamanda Facebook profillerinde de arkadaşlarınızın ve sizin dinleme alışkanlıklarınızı yayınlar. Bu işlem tamamen arkaplanda gerçekleşir, bu da sürtüşmesiz bir paylaşım sağlar ve bunu yalnızca API entegrasyonu ile gerçekleştirebilirsiniz.

Bu taktiğin bir diğer örneği ise Nike+’ın Path ve Facebook ile API entegrasyonudur. Ne zaman Nike+’ı açıp bir koşuya çıksam, koşu sonrasında koşuya dair bilgiler Facebook ve Path’de otomatik olarak paylaşılır, böylece arkadaşlarım benim aktivitemi görebilirler. Aynı zamanda arkadaşlarım bu uygulamalar aracılığıyla beni koşmaya teşvik edip ben koştukça alkış sesleriyle eşlik edebilirler. Bu zekanın sınırlarının zorlandığı bir yer. Bunu bir kez ayarladığınızda bütün paylaşımlar otomatik olarak gerçekleşir.

Sonuç olarak API entegrasyonları ürününüzü growth hacklemek için harika bir yöntemdir fakat ürününüz 3. Parti bir servisle ne kadar çok entegre ederseniz o kadar risktesiniz demektir. Twitter bunun harika bir örneği. Birçok şirket Twitter API’ı üzerine kurulmuştu fakat sonra Twitter izin verdiği API kullanım sayılarını değiştirdi. Bu da bu şirketleri ikinci bir planları olmadığı için açıkta bıraktı. Ürününüzü büyütmek için API’ları kullanın fakat API’ın ürününüzün kendisine dönüşmediğinden emin olun.

ÜRÜN TAKTİKLERİ 04: GERİ LİNKLER(BACKLINKS)

Hotmail ilk olarak ortaya çıktığında çok basit fakat gidişatını dramatik bir biçimde değiştiren bir şey yaptı. Hotmail kullanılarak gönderilen maillerine altına “Get your free email at Hotmail” yazan bir link ekledir ve öylece bir viral döngü doğmuş oldu.

Bu taktik günümüzde hala kullanılıyor. Bunun modern bir versiyonu sitenize çeşitli sebeplerden ötürü pop-up yerleştirmenizi sağlayan servisler. Aşağıdaki örnekteki geri linkleri fark edin.

ÜRÜN TAKTİKLERİ 05: TEŞVİKLER

Bazı ürünler kullanıcılarına kendine yeni insanlar getirmeleri için bir teşvik sunarlar. Bunun klasik bir örneği Dropbox’dır. Dropox kullanıcılarının çeşitli aktiviteleri için teşitli teşvikler sunuyor. Bu taktik eğer sizin için düşük maliyetli fakat kullanıcı için yüksek değere sahip bir şey bulduğunuzda son derece iyi çalışır. Dropbox örneğinde, depolama alanını para birimi gibi kullandılar çünkü exchange rate’i onların leyhineydi. Depolama çok pahalı bir şey değildi, fakat yeni kullanıcılar elde etmek onlar için çok değerliydi. Kullanıcı için ise durum tam zıttıydı: depolama alanı onlar için çok önemliydi. Bu mükemmel bir fırtına yaratmıştı.

Uyarı yapmakta fayda var: Dropbox’ın bu taktiğini taklit etme niyetinde olan birçok startup başarılı olamamalarından kaynaklı hayat kırıklığına uğramıştır. Bu startupların ürünleri bu tarz bir yöneteme el verişli olmayabilir. Aynı zamanda şunu da fark etmek gerekiyor ki Dropbox sadece arkadaş davetine istinaden bedava depolama alanı vermiyordu, kendi ürünlerini anlamanız için yaptığınız her işlem için bir teşvik sunuyorlardı çünkü biliyorlardı ki EĞİTİLMİŞ KULLANICILAR DAHA AZ GİdERLER(CHURN)

ÜRÜN TAKTİKLERİ 06: ORGANİK

Ürünün içindeki teknoloji ürünün yayılmasına yardımcı olsa da hala daha fazla etkili olabilecek bir yöntem var: organik WOM(Word of Mouth). Organik Wom biri sizin ürününüz hakkında çevrim içi ya da çevrimdışı ortamda sizin haberiniz ya da teşvikiniz olmadan bir paylaşımda bulunmasıyla gerçekleşir. Organiz iletişim ölçülemez, kontrol edilemez, fakat ürününüzü ileriye götüren bir güç olabilir. Birinin ürününüzü organik olarak paylaşımda bulunmasını sağlayamazsınız fakat bunun olasılığını artıran bazı aksiyonlar alabilirsiniz.

  • Basit ürünler organik olarak yayılırlar
  • Güzel ürünler organik olarak yayılırlar
  • Ağrı, acı dindirici ürünler organik olarak yayılırlar
  • İnsanları “cool” gösteren ürünler organik olarak yayılırlar
  • Duygusal ürünler organik olarak yayılırlar
  • Eğlenceli ürünler organik olarak yayılırlar
  • Eşsiz ürünler organik olarak yayılırlar
  • Şaşırtıcı, hayret verici ürünler organik olarak yayılırlar

Aynı anda bunların hepsi olamazsınız, fakat bunlardan biri olmalısınız. Aksi halde organik olarak yayılma şansınız olmayacaktır.

TRAFİK ELDE ETME HAKKINDAKİ DÜŞÜNCELERİ SONA BAĞLAMA

Bu zamana kadar Growth Hacker funnel’ınızın başına ziyaretçi çekmenin 3 yöntemi olan itme, çekme ve ürün taktiklerinin hepsinden bahsettik. Aklınızda bulundurmanız gereken son birkaç şey daha:

TRAFİK ÇEKMEK BİR YEMEK TARİFİ GİBİDİR, YEMEK TARİFİNDEKİ BİR İÇERİK DEĞİLDİR.

Bir kek yaptığınızı hayal edin, fakat bu keki yaparken yalnızca bir malzemeden yapacaksınız ve diğer bütün malzemeleri çıkartacaksınız. Kekiniz sadece şekerden, yağdan ya da undan oluşacak, ve hiç de güzel bir tadı olmayacak. Trafik çekmek de aynı şey. Sahip olduğunuz birçok ürün bir araya gelerek bir trafik tarifi yaratan bir sürü malzemeye sahip. 2 çekme, 2 itme ve 1 ürün taktiklerinden oluşan bir karışım belki. Belki de 0 çekme, 1 itme, ve 4 ürün taktiğinden oluşuyor. Herbir ürün için bir standart olsaydı güzel olurdu belki ve o tekbir malzemeyi bulduktan sonra diğer malzemeleri gözden çıkarabilseydiniz güzel olurdu belki. Ama gerçekte durum ne yazıkki böyle işlemiyor.

TRAFİK ÇEKMEK HER ZAMAN DEĞİŞEN BİR YEMEK TARİFİ GİBİDİR

Ürününüze nasıl trafik çekeceğinizi öğrendikçe orada durum yeni şeyler denemekten vaz geçebilirsiniz. O anda çalışan şeyin ileride de çalışacağını düşünebilirsiniz. Fakat bu hiç de akıllıca değil. Bugün çalışan tarif büyük ihtimalle ileride değişecek ve sürekli bir değişim olacak. Yarın farklı olmayabilir belki ama bir 6 ay sonra kesinlikle farklı olacaktır. Trafik çekmekte ustalaşan Growth Hacker’lar asla bu konuda komforda değildirler.

DİĞER STARTUP’LARIN TRAFİK ÇEKME TARİFLERİ KOPYALAMAYIN

Diğer herkesin yaptığını yapmak son derece çekici, fakat her startup kendine özgüdür. Kendine özgü bir personeli, kendine özgü avantajları ve dezavantajları, kendine özgü müşterileri vardır ve trafik çekmek için kendine özgü bir planı olmalıdır. Diğer startup’ları kopyalamak dar görüşlülüktür. Kendi büyüme tarifinizi yaratmayı öğrenmelisiniz. Bu şekilde kekiniz daha lezzetli olacaktır.

BU YAZININ ÖZETİ

Birçok ürün viral olmaz

Ürün taktikleri diğer taktiklerin etkilerini artırıcı bir etkiye sahiptir

6 tane ürün taktiğinden bahsettik:

  • Ağ Davetleri
  • Telefon Rehberi
  • Email Listeleri
  • Sosyal Listeler
  • Sosyal Paylaşım
  • API Entegrasyonu
  • Geri Linkleme
  • Taşvikler
  • Organik

Trafik çekmek bir yemek tarifi gibidir, tek bir malzeme değildir

Trafik çekme her zaman değişen bir yemek tarifi gibidir

Diğer startup’ların trafik çekme tariflerini olduğu gibi kopyalamayın.

6 – Ziyaretçi Elde Etmek için İtme Taktikleri

Bir önceki yazıda çekme(pull) taktiklerinden bahsetmiştik. Şimdi de sıra itme(push) taktiklerinden bahsetmekte. Bir çekme taktiğinden yararlanırken siz genellikle tüketilen içeriktiniz. İnsanların bir şeyler öğrenmek için indirdiği slayttınız. İnsanların izlemek istediği video, okumak istediği kitaptınız. Siz aslında ürünün kendisiydiniz.

Bir itme taktiği genellikle tüketilen içeriğin arasına karışma işlemini içerir. İnsanların okumak istediği bir tweet değilsiniz, fakat aksine onların akış ekranlarında gözüken reklam “tweet”isiniz. Onların izlemek istediği bir YouTube videosu değilsiniz, fakat istedikleri bir videoyu izlemeden önce çıkan reklamsınız.

Çekme ve Hansel ile Gretel aslında birbirlerinin analojisi. Hikayede cadı şekerlerle çocukların akıllarını çelip onları kendi istekleriyle eve sokar. İtme ile de Üç Küçük Domuz(the Three Little Pigs) birbirlerinin analojisidir. Kurt üfler püfler ve evlerinin içine sızar. İnsanları kendi dünyanıza çekebilirsiniz, veya kendinizi onların dünyasına itebilirsiniz. Ziyaretçi elde etmek için çekme ve itme taktikleri arasındaki temel fark işte budur.

BİR MÜŞTERİNİN YAŞAM BOYU DEĞERİNİ ANLAMAK(CUSTOMER LIFE TIME VALUE)

Bir müşteriden yaşamı boyunca elde edeceğimiz gelire o müşterinin yaşam boyu değeri(LTV) denir. Eğer bir e-ticaret uygulaması geliştirdiyseniz ve müşteri başına yılda ortalama 100 TL’lik bir gelire sahipseniz, ve bu müşteriler tipik olarak art arda 5 yıl boyunca ürün alıp ondan sonra sizden sıkılıp alışveriş yapmayı bırakıyorsa, o zaman LTV(life time value)’niz 500 TL’dir.

Bu önemli çünkü itme ve çekme taktikleri arasındaki temel farklardan biri de itme taktiklerinin genellikle paraya mal olmasıdır. Yukarıdaki örneğimize geri dönecek olursak, eğer bir müşteri ortalama olarak 500 TL’lik bir değere sahipse o zaman bu müşterilerden birini funnel‘ınız boyunca harekete geçirmek için 501 TL harcamanız ahmakça olabilir. En nihayetinde her bir elde elde ettiğiniz kullanıcı (retained user) için 1 TL zarar elde etmiş olacaksınız. Bu yazıda bahsedilen taktikleri düşünürken bu basit fikri aklınızda tutmanızı öneririm.

İTME TAKTİĞİ 1: PARALI REKLAMLAR

Bu yöntem ilk bakışta bir growth hacking gibi gözükmeyebilir, fakat reklamlar kesinlikle ürününüzün dağıtımını “hack” edebileceğiniz yerlerdir. Hiçbir stratejiniz olmadan yalnıza reklam satın alırsanız, yaratıcılıktan kaçınırsanız, bir şeyler kazanmak için hiçbir şey yapmazsanız ve “multivariate test” sürecini ihmal ederseniz, o zaman diğer herkes gibi olacaksınız(ve bu büyük ihtimalle bir growth hacking olarak algılanmayacak). Fakat bizim yapacağımız şey bu değil. Bu itme taktiğine yaklaşırken aklınızda bulundurmanız gereken birkaç şey:

REKLAM PLATFORMUNUZUN OPSİYONLARINI İYİCE ANLAYIN

Bir reklam satın almanın bir sürü yolu var. Birçok insan sadece Facebook, Google ve Twitter olduğunu düşünüyor, fakat bunların dışında daha bir sürü platform mevcut. Linkedin’de bir reklam yayınlayabilirsiniz ki eğer kurumsal müşterilere ürün satıyorsanız son derece mantıklı. Carbon(carbonads.net) veya The Deck(decknetwork.net) gibi spesifik alanları hedefleyebileceğiniz niş ağlar da mevcut. Size site banner’ı, tweet, gazete sponsorluğu, RSS, ve mobil uygulamalarda reklam satın almanıza olanak sağlayan BuySellAds(buysellads.com) gibi bir platform da mevcut. Ayrıca göreceli olarak yeni olan ve yalnızca e-mail sponsorluğuna odaklanan LaunchBit(launchbit.com) gibi reklam ağları da bulunmakta. Hatta reklam satın almanız için kitle kaynak(crowdsourcing) kullanımına olanak sağlayan ve sadece hedefinizi aştığınızda sizden ekstra para alan Trada(trada.com) diye bir platform da mevcut. Sadece mobil kullanıcılara odaklanmak istiyorsanız Tapjoy(tapjoy.com) üzerinden reklam verebilirsiniz.

Aşağıda niş bir reklam platformu olan Carbon’un ekran görüntüsünü görebilirsiniz.

Aşağıdaki de genel reklam platformu olan BuySellAds’den bir ekran alıntısı.

Bu liste tekrar hedefleme(retargeting) konusuna odaklanan platformları içermiyor bile. Tekrar hedefleme size hangi insanlara hangi reklamı göstermeniz gerektiği konusunda kontrol sahibi olmanıza olanak tanıyor. Bu alanda AdRoll(adroll.com), Perfect Audience(perfectaudiance.com) ve Retargeter(retargeter.com) gibi birçok platforma sahipsiniz.

Aşağıdaki Inc. Magazine tarafından 1 numara olarak seçilen AdRoll’dan alınma bir ekran görüntüsünü görebilirsiniz.

Son birkaç yıldır reklam ağları sayısında ciddi bir patlama yaşanmakta. Bir sürü opsiyonunuzun var, dolayısıyla ihtiyaçlarınıza en uygun olanı bulmanız açısından çok güzel bir şey bu.

SEÇTİĞİNİZ PLATFORMUN TEKNİK ÖZELLİKLERİNİ ÖĞRENİN

Spesifik ihtiyaçlarınızı karşılayan bir reklam platformu bulduğunuzda platformun sunduğu özellikleri öğrenmek zorunda olacaksınız.2476914 Para kazanma ve para kaybetme arasındaki fark şüphesiz ki platformun size sunduğu teknik ayrıntıları bilmek ile bilmemek arasındaki fark olacak. En ileri seviyede ve karışık platform büyük ihtimalle Google AdWords‘tür, ve bu üründe uzmanlaşmanız aylarınızı alabilir; fakat diğer opsiyonların çoğu bir hafta sonu gibi bir sürede yüksek oranda öğrenilebilir.

REKLAM SATIN ALMAK BİR İŞ MODELİ REKABETİDİR

Tek bir tıklama veya bir grup ‘impression'(online pazarlamada bir reklamın ne kadar görüntülendiğinin ölçüsü) için ne kadar2476915 harcamanız gerektiğini bilmek her zaman çok zordur, fakat yanıt aslında iş modelinizin bir faktörüdür. Bir başka şirketle aynı kitleyi hedefliyorsanız ve LTV’niz o şirketinkinden daha yüksekse, o zaman tepetaklak olmadan trafik için daha fazla ödeme yapabilirsiniz. Reklamları kullanarak müşteri kazanmak için yapabileceğiniz en iyi şey harika bir iş modeline sahip olmanız. Bu neredeyse adil olmayan bir avantaj çünkü herhangi bir hile ya da ipucu bu gücün üstesinden gelemez. Eğer müşteri çekmek için iki katı kadar para ödeyebiliyorsanız o zaman son derece korunabilir ve savunulabilir bir stratejiniz var demektir.

MÜŞTERİNİZİN ÇEŞİTLİ KARAKTERİSTİKLERİNİ GÖZ ÖNÜNDE BULUNDURUN

Müşterileriniz büyük ihtimalle bir sürü farklı platformdan erişilebilir durumdadır. Örneğin, müşterileriniz büyük ihtimalle Facebook2476916 veya Linkedin ağlarındadırlar. O zaman sizin ürününüzü istediklerinde hangi karakteristiklerden yararlandıklarına karar vermeniz gerekiyor. Biri Facebook’tayken arkadaşları ve ailesi hakkında düşünüyordur. Diğer insanların fotoğraflarına bakıyorlardır. İnsanlar Linkedin’deyken kurumsal merdivenin basamaklarını tırmanmak ve kendi hedeflerine ulaşmaları için diğerleriyle “network” oluşturmanın nasıl yardımcı olabileceği hakkında düşünüyorlardır. Eğer ürününüz “agile environment”larda proje yönetimi içinse o zaman Facebook’u seçmemelisiniz, her ne kadar teknik olarak demografik kitlenize erişebilseniz de… Evet, reklamınızı görecekler,     fakat o anki akıl ve duygu durumları(karakteristikleri) doğru olmayacak çünkü kendinizi onlara yanlış yerde tanıtıyorsunuz. Bir reklam   platformu seçmeden önce daima müşterilerinizin ürününüzü kullanırken sergiledikleri karakterleri göz önünde bulundurun ve ona uygun platform seçin.

MÜMKÜN OLDUĞU DURUMLARDA REKLAM AĞLARINI SAVUŞTURUN

Bu taktik kolayca ölçeklenmeyebilir, fakat hala bahsetmeye değer bir konu. BuySellAds(ya da diğer sitelere) gidip takipçi kitlenizin2476918 okuduğu belirli bir blogda banner reklam satın alabilirsiniz. Fakat, aradaki köprüyü atlayıp(BuySellAds) direkt olarak o bloğun sahibine gidip anlaşırsanız iki nedenden ötürü daha ucuz oranlar alabilirsiniz. Birincisi, BuySellAds herbir ‘transaction'(işlem, hareket) üzerinden para almaktadır, yani eğer direkt olarak blog sahibine giderseniz aradaki para kaybından kurtulmuş olursunuz. İkincisi,       pazarlık edebilirsiniz.

EĞER TIKLAMA BAŞINA BEDEL ÖDÜYORSANIZ HER TIKLAMAYI VASIFLANDIRIN

Reklam almanın iki yolu var. İlk olarak reklamları CPM bazında alabilirsiniz. Bu yöntemde reklamınızın gösterilme sayısı için para2476919 ödersiniz ve reklamlarınızın ne kadar tıklama aldığı önemli değildir. İkinci olarak da tıklama başına para ödersiniz ve reklamınızın ne kadar göründüğü önemli değildir, sadece reklamınıza tıklandığında para ödersiniz. Eğer tıklama başına para ödüyorsanız insanlar ciddi biçimde ürününüzle ilgilenmiyorlarsa reklamınıza tıklmalarını istemezsiniz çünkü her tıkladıklarında siz para ödemek zorunda kalırsınız. Neyse ki, reklamın kendisini kullanarak tıklamayı vasıflandırmak için yapabileceğiniz şeyler var. Ürününüzün fiyatını reklamın içerisine koyarak sadece bu parayı harcamaya niyetli insanların reklama tıklamalarını sağlayabilirsiniz. Ayrıca, eğer aynı       duygu onları sizden ürün almaya teşvik etmeyecekse insanları içeri çekmek için duygu kullanmayın. Eğer ürününüz kedilerle ilgili bir     ürün değilse veya kedilerle bir bağlantısı yoksa, sadece kedi sevenleri tıklatmak için reklamınıza sevimli kedi resmi koymayın.

REKLAMINIZIN FARKLI VARYASYONLARINI TEST EDİN

Reklamların en temel derslerinden biri şu ki takipçi kitlenizin neye karşılık vereceğini hiçbir şekilde bilemezsiniz. Reklam yazınızın bir2476921 sürü varyasyonunu, reklamda kullandığınız görsellerin ve resimlerin farklı varyasyonlarını ve yazınızın ve görsellerinizin birlikte farklı varyasyonlarını test etmeniz gerekiyor. Elde edeceğiniz rakamlar size reklamınızı hangi varyasyonla vermeniz gerektiğini söyleyecektir, fakat bunu sezgileriniz ve öngörüleriniz büyük ihtimalle net olarak yapamayacaktınız.

İTME TAKTİĞİ 2: REKLAM TAKASI

Sitenize trafik çekmek için en kolay ve bedava yollardan biri de başka bir şirketle çapraz promosyon yapmaktır. Halihazırda hedef kitlenize hizmet veren bir şirket bulursanız ve onlara bir tehlike teşkil etmiyorsanız(yani birbirinizin rakibi değilseniz), birbirinizin promosyonunu yapmanız için bir sürü yönteminiz var demektir. Aşağıda size yöntemler hakkında beyin fırtınası yaparken yardımcı olacak birkaç öneri bulabilirsiniz:

2476922TWEET TAKASI

Her şirket kendi takipçi kitlesine diğer şirket hakkında tweet atar.

2476924FACEBOOK GÖNDERİ TAKASI

Her şirket kendi Facebook sayfasında diğer şirket hakkında gönderiler paylaşır.

2476925ÖZEL EMAİL TAKASI

Her şirket kendi mail listesine diğer şirket hakkında mail atar.

2476927SPONSORLU EMAİL TAKASI

Her şirket kendi mail listesine “newsletter” gönderirken “spondored by” ile başlayan ve diğer şirketin sayfasına bağlanan bir link koyar.

2476928 REKLAM ALANI TAKASI

 Her şirket diğer şirkete kendi sitesinde veya bloğunda banner reklam yayınlamasına izin verir.

2476929YAYIN ÖNCESİ VİDEO TAKASI

Her şirket diğer şirkete video reklam alanı verir.

2476930 EŞANTİYON TAKASI

 Her şirket kendi bloğunda diğer şirketten bir eşantiyonun promosyonunu yapar.

İTME TAKTİĞİ 3: İŞTİRAKLER(AFFILIATES)

İnsanları sitenize itmenin diğer bir yolu da iştirakler kiralamaktır. İştariklik, başka birine sizin koyduğunuz her bir hedefe(sitenize ziyaretçi çekmek, bir üyeyi aktifleştirmek, gibi) ulaşması halinde para ödemektir. Bir iştirak bu yazılarda bahsedilen bir sürü taktiği kullanabilir, fakat bu taktikleri kendiniz yapmak yerine onların bunu yapması için onlara para ödersiniz. Bu taktikleri kullanacaksanız bilmeniz gereken birkaç şey:

MÜKAFATLAR(TEŞVİKLER) HAKKINDA DİKKATLİCE DÜŞÜNÜN

2476931Bir iştirake her yeni ziyaretçi kaydı(signup) başına 100$ ödüyorsanız fakat bu yeni kaydın belirli bir ay boyunca sitenizden gitmemesi(sitenizde ayrılmaması) gerektiğini belirten bir şartınız yoksa, o zaman mükafatlarınızı yanlış ayarlamışsınız demektir. Bu durumda iştirakinize size üyeliğini hemen iptal edecek düşük kalitede müşteriler getirdiği için para ödersiniz! Öyle bir sistem tasarlayın ki iştirakiniz siz çıkar sağladığınız sürece çıkar sağlayabilsin.

KENDİ İŞTİRAKLIK ÇÖZÜMLERİNİZİ ÜRETMEYİN

2476932İştiraklık hizmeti sağlayan bir sürü servis var. Commission Junction(cj.com) gibi sizi iştirakçilerle bağlayan bir sistem mevcut, ve DirekctTrack(directtrack.com) veya Omnistar(osiaffiliate.com) gibi iştirak ödemelirinizi takip etmenizi sağlayan sistemler mevcut.

Aşağıda iştiraklık alanında ezici bir güç olan Commission Junction’dan bir  ekran görüntüsünü görebilirsiniz.

HER BİR İŞTİRAKI ÖNCESİNDEN DİKKATLİCE İNCELEYİN

2476933Biri sizin için bir iştirak olduğunda bir ölçüye kadar sizin işinizi temsil ediyor olacak. Kullandıkları taktikler, takındıkları dil, ve genel stilleri size yansıyacak. Bir çalışan olmayabilirler, ulaştıkları insanlar için sizin markanızın ön yüzü konumunda olacaklar. İştiraklerinizi çok dikkatli seçin.

İTME TAKTİĞİ 4: DİREKT SATIŞ

Dürüst olmak gerekirse, bu growth hacking olarak kategorize edilmesi çok zor bir yöntem, fakat bu funnel’ınızın üstüne trafik çekebileceğiniz bir yöntem. Direkt satış takımları her tür ürün için çalışmazlar, fakat bazı durumlarda yapmaya değerli bir taktik. Bir startup için gerçekleştirilmesi zor bir yöntem bu fakat bunu uygulayıp başarılı olan startup’lar da var.

BU YAZININ ÖZETİ

Bir itme taktiği genellikle tüketilen içeriğin arasına karışma işlemini içerir.

İtme taktikleri genellikle paraya mal olur.

Söz konusu itme taktikleriyse işin içine para girdiğinden müşterilerinizin hayat boyu değerini(CLV) anlamanız gerekir, böylece onları kazanmak için onlardan kazanacağınız paradan daha fazla para ödemeyin.

4 itme taktiğinden bahsettik:

Paralı Reklamlar

Ürün Takası

İştirakler

Direkt Satış

5 – Ziyaretçi Çekme(pull) Taktikleri

A-ha! Ne yaptığınızı gördüm. Direkt bu yazıya atladınız çünkü growth hacking‘in sadece sitenize ziyaretçi çekmekten ibaret olduğunu düşünüyorsunuz. 1-2-3-4 numaralı yazılarda yapılan temel işleri(ön hazırlıkları) gerçekten umursamıyorsunuz. Büyük ihtimalle bundan sonraki yazıları da umursamayacaksınız çünkü sadece trafik istiyorsunuz.

Bak, anlıyorum. Sitene yeni ziyaretçiler çekmek senin için çok önemli ve bunun önemli olmadığını da iddia etmeyeceğim. Fakat, kendine bir iyilik yap ve growth hackingin sadece bu boyutuna odaklanma. Eğer tüm istediğin buysa sitene kullanıcı çekersin çekmesine fakat growth hacking’in bütünsel bakış açısına sahip olmadan ziyaretçileri aktif edemeyeceksin veya elinde tutamayacaksın, ve trafiğin neden daha büyük bir denklemin sadece bir parçası olduğunu hoş olmayan yollardan öğreneceksin. Bu yazıların hepsini oku, sadece bu kısmı değil.

ZİYARETÇİ ÇEKMENİN 3 P’Sİ

Demek ki sitene ziyaretçi çekmek istiyorsun. En nihayetinde trafik çekmenin üç yolu var. Ne daha fazlası ne de daha azı, sadece üç yol. İnsanları sitene çekebilirsin(pull), onları sitene itebilirsin(push) veya ürününü kullanarak ziyaretçi çekebilirsin(product). Bu methodların birbirinden farkı ne? Sorduğunuza sevindim.

Çek(Pull)

Sitene ziyaretçi çekmenin ilk yolu insanları sitene çekmektir. Onlara sitene gelmeleri için bir neden sunmalısın. Onları ayartmalısın, teşvik etmelisin, ve sonrasında kendine çekmelisin. Mesela herhangi bir konu hakkında bilgi edinmek için Google’da bir şey arattın, ilk sırada karşına WikiPedia çıktı ve sen de ona tıkladın. Bu bir çekme(pull) örneğidir. Sen Wikipedia’ya çekildin. Wikipedia seni online olarak bulmak zorunda değildi, aksine sen gidip onu buldun.

İt(Push)

İsminden de anlayacağın üzere bu yöntem çekme yönteminden biraz daha agresif bir yöntem. İnsanları ayartmak yerine gidip onları sitene itiyorsun. Senin buraya gelmen aslında bu yöntemle oldu… Büyük ihtimalle Facebook ya da Linkedin’den paylaşımı görüp ona tıklayarak buraya geldin. Yani sen bu siteye itildin dostum. Gidip insanların online olduğu yerleri bulursun ve onları kendi sitene veya ürününe doğru itersin.

Ürün(Product)

Trafik çekmenin üçüncü yöntemi de ürünün kendisi aracılığıyla olan yöntemdir. Eğer bir kere bile bir arkadaşını yeni bir sosyal ağa davet ettiysen, o zaman bir ürünün yeni trafik çekmede nasıl kullanıldığını anlamışsındır. Ürünü kullanan herkes ürünü kullanması için diğer insanları davet eder.

Çekme ve İtme taktikleri yeniden tanımlanan dağıtıma dayanan growth hacking‘in birer örneğidir. İnsanların online olarak nasıl bir akış sergilediğini biliyorsan o zaman onları tam olarak ayartabilirsin ya da güç kullanarak sitene çekebilirsin, fakat insanların online olarak nerelerde toplandığını ve onların dijital olarak diğer yerlere gitmesine nelerin sebep olduğunu bilmiyorsan o zaman onları etkin bir şekilde sitene çekemezsin veya itemezsin. Çekme ve itmenin aksine, üçüncü P olan ürün(product) dağıtımın yeni tanımına bel bağlamaz. Fakat ürünün yeni tanımına bel bağlar. Birinci yazıda da söylediğim gibi, ürünler artık kendi müşteri kazanımında aktif bir rol oynayabilirler ve bu da dünya tarihinde son derece radikal bir konsepttir.

Şunu fark etmek önemli ki bütün bu P’ler doğru ortamda, doğru kişi tarafından uygulandığında işe yararlar. Farklılıklarını okuyorken büyük ihtimalle birinin diğerlerinden daha iyi olduğunu varsaydın fakat bunların hepsi GH‘nin cephanesinde önemli bir yer tutuyor. Birçok ürün aslında çekme, itme ve ürün metodolojilerinin birer karmasını kullanıyor.

ÇEKME STRATEJİSİNİN TEMELLERİ

Takip eden çekme taktiklerini uygulamayı düşünürsen, sahip olduğu bazı ortak özellikler şöyle:

Bu taktiklerin maliyeti genellikle zaman ve personel biriminde ölçülür, fakat sitene ziyaretçi çekmek için direkt olarak para ödemiyorsun.

Bu taktikler insanları siteni ziyaret etmeleri için ayartan değerli bir şey etrafında dönerler. Eğer değer sağlamayı durdurursan onları sitene çekemezsin.

ÇEKME TAKTİĞİ 1: BLOGGING VEYA GUEST BLOGGING

Siteye ziyaretçi çekmek için denenmiş ve doğrulanmış yöntemlerden biri bloglama(blogging) veya konuk bloglama(guest blogging)’dır. Blog postları siteye trafik göndermek için mükemmel derecede uygundur. Nedeni:

  • Blog postları anahtar kelimeler(keywords) bakımından zengindir ve Google tarafından kolayca endekslenirler. Bu da SEO stratejinizde yarar sağlar.
  • Blog gönderileri katlanarak artan bir etkiye sahiptir. Daha çok yazarsan, zamanla insanları ürününe doğru çekme şansın daha çok artar.
  • Bloglar genellikle spesifik nişlere odaklanırlar, yani eğer guest blogging yapıyorsan tek bir postla pazarının büyük bir kısmına dokunabilirsin.
  • Bloglar genellikle RSS okuyucular aracılığıyla dağıtılır, yani blog yazılarını diğer insanlara ulaştıracak iç mekanizma vardır.
  • Blog yazıları insanları eğitmek konusunda harikadırlar ve sizin ürününüz hakkında bilgilendirilmiş olan insanların belirlemiş olduğunuz “funnel” boyunca ilerlemesi çok daha olasıdır.
  • Blog gönderileri sizi fikir lideri olarak konumlandırabilir ve insanlar tanınmayan birindense bir uzman tarafından üretilen ürünleri kullanmayı tercih edeceklerdir.
  • Blog sahipleri daima yeni konuk gönderileri ararlar. Yani konuk bloglama yapmaya niyetliyseniz bir blog sahibi bulmanız çocuk oyuncağı.

Bloglama inanılmaz derecede basit bir iştir. Vermeniz gereken tek karar kendi bloğunuzu mu kurmanız yoksa konuk bloglama mı yapmanız gerektiği. Konuk bloglama yapmanın ana sebebi okuyucu kitlenizi kendinizin yaratmanıza gerek olmaması. Sadece gönderiyi yaratmanız gerekiyor. Bir gönderi yaratmak o gönderiyi okumaya istekli insanları bir araya getirmekten çok daha kolay bir iş. Fakat, kendi bloğunuza başlamanızın ana yararı bütün kontrollerin sizde olmasıdır. Eğer okuyucu kitlenizi kendiniz yaratıp geliştirirseniz içerik üzerinde o kadar esnek olabilirsiniz. Gelecekte bloğunuzdan kendi ürününüze trafik göndererek daha agresif bir strateji seçmek isteyebilirsiniz, fakat eğer içeriklerinizin hepsine başka biri sahipse o zaman bu olasılığa sahip değilsiniz. Bunlardan herhangi biri doğru ya da yanlış değil, tamamen seçtiğiniz stratejiye bağlı kararlar. Hatırlayın, her zaman ikisini birden yapabilirsiniz. Belki de konuk bloglama ile başlayıp sonradan kendi bloğunuzu kurarak ona geçebilirsiniz.

Hangi rotayı seçerseniz seçin blog gönderilerinizi ürününüze doğru uzanan bir yol haline dönüştürmemelisiniz. İnsanları nazikçe içeri çekiyorsunuz, onlara sitenizi ziyaret etmeli için yalvarmıyorsunuz. Aslında niyetiniz tabii ki insanları ürününüzün sitesine çekmek. Fakat bu niyetinizi alelade bir şekilde belli ederseniz insanlar bloğunuzdan kaçacaklardır. Birazcık yaratıcılık ile gönderilerinizi reklam gibi algılanmayacak şekilde düzenleyip insanları gerekli linke tıklatarak ürün sayfanıza çekebilirsiniz. Yeni bir gönderiye daima ürününüze linklenen bir biyografi ile başlayın(kimse sizi bundan esirgemeyecek) ve gönderi içinde ürününüze yalnızca bir kere linkleme yapmaya çalışın, ve bunu sadece gönderinizde söylediğiniz şeyle alakalı olduğu zaman yapın.

Ayrıca, okunan ve paylaşılan blog gönderileri duygusal, modayla ilgili, eğitici, zevk verici, eğlendirici ya da şaşırtıcı(diğerleri arasında) bir yanı olan gönderilerdir. Bu tarz dikkatinizi çeken bir gönderi olduğunda bir kenara not edin, ve sonra tersine mühendislik ile kendi yazılarınızı onlar gibi yazmaya çalışın.

İnanılmaz bir hızla büyüyen ve büyümeye devam eden Buffer büyüme motoru olarak konuk bloglamayı kullandı. Kurucuları Leo konuk bloglamayı nasıl kullandığına dair bir gönderi bile yazmış:

http://leostartsup.com/2011/06/how-i-used-guest-blogging-for-my-startup

ÇEKME TAKTİĞİ 2: PODCASTING VEYA GUEST PODCASTING

Podcasting diğer bir harika çekme taktiğidir çünkü ses doğal olarak çekme özelliğine sahiptir. Bloglar gibi, podcast’ler de hali hazırda dağıtım mekanizmasına sahiptirler(podcast dinleme uygulamaları), fakat trafik elde etme bakımından bloglama ve podcasting arasında farklar var:

  • Podcast’ler arama motorları tarafından kolayca endekslenemezler.
  • Bir blog gönderisindeki linke tıklamak her zaman daha kolaydır, fakat bir podcast’te bahsedilen linki ziyaret etmek daha zor ve zahmetlidir.
  • Podcast’ler sayıca azdır ve daha az bir kitleye hitap ederler.

Çok kreatif(yaratıcı) bir fikriniz yoksa, podcast’ın ürününüz için bir trafik kanalı olması ihtimali yok denecek kadar az. Aşağıdaki yöntemleri deneyebilirsiniz:

  • Ne yaparsanız yapın, nişe odaklanın. Büyük ihtimalle genel ilgi alanı podcast’leri ile rekabet edecek kadar üretim tecrübesine ya da bütçeye sahip değilsinizdir. Bunun yerine, çok dar bir niş belirleyin ve burayı domine etmeye çalışın.
  • Her hafta bir bölüm yayınlama gayesiyle podcast’e başlamayın. Bunun yerine, toplamda 10 bölüm hedefi koyun ve podcast’lerinizi hedef pazarınızın öğrenmek isteyeceği bir konu hakkında eğitici bir kurs olarak yayınlayın. Güzel bir albüm kapağıyla ve harika bir girişle insanlar sizi bulacak ve merak edeceklerdir. Asla daha fazla podcast vadetmeyin, ve onlara niyetinizin ne olduğunu ilk bölümde peşinen söyleyin.
  • Ziyaretçi olarak birkaç podcast’e (devam et)————————

Tabii ki her hafta yeni bölümler yayınlayan podcast yaratarak geleneksel rotadan gitmek mümkün fakat burada bilmeniz gereken bir şey var. Podcast’ler iyi işler çıkarabilmeleri için çok zaman gerektirirler, ve düşük kalitedeki sunumlar dikkate değer bir trafik yaratmayacaktır. Bu yüzden, yaratıcı olun ve bir growth hacker gibi düşünün, bir podcast’çi gibi değil. Medium’larını(ortam, araç, mecra) kullanın, fakat metotlarını kullanmayın.

Tweak! podcast’in güzel bir örneğiydi. Aşağıdaki linkten incelemenizi tavsiye ederim.

ÇEKME TAKTİĞİ 3: E-KİTAP’LAR, KLAVUZLAR VE BEYAZ BÜLTENLER

Etkili bir çekme stratejisi yaratmanın bir parçası da takımınızın genel görüntüsüne uyacak taktikler seçmektir. Bazıları kısa ve düzenli aralıklarla küçük küçük şeyler yapmayı severler(bloglama ve belki podcasting gibi). Diğerleri geniş aralıklarla büyük bir enerjiyle iş yapmayı ve devasa işler çıkartmayı severler. Bu geçerli bir taktiktir ve yazılı büyük dokümanlar trafik çekmek açısından birçok avantaja sahiptir:

  • E-kitaplar, kılavuzlar ve beyaz bültenler kendilerine belirli bir çekime sahiptirler. Yeni bir blog gönderisini görmezden gelmek bir şekilde kolaydır, fakat ilgilendiğiniz niş bir konuda geniş kapsamlı bir doküman bulduğunuzda bunu görmezden gelmeniz çok zor.
  • E-kitaplar, kılavuzlar ve beyaz bültenler insanlarda yüksek değer algısına sebep olurlar ve dolayısıyla bunları indirebilmeleri karşılığında okuyuculardan email adreslerini rahatlıkla alabilirsiniz. Bu bir adil ticarettir ve ileride funnel‘ınız için kullanabileceğiniz bir mail listesi oluşturmanıza yardımcı olur.
  • E-kitaplar, kılavuzlar ve beyaz bültenler iyi uygulandıklarında sosyal medya mecralarında çok etkin bir şekilde yayılırlar.
  • Bir yazar olarak(hatta kişisel yayıncı olarak) siz bir tür fikir lideri olursunuz ve insanlar sizin yarattığınız ürünü kullanmak isterler.
  • E-kitaplar, kılavuzlar ve beyaz bültenler insanları spesifik olarak sizin ürününüz hakkında eğitmek için yazılabilir. Bilgilendirilen ziyaretçiler üye ve kullanıcı olmaya daha yatkın olurlar.

MailChimp, yukarıda listelenen bütün sebepler için yayınladıkları birçok kılavuza sahip.   http://mailchimp.com/resources

ÇEKME TAKTİĞİ 4: INFOGRAPHICS (BİLGİ GÖRSELLERİ)

Bilgi Görselleri insanları ürününüze doğru ayartabilir çünkü bunlar uzmanlığı ve estetik bir zevki aynı anda sergilerler. Görselleştirmeler güçlü araçlardır ve sosyal medya aracılığıyla son derece hızlı yayılırlar. Visual.ly’den Adam Breckler bilgi görseli oluştururken aşağıdaki tavsiyelerde bulunuyor:

İYİ BİR TOPİK SEÇİN

Akıllıca, heyecan verici, kayda değer ya da başka sebeplerden ötürü ön plana çıkan bir konu seçin. Sıkıcı ya da alakasız olmayın.

DOĞRU VERİLERİ BULUN

İnsanlar bazen verileri kendi yaratmaları gerektiğini varsayıyor, fakat sıklıkla basit bir Google araması önceden derlenmiş veri setini ortaya çıkartabiliyor.

VERİYİ ANALİZ EDİN

Veriye olduğu gibi bakmaya çalışın. Veriyi ihtiyaçlarınıza uyacak şekilde bükmeye, değiştirmeye çalışmayın.

HİKAYEYİ İNŞA EDİN

Verinin ne söylemesi gerektiği hakkında bir beyin fırtınası yapın. Sayıları gerçekler(facts) koleksiyonu gibi sunmaktan ziyade uyumlu ve tutarlı bir hikayeye dönüştürerek sunmaya ihtiyacınız var.

BİR TASARIM KONSEPTİ BULUN

Artık hikayenizi görsel olarak anlatmanın yollarını düşünmenin vakti geldi.

TASARIMINIZI PARLATIN VE RAFİNE EDİN

Son rötuşlarınızı yapın ve her şeyin insanların dikkatini çekecek kadar yüksek kalite olduğundan emin olun.

BİLGİ GÖRSELİNİ DAĞITIN

Bilgi görselinizi kendi takipçi kitlenizi kullanarak(email listeleri, sosyal medya, vs.) ya da bilgi görselleri için pazar yeri platformu servisi gören Visual.ly gibi siteler üzerinden dağıtabilirsiniz.

Everlane online ortamda ateş fırtınası yaratan, çekişmeli birkaç tane bilgi görseli üretti. Bilgi görselleri tişörtler için mağazaların tipik kar yüzdelerini gösteriyordu. Everlane benzer kalitedeki tişörtleri daha düşük fiyatlardan sattığından bu bilgi görsellerinin doğru tip müşterileri onlara nasıl çektiğini görmek çok kolay.

ÇEKME TAKTİĞİ 5: WEBINAR’LER

Çevrimdışı dünya seminerlere sahip, çevrim içi dünya ise webinar’lere. Bunlar birkaç sebepten ötürü yeni ziyaretçiler çekmekte çok başarılı kanallardır:

  • Webinar’lar genellikle canlıdırlar, bu sayede insanlar bunları kendi takvimlerine eklemeye ve bunları gerçek birer aktivite olarak görmeye mecburdurlar. Bir YouTube videosu herhangi bir zamanda izlenebilir, fakat insanlar webinar’lara “katılmak” zorundadırlar. Bir şey onların takvimlerinde olduğu zaman insanlar o şeyi ciddiye almaya daha yatkın olurlar ve webinar boyunca paylaşılan bilgileri daha ciddiye alırlar.
  • Webinar’lar genellikle sınırlı sayıda koltuğa sahiptir ve bu “sahte kıtlık” insanların webinar’ın içeriğinin seçkin ve önemli olduğunu düşünmesine sebep olur. Eğer birinin aklına önemli biriyseniz o insan funnel’ınız boyunca daha verimli bir şekilde ilerlemeye daha yatkın olur.
  • Webinar’lar karşılıklı etkileşime olanak tanır ve eğer biri sizinle etkileşime geçerse sizinle ve ürününüzle bir bağlantı kurar.
  • Webinar’lar insanları eğitir. Eğitimsel değer bakımından ne kadar çok şey verirseniz insanlar o kadar farklı şekilde karşılık göstereceklerdir.
  • Bir webinar ürününüz için bir çeşit özel promosyonla sonlandırılabilir ve bu da ürününüze trafik çekmenize yarayabilir.
  • Bir webinar birden fazla şirketin katkısıyla gerçekleştirilebilir ve böylece diğer şirketlerin takipçi kitlesinden yararlanabilirsiniz.

Unbounce “unwebinars” denen bir şeye ev sahipliği yapıyor.

ÇEKME TAKTİĞİ 6: KONFERANS SUNUMU

Konferanslar growth hacker‘ın trafik çekme yöntemleri dışında kalıyor gibi bir hisse kapılabilirsiniz, fakat bu bu konuda yeterince yaratıcı düşünmediğinizden kaynaklanıyor. Bir konferans sunumu sitenize çok değil ama birkaç ziyaretçi çekebilir ve gerekli olan hazırlanma miktarı çok yüksektir. Fakat, bir konferans sunumu daha etkin bir biçimde ziyaretçi çekmek için kullanılabilecek birçok yan ürün üretir.

Slayt Destesi

Eğer bir konferansta sunum yapıyorsanız büyük ihtimalle bir slayt desteniz vardır. Bu deste slideshare.com’a yüklenebilir ve artık ardınızda bıraktığınız kolayca paylaşılabilir bir teminata sahipsiniz demektir. İnsanlar bu sunumu görüp, inceleyerek sitenize gelebilir. Slideshare.com bir sosyal ağdır ve bu ağa yatırım yaparak iyi işler çıkarabilirsiniz.

VİDEO/SES

Birçok konferansta sunumunuz kayıt edilecektir ve bu da bu kayıtları şirketinizin bloğuna koymanıza, YouTube’a yüklemenize, email imzanıza yerleştirmenize veya drip email kampanları sırasından kullanmanıza olanak sağlar.

Bir sunumun yan ürünlerinin yanı sıra, aklınızda bulundurmanız gereken bazı diğer şeyler de var:

ANLIK RETWEET’LER

Bir konferanstaki sunumunuzda, sunumunuzu son tweet’inizi retweet eden dinleyicilere ürününüz üzerinde indirim yapacağınızı söyleyerek sonlandırırsanız saniyeler içerisinde büyük bir sosyal medya fırtınası yaratabilirsiniz.

İKNA

Steve Jobs neden sunumlar yaptı? Çünkü çok güçlüydüler. Eğer ağzınız laf yapıyorsa, dinleyicilere hükmedebiliyorsanız, o zaman bazen sahnede birkaç saniyede ürününüz için birçok trafik kaynağı yaratabilirsiniz. Hatırlayın, growth hacker‘lar hem sağ hem de sol beyinlidirler. Bazen ROI belirsiz olabilir, fakat bu onun varolmadığı anlamına gelmez.

Rand Fishkin, Moz’un CEO’su, 60’dan fazla slayta sahip ve bu slaytlar yüz binlerce kez görüntülenmiş durumda. Bu da kendi ürünü olan Moz.com için sayısız derecede yeni ziyaretçi yaratmakta.

ÇEKME TAKTİĞİ 7: SEO(ARAMA MOTORU OPTİMİZASYONU)

Bir bakıma, yukarıda bahsedilen bütün taktikler SEO açısından olağanüstü etkilere sahip. Birçok farklı türde içerik yarattığınızda (bloglar, podcast’ler, e-kitaplar, kılavuzlar, beyaz bültenler, bilgi görselleri, webinar’lar, slayt desteleri, video/ses sunumları) arama motorları kendi alanınızda bir otorite olduğunuzu fark edeceklerdir ve belirli anahtar kelimeler(keyword) için sizi üst sıralara çıkaracaktır. Fakat, gerçekte iki tür SEO stratejisi vardır. Bunları içerik ve kod olarak adlandırabiliriz.

İÇERİK

İçerik üretmenin doğasından ötürü, SEO’nun nasıl işlediğini bilmeseniz bile onun için optimize olacaksınız. Sadece üretmeye devam edin, bu sayede nasıl bir algoritma olduğunu bile bilmeden SEO’yu kendi avantajınıza kullanmaya başlayacaksınız.

KODLAMA

Kodlamada birkaç değişiklik yaparak SEO stratejileri geliştirebilirsiniz. Linkleriniz anahtar kelimelerle optimize edilmiş durumda mı? H1 tag’leriniz uygun bir şekilde etiketlenmiş mi? Belirli tür içerikler için Schema.org tag’lerini kullanıyor musunuz? Güncel bir site haritasına sahip misiniz?

Eğer içerik ve kodun ikisini kullanabiliyorsanız o zaman bu açık ara en iyi senaryodur. Fakat, ikisini birden yapamasanız bile, bunlardan birini mutlaka yapmalısınız. Arama motorları hala internette gezinmenin ana yolları ve bu basit gerçeği görmezden gelmek hiç akıllıca değil. SEO önemli, ve birçok iş için SEO hala funnel‘larına trafik çekmek için birincil yol.

Udemy, yalnızca SEO uğruna, kurslarının transkriptlerini yaratarak bir deney yapıyor. Kurslarının genellikle paraya mal olduğunu göz önünde bulundurursak SEO bazı içeriklerin yazı formunda bedava olarak verilebilmesi için çok önemli.

ÇEKME TAKTİĞİ 8: SOSYAL MEDYA

Funnel‘ınızın başına trafik çekmenin bir yolu da sosyal medyadır(Twitter, Facebook, Tumblr, Pinterest, Reddit, etc) Aslında bunu yapmanın spam’a giren bir sürü yolu var. O yüzden ilk olarak ne yapmamanız gerektiğinden bahsedelim.

  • Eğer gerçekten onlarla bir tür ilişki kurmak istemiyorsanız, insanları sosyal ağlarda sırf dikkatlerini çekmek için follow veya unfollow etmeyin.
  • Hiçbir tür takipçi satın almayın. Bunlar sizin pazarınız değil. Mesajınızı güçlendirmeyecekler. Tamamen para kaybıdırlar.
  • İnsanları rahatsız etmeyin. Kendinizi onların yerine koyarak ve tarz mesajlar almak istediğinizi sorgulayın.

Aşağıda sosyal medyayı kullanarak nasıl trafik çekebileceğinize dair ipuçlarını bulabilirsiniz:

  • Gerçekten ürününüz kullanabilecek insanlarla iletişime geçmeye çalışın.
  • Pazarınızın demografik bilgilerini elde edin.
  • Her fırsatta değer sağlamaya çalışın. Soruları cevaplayın. Tavsiyeler verin. Onlara bir şekilde yardım edin. Sadece almayın, aynı zamanda verin.
  • İlginç içeriklerin merkezi olun, içerikleri siz üretin ya da üretmeyin. Eğer harika içeriklerin koleksiyoncusu olarak saygınlık kazanırsanız insanlar gönderilerinize ya da tweet’lerinize aldırış edeceklerdir(kendiniz gerçekte hiçbir şey üretmeseniz bile)
  • Sosyal medya bir koşuşturma değildir, maratondur. Sosyal medya genellikle size anında büyük bir trafik sağlamayacaktır. Aksine, aslında takipçi ve beğeni sayınızı küçümsemelisiniz. Eğer 100k takipçiye sahip biri sizi retweet ederse, takipçilerinizin demografik profili mükemmel şekilde uyuşmaz ise(ki uyuşsa bile bunun gerçekleşmesi gene şüpheli) bu büyük ihtimalle size çok fazla yeni trafik yaratmayacaktır.
  • Sosyal medya diğer her şey gibi bir müşteri destek merkezidir. Şaşırtıcı bir biçimde, bu yeni trafik için bir araç olabilir. İnsanlar gösterişli müşteri desteğinizi izlediklerinde ürününüzü denemeye daha yatkın olacaklardır.
  • Taktik 1’den 8’e kadar yarattığınız içerikleri güçlendirmek için sosyal medyayı kullanın. Sosyal medya diğer taktiklerle birlikte çok güzel bir şekilde çalışabilir.
  • Her şey gibi, yaratıcılık yeni olasılıklar yaratabilir. Skittles bir keresinde komple ana sayfasını bir Twitter feed’e dönüştürmüştü. Aynı gün içerisinde Twitter üzerinde Skittles’dan bahseden sayısız tweet almışlardı.

Aşağıda Skittles’ın, Skittles’dan bahsedilen her tweet’i gösterdiği ana sayfasını görebilirsiniz.

ÇEKME TAKTİĞİ 9: YARIŞMALAR

Yarışmalar ürününüze yeni trafikler çekmek için harika bir yol. Gerçekte birçok insan yarışmaların ne kadar güzel çalışabileceğinden habersiz. AppSumo’yu hiç duydunuz mu? Email listelerini nasıl 700k’nın üzerinde büyüttüklerini bilmek ister misiniz? Bir yarışma ile başladılar. Yarışmalar hem küçük hem de büyük şirketler için iyidir, dolayısıyla yarışma kampanyası yaratırken hatırlamanız gereken birkaç şey var:

  • Takipçi kitlenize uygun hediyeler verin. Her yarışma bedava iPad vermek zorunda değil. Onlara sizi temsil eden bir şey verin. Örnek olarak, eğer AirBNB iseniz bedava konaklama verin. Bu önemli çünkü eğer karşılık olarak onların email adreslerini almak istiyorsanız demografiğinizi temsil etmeyen gereksiz email listesi oluşturmak istemezsiniz. Ödül olarak iPad vermek size vasıfsız bir liste sağlayacaktır ve bu listedeki insanları funnel’ınız boyunca harekete geçirmekte zorlanacaksınızdır.
  • Ödül olarak deneyim yaşatın, sadece ürün ya da servis vermeyin. Hangisinin daha çok hatırlanacağını düşünüyorsunuz: iPad’in mi yoksa favori müzik grubunu görmeleri için harika bir yere yolculuğun mu? Bunlara aşağı yukarı aynı maliyete sahip olabilir, fakat etkileri inanılmaz ölçüde farklı olabilir.
  • En azından 1., 2. ve 3. için ödülleriniz olsun. İnsanlar kazanma şanslarının olduğunu hissetmek isterler, o yüzden sadece bir tane büyük ödül vermek yerine ödülü 1, 2 ve 3. ye olacak şekilde bölün.
  • Onları kazanmaları için daha çok bilgi vermelerini teşvik edin. Bir email adresi için bir hakları olsun. Eğer arkadaşının mail adresini paylaşırsa o zaman iki tane hakları olsun. Eğer retweet ederlerse üç hakları olsun. Olayı anladınız. Onlara listenizi büyüttükleri ve ürününüzün tanıtımını yaptıkları oranda kazanma şanslarını artırmalarına yardımcı olun.
  • Yarışmayı ilgi görmesi için yeterince uzun tutun.
  • Yarışmanın kazanını duyurduğunuzda büyük bir iş yapın ve bu anı bir sonraki etkinliğin habercisi olarak kullanın. Bu online ortamda ses yaratacaktır ve dolayısıyla da potansiyel trafiğe yol açacaktır.

AppSumo hala yarışmalar düzenlemeye devam ediyor. Çalışan bir şey buldular ve bundan niye vazgeçsinler ki? Ayrıca, ödüllerinin ne kadar deneyimsel olduğunu fark edin.

ÇEKME TAKTİĞİ 9: UYGULAMA PAZAR YERLERİ (APP MARKETPLACES)

Yeni ziyaretçiler çekmenin bir kanalı da son birkaç yılda yükselen pazar yerleridir. Apple Store bir pazar yeridir. Google Play Store da bir pazar yeridir. Aslında iki tür uygulama pazar yeri vardır ve bunlar birbirinden farklıdır.

B2C UYGULAMA PAZAR YERLERİ

Şirketiniz müşteriler için bir uygulama yaptıysa o zaman siz büyük ihtimalle Apple App Store gibi bir B2C uygulama mağazasındasınızdır. Bu metot aracılığıyla yeni kullanıcılar elde etmek istiyorsanız aklınızda bulundurmanız gereken birkaç şey:

  • İnceleme yazıları(reviews) son derece önemli. İlk olarak kötü yorumlar almamak için gerekli olan ne varsa yapın ve insanlar kötü bir yorum yazdıktan sonra o insanları yazılarını değiştirmeye ikna etmeye çalışın.
  • Ekran görüntüleri uygulamanıza açılan pencerelerdir, dolayısıyla bunları mükemmelleştirin. Eğer görsel olarak insanları ayartamazsanız onları uygulamanıza çekemezsiniz.
  • Uygulamanızın ismi hakkında dikkatlice düşünün. Aranması ve bulunması kolay bir kelime olmalı.
  • Yeni trafik için yalnızca pazar yerlerine bel bağlayamazsınız. Basitçe pazar yerlerinde çok fazla uygulama var ve samanda bir iğnesiniz siz. Bu yazıdaki diğer taktikleri de uygulamak zorundasınız.

B2B UYGULAMA PAZAR YERLERİ

Eğer ürününüz iş amacıyla kullanılabiliyorsa o zaman bunu göreceli olarak yeni bir pazar yeri türü olarak düşünebilirsiniz. Salesforce ve Mailchimp gibi şirketler artık kendi ürünleriyle entegre çalışan uygulamalar için kendi pazar yerlerine sahipler. B2B uygulama pazar yerlerini düşünürken yardımcı olabilecek bazı ipuçları:

  • Bu pazar yerleri daha az kalabalıktır, dolayısıyla fark edilmek daha kolaydır.
  • B2B pazar yerleri ürününüzü kendi bloglarında, email listelerinde veya diğer yöntemlerle tanıtmaya daha yatkındırlar.
  • Bazen B2B pazar yerleri size ürününüzü kendi ürünleriyle entegre çalışacak şekilde düzenlemeniz için para ödeyebilirler.
  • Tüketici pazar yerlerinde olduğu gibi, incelemeler ve ekran görüntüleri önemlidir. Bunlara yeterince dikkat edin.
  • Bu marketlerde açıklama alanınıza ileride entegre olarak çalışacağınız ürünleri listelediğiniz “çok yakında” diye bir alan ekleyebilirsiniz. Bu B2B arama motorlarında bulunabilirlik için mükemmel bir yöntem çünkü açıklama alanınızda anahtar kelime olarak birçok ürünü listelemiş oluyorsunuz.

AppExchange Salesforce’un B2B uygulama pazar yeridir.

ÇEKME TAKTİĞİ 11: PAZARLIK SİTELERİ

Groupon’un yükselişinin (ve yavaşça ölüşünün) ardından ortalıkta birçok pazarlık sitesi türedi. Birçok niş için, elle tutulur bir email listesine sahip, ürününüzün tanıtımı yapmaya istekli bir pazarlık sitesi vardır. Bu şirketlerle aranjmanlık son derece direktdir. Takipçi kitleleri için bir indirim sağlarsınız, ve buna karşılık onlarda ürününüzü dağıtır. Bu trafik çekmenin hızlı bir yolu, ve bu şirketler ilişki kurmanın bu kadar kolay olması bunu denenmeye değer kılıyor. Pazarlık sitelerinin bir diğer beklenmedik yan faydası da pazarlık sitesinden gelmiş olmasına rağmen tam ücretle ürününüzü satın alan insanların sayısı. Internet çok garip bir ortam ve bu tahmin ettiğinizden de daha garip bir ortam olacak.

Mighty Deals tasarımcılara hizmet veren bir niş pazarlık sitesi.

ÇEKME TAKTİĞİ 12: LOPA [LEVERAGE OTHER PEOPLE’S AUDIENCE]

Bunun yukarıda anlatılan birçok taktikte kullanılmasına rağmen LOPA hakkında ayrıca konuşmak faydalı olacaktır. Temel olarak, takipçi kitlesi oluşturmak son derece zor bir iş. Eğer bir başkanın takipçi kitlesini kaldıraç olarak kullanabilirseniz o zaman bundan avantaj sağlayabilirsiniz. Konuk bloglama(guest blogging) LOPA’nın bir formudur. Guest Podcasting’de LOPA’nın bir formudur. Hatta pazar yerleri bile LOPA’nın birer formudur. LOPA’dan avantaj elde etmek için bazı diğer yöntemleri aşağıda bulabilirsiniz:

  • Demografiğinize benzer bir demografiğe sahip takipçi kitlesi olan bir blog için eşantiyonlar yaratın.
  • Meetup.com üzerinden ürününüzü kullanabilecek toplulukları yöneten liderlerle iletişime geçin ve onlara kendi gruplarına sizin ürününüz hakkında bir şeyler söyleyip söyleyemeyeceklerini sorun.
  • Endüstrinizdeki fikir liderlerine bedava hesaplar sunun ve eğer güzel bir tecrübe yaşarlarsa ürününüzü kendi kitleleriyle paylaşacaklardır.
  • LOPA’yı gerçekleştirmenin listelenemeyecek kadar bir sürü yöntemi vardır. Eğer yeterince yaratıcıysanız LOPA için yeni fırsatlarınız her daim olacaktır.

BU YAZININ ÖZETİ

Sadece trafiğe odaklanmayın. Trafik önemli, fakat her şey değil.

Sitenize trafik çekmenizin üç yolu var:

  1. Çekme – İnsanları size gelmek için ikna edebilirsiniz, akıllarını çelebilirsiniz.
  2. İtme – İnsanları size gelmeye zorlayabilirsiniz.
  3. Ürün – Kendi ürününüzü kullanarak insanları size çekebilirsiniz.

Bu yazıda bahsedilen 12 tane çekme taktiği mevcut:

  1. Bloglama ya da Konuk Bloglama
  2. Podcastiong ya da Guest Podcasting
  3. E-kitaplar, Kılavuzlar, ve Beyaz Bültenler
  4. Bilgi Görselleri
  5. Webinar’lar
  6. Konferans Sunumları
  7. SEO
  8. Sosyal Medya
  9. Yarışmalar
  10. Pazar Yerleri
  11. Pazarlık Siteleri
  12. LOPA