Olasılık Teorisi – Ayrık Olasılık Dağılımları

Olasılık teorisi serisinde olasılık bakış açısıyla bir çok simülasyon ve deney gerçekleştireceğiz. Genel fikri aslında şu: yapacağımız her bir deney ve/veya simülasyonda o deneyin ve/veya simülasyonun sonucunu temsil edecek rassal değişkenler yer alacak. Bu rassal değişkenlerin alabileceği olası değerlerin hepsine örneklem uzayı(sample space) diyeceğiz. İlk olarak sonlu miktarda sonucu olabilecek deneyleri inceleyerek başlayacağız.

Rassal Değişkenler ve Örneklem Uzayı

Diyelim ki bir deney yapıyoruz ve bu deneyin sonucu şansa bağlı olarak değişiyor. Deneyin sonucu X  ile gösteriyor olalım. bir rassal değişkendir ve alabileceği her türlü değere bu deneyin örneklem uzayı(sample space) denir. Eğer bu uzay sonlu veya sayılabilir sonsuz elemandan oluşuyorsa ayrık(discrete) olarak adlandırılır.

Bir zar atıldığında örneklem uzayımız şu şekildedir:

Ω = {1, 2, 3, 4, 5, 6}

Zar hileli bir zar olmadığı müddetçe bu uzaydaki her bir elamanın olasılığı eşittir ve 1/(örneklem uzayı boyutu) kadardır ve 1/6’dır.

Dağılım Fonksiyonu

Diyelim ki bir deneyin sonucunu gösteren rassal bir değişken olsun ve bu deneyin sonlu sayıda sonucu olsun. Bu deneyin tüm sonuçlarını içeren örneklem uzayını da(sample space) Ω işareti ile gösterelim.  O halde için dağılım fonksiyonunu şu şekilde tanımlayabiliriz:

w ∈ Ω (örneklem uzayındaki her bir eleman(w) için, m(w) >= 0 ve
∑ m(w) = 1

olan bir m fonksiyonu. Yani bu öyle bir fonksiyon olmalı ki örneklem uzayındaki her bir elemanın olasılığı sıfır veya sıfırdan büyük olmalı ve her elemanın olasılığının toplamı 1’e eşit olmalı. Bu örneklem uzayındaki herhangi bir alt küme için olasılık değeri ise şu şekilde hesaplanabilir:

P(E) = ∑ m(w), w ∈ E.

Yani E alt kümesinin tüm elemanlarının örneklem uzayındaki olasılıklarının toplamı. Kafanız karıştı mı? Hemen bir örnekle olaya açıklık getirelim.

British_two_pence_coin_2015_obverseİki kere yazı tura attığınızı düşünün. Bu deneyin sonucunu X ile gösterelim. Deneydeki amacımıza göre deneyin örneklem uzayı farklılık gösterir. Örneğin birinci ve ikinci atıştaki sonuçları sırayla kaybettiğimizi düşünelim. Bu durumda Ω = {YY, YT, TY, TT} olacaktır. Eğer amacımız deneyde yazı gelme sayısını gözlemlemek ise bu durumda Ω = {0, 1, 2} olacaktır.

Diyelim ki bizim amacımız birincisini gerçekleştirmek. Örneklem uzayındaki bütün olası sonuçların olasılığının eşit olduğunu var sayarsak dağılım fonksiyonumuzu, yani m()‘yi, şu şekilde tanımlarız:

m(YY) = m(YT) = m(TY) = m(TT) = 1 / 4 = 0.25

Amacımız en az bir kez yazı gelme olasılığını hesaplamaksa bunu şu şekilde hesaplarız:

P(E) = m(YY) + m(YT) + m(TY) = 0.25 + 0.25 + 0.25 = 0.75

Eğer amacımız ilk atışta yazı gelme olasılığını hesaplamaksa bu sefer şu şekilde hesaplarız:

P(E) = m(YY) + m(YT) = 0.25 + 0.25 = 0.5dice

Başka bir örnek olarak da bir zar atışını düşünelim. Bu durumda Ω = {1, 2, 3, 4, 5, 6} olur. Eğer zar hilesiz bir zar ise bu durumda dağılım fonksiyonu şu şekilde tanımlanır:

m(i) = 1 / 6,  i = 1, ……, 6.

Eğer amacımız çift bir rakamın gelme olasılığını bulmak ise şu şekilde hesaplayabiliriz:

P(E) = m(2) + m(4) + m(6) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2

Gene başka bir örnekte ise aynı işi kapmaya çalışan A, B, ve C adında 3 adayımız olsun ve bunlardan yalnızca biri işe alınacak olsun. Bu durumda Ω = {A, B, C) olur; yani bu 3 adaydan yalnızca biri işi kapabilir. Diyelim ki A ve B’nin işi kapma olasılığı birbirine eşit; fakat C’nin kapma olasılığı diğerlerininkinin yarısı kadar. O zaman:

m(A) = m(B) = 2*m(C)

m(A) + m(B) + m(C) = 1 olması gerektiğinden:

m(A) + m(B) + 2*m(C) = 1‘dir.

Bu denklemi çözdüğümüzde olasılıkların şu şekilde olduğunu görürüz:

m(A) = 2/5, m(B) = 2/5, m(C) = 1/5

Eğer amacımız A veya C’nin işi kapma olasılığını hesaplamaksa bunu şu şekilde hesaplarız:

P(E) = m(A) + m(C) = 2/5 + 1/5 = 3/5

Aşağıdaki şemadan temel küme özelliklerini hatırlayabiliriz:

set

Tekdüze Dağılım (Uniform Distribution)

Bir n boyutlu örneklem uzayındaki tekdüze dağılım şu şekilde tanımlanır:

Örneklem uzayındaki her w için: m(w) = 1/n

Burada fark etmemiz gereken önemli bir şey gerçekleştirdiğimiz deneyin mutlak tek bir örneklem uzayının olmaması. Örneğin iki kere yazı tura atma olayında örneklem uzayımız dört elemandan oluşuyordu ve bu elemanların her biri eşit olasılığa sahipti(tekdüze dağılım). Eğer ilgilendiğimiz olay en az bir kere yazı gelme olasılıklarıysa o zaman örneklem uzayımız üç elemandan oluşur Ω = {0, 1, 2}. Burada 0 hiç yazı gelmemesini; 1 bir kere yazı gelmesini; 2 ise iki kere yazı gelmesini belirtiyor. Bu durumda YY, YT, TY, TT sonuçlarından hiç yazı gelmemesi deneyin TT ile; bir keze yazı gelmesi YT veya TY ile; iki kez yazı gelmesi ise YY ile gerçekleşebilir. Dolayısıyla bu olayların olasılıkları şu şekildedir:

m(0) = 1/4,   m(1) = 1/2,   m(2) = 1/4 

Olasılıkların Belirlenmesi

Pratikte olasılık dağılımlarının belirlenmesindeki yöntemleri incelememiz gerekir. Bu yöntemlerden biri simetri (symmetry). Yazı tura deneyinde yazı ve tura tarafı arasında yazı veya tura gelme olasılığını değiştirecek fiziksel bir fark bulunmamakta. Benzer şekilde hileli olmayan bir zarda zarın her yüzü birbiri ile özdeştir ve simetriden dolayı zarın her yüzüne eşit olasılık değerini atarız. Genellikle simetri olan yerlerde tekdüze dağılım vardır. Fakat dikkatli olmamız gerekiyor: Bir sonucun olasılığının diğer bir sonucun olasılığından farklı olduğunu iddia edebileceğimiz bir sebebimiz yoksa her zaman bu olaylara eşit olasılık atayamayız. Örneğin, yeni doğan bir bebeğin cinsiyetini düşünelim. Yeni doğan bebeklerden erkek bebeklerin oranı 0.513. Bu yüzden yeni doğan bir bebeğin erkek olma olasılığına 0.513, kız olma olasılığına 0.487 değerini atamalıyız. Bu aslında istatistiksel gözlemleri kullanarak olasılıkları belirleyebileceğimiz durumlara örnektir. Ancak bu olasılıklar çalışmadan çalışmaya, ülkeden ülkeye, ve ırktan ırka değişebilir. Hatta genetik mühendislikle bu olasılıkları ciddi biçimde değiştirmek bile mümkün olabilir.

Odds

Bir deney eğer benzer şartlar altında çok sayıda kez tekrarlanabiliyorsa o zaman istatistiksel hesaplamalarla olasılığı bulmak güzeldir. Ancak diyelim ki yeni başlayan bir futbol sezonunda Fenerbahçe‘nin Galatasaray‘ı yenmesine bir olasılık atamak istiyoruz. Bu durumda söz konusu sezona ait veri henüz elinizde yok. Fakat ne tür bir bahis yapmak istediğinize bağlı olarak kendi kişisel olasılık değerlerinizi atayabilirsiniz. Örneğin 2:1 odds Fenerbahçe’nin kazanmasına 1 TL bahse giriyorsunuz. O zaman Fenerbahçe’nin kaybetmesi durumunda 2 TL vermeye razısınız. Bu demek oluyor ki Fenerbahçe’nin kazanmasına verdiğiniz olasılık 2/3.

Şimdi odds ile bu olasılık değeri arasındaki ilişkiye daha dikkatlice bakalım. Diyelim ki E bir olayına 1:r odds ile bahse giriyorsunuz. Bu demek oluyor ki E olayının olması olmamasından r kere daha fazladır. O zaman bu durumda E olayının olma olasılığı r / (r+1) olmalıdır çünkü

P(E) = r * P(˜E)  ve  P(E) + P(˜E) = 1

olmalı. Genel olarak odd’lar E olayının lehine r:s ise:

odd

Eğer E olayının olma olasılığı P(E) = p ise, r/s’nin oranı p cinsinden şu şekilde ifade edilir:

r/s = p / (1-p)

Sonsuz Örneklem Uzayları (Infinite Sample Spaces)

Eğer bir örneklem uzayı sonsuz sayıda elemana sahipse bu uzayın dağılım fonksiyonunun tanımı uzaydaki elemanların sayılabilir olup olmadığına bağlıdır. Bir örneklem uzayının elemanları sayılabilir ise, örneğin pozitif tam sayılarla sıralanabiliyorsa, bu örnemklem uzayı sayılabilir sonsuz (countably infinite)  uzaydır; eğer elemanları sayılamıyorsa o zaman sayılamayan sonsuz (uncountably infinite) uzaydır. Sonsuz örneklem uzayları daha sonraki yazılarda ele alacağımız yeni bir konsepti gerektirir ancak sayılabilir sonsuz uzayları şu anki bilgilerimizde açıklayabiliriz. Eğer

Ω = {w1, w2, w3, …}

örneklem uzayı sayılabilir sonsuz uzaysa o zaman dağılım fonksiyonu her bir olaya 0 veya 0’dan büyük bir olasılık verecek ve bu olasılıkların toplamı bire eşit olacaktır. Ancak bu sefer bu toplamlar yakınsayan bir sonsuz toplam olmalı. Sonlu uzaylarda yapıp bu tarz uzaylarda yapamadığımız tek şey tekdüze bir dağılım fonksiyonu tanımlamak.

Örneğin yazı gelene kadar yazı tura attığımızı düşünelim. İlk kez yazı gelme sayısını w ile gösterelim. Bu durumda deneyimizin olası sonuçları şu şekildedir:

Ω = {1, 2, 3, . . .}

Bozuk para her seferinde tura da gelebilir ancak bu olasılığa izin vermiyoruz. Nedenini birazdan göreceksiniz. İlk atışta yazı gelme olasılığı 0.5’tir. İlk atışta tura gelip ikinci atışta yazı gelme olasılığı 0.25’tir. İlk iki atışta tura gelip üçüncü atışta yazı gelme olasılığı 1/8’dir. Bu bize her bir atış sayısı için(n) bir kere yazı gelme olasılıklarını şu şekilde ifade edebileceğimizi gösteriyor:

m(n) = 1 / 2^n

Bunun bir dağılım fonksiyonu olduğunu görmemiz için şu şart sağlamamız gerekiyor:

inf

Bu toplamın 1’e eşit olacağını geometrik serilerinin (geometric series) toplam formülüyle gösterecek olursak:

inf2

Bu formül r -1 ve 1 arasındaysa geçerlidir. r yerine 1/2 koyacak olursak o zaman bu toplamın 1’e eşit olacağını yani eninde sonunda en az bir kere yazı geleceğini görebilirsiniz. Her atışta tura gelme olasılığına 0 değeri atanması gerektiğinden örneklem uzayımıza 0 sonucunu eklemedik.

Şimdi örneklerle bütün bu kavramları açıklayalım.baa0a0055d67f6ec40a5aa2c1f28846a

Bir iskambil destesinden rastgele bir kart çekersek bunun birli olma
olayına odds’unuz ne olur? Toplam 52 adet kart olduğuna göre ve bunlardan 4 tanesinin birli olduğuna göre odd’u birli olma olasılığı’nın birli olmama olasılığına oranı olarak tanımlarız:

(4/52) / (48/52) = 4 / 48 = 1 / 12

Bu demek oluyor ki her 12 kartta bir, bir adet birli olmasını bekleriz. Peki iki tane bozuk para attığımızda ikisinin de yazı gelme olayına odds’unuz ne olur? Gene aynı mantıkla ikisinin yazı gelme olasılığının ikisinin yazı gelmeme olasılığına oranı olarak buluruz:

(1/4) / (3/4) = 1/3

yani her 3 başarısız atıştan sonra  ikisinin de bir kere yazı gelmesini bekleriz.

Diyelim ki bir at yarışında X adlı atın kazanma odds’u  2:3, Y adlı atın kazanma odds’u da 1:2. X ya da Y’nin kazanma olayına ne odds verilmelidir?

X’in kazanma olasılığı / X’in kazanamama olasılığı = 2/3
Y’nin kazanma olasılığı / Y’nin kazanamama olasılığı = 1/2

2*X + 3*X = 1 ==> 5*X = 1 ==> X = 0.2 ==> 2/5 kazanma, 3/5 kaybetme

1*Y + 2*Y = 1 ==> 3*Y = 1 —> Y = 1/3 —> 1/3 kazama, 2/3 kaybetme

İkisinden birinin kazanma olasılığı = 2/5 + 1/3 = 11/15. Bu durumda bu olayın odds’u:

(11/15) / (4/15) = 11/4. Yani bu olayın 11 kere gerçekleşmesine karşı 4 kere gerçekleşmemesini bekleriz.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s