The Geometry of Linear Programming

Why to study Linear Optimization? In data science, we will be dealing frequently with optimization problems as our main motivation is to minimize(or maximize) a certain objective we are pursuing. Linear optimization(or linear programming) is a subfield of a much broader optimization field called convex optimization and is a great place to start because of […]

Linear Programming Notes

Just like MITx: 6.041x – Introduction to Probability – The Science of Uncertainty, this is the kind of post in which I share my notes of a special subject. In this time the subject is Linear Programming(LP) or Linear Optimization. I publish them in the hope of helping toddlers (just like me when I first started 🙂 […]

The Magic Behind The Linear Methods for Regression – Part 1

It is time to expose the oracle! In this journey, everything started with an amazingly simple method: linear regression. Let’s dive into the nitty-gritty of it. What we will see: -Univariate linear regression (with OLS) -Orthogonalization -Multivariate linear regression(with OLS) -Gauss-Markov Theorem -Gram-Schmidt Procedure Revision In the previous post,  we learned that regression is simply a conditional […]

My Self-Taught Data Science Journey

Yes! It is a huge world. A really, really huge world in which you have infinitely many ways to achive a goal unless there are some restrictions which always exist fortunately. You may find it little bit murky, little bit daunting, little bit overwhelming, and a little bit scary in the beginning. You may not understand anything about it, […]

Olasılık Teorisi – Ayrık Olasılık Dağılımları

Olasılık teorisi serisinde olasılık bakış açısıyla bir çok simülasyon ve deney gerçekleştireceğiz. Genel fikri aslında şu: yapacağımız her bir deney ve/veya simülasyonda o deneyin ve/veya simülasyonun sonucunu temsil edecek rassal değişkenler yer alacak. Bu rassal değişkenlerin alabileceği olası değerlerin hepsine örneklem uzayı(sample space) diyeceğiz. İlk olarak sonlu miktarda sonucu olabilecek deneyleri inceleyerek başlayacağız. Rassal Değişkenler […]

Olasılık Teorisi: Ayrık Olasılık Simülasyonu

Olasılık (Probability) Bu yazıya sonlu sayıda sonucu olan deneylerdeki şans faktörünü işleyerek başlayacağım. Örneğin bir zar attığımızda sonuç kümemiz sonlu sayıdadır ve şu şekildedir: 1, 2, 3, 4, 5 ve 6. Aynı şekilde yazı tura attığımızda sonuç sonludur: yazı veya tura. Örneğin bir zarı dört defa atarak gelen sayıların toplamını matematiksel olarak ifade etmeye çalışalım: X1 […]

Basit Doğrusal Regresyon (Simple Linear Regression)

Linear Regression, en basit supervised learning algoritmalarından biridir. Tahmin etmeye çalıştığımız Y değişkeni ile tahminleyici değişkenlerimiz X1,X2,…,Xn arasında doğrusal bir ilişki olduğunu var sayar. Ancak bir önceki yazıda da belirttiğimiz üzere gerçek regresyon fonksiyonu azaltılamaz hatalar yüzünden hiçbir zaman doğrusal bir metotla tam olarak modellenemez. Aşağıdaki grafikte mavi çizgi linear regression metodu sonucunda tahminlediğimiz fonksiyonu gösteriyor. […]

İstatistiksel Öğrenme II – Modelin Netliğini Değerlendirme

statistik ne yazık ki kesin kuralları olan bir disiplin değil. Herhangi bir metot bir veri setinde çok iyi sonuçlar üretebilirken başka bir veri seti üzerinde çok kötü sonuçlar üretebilir. Bu yüzden belirli bir veri seti üzerinde en iyi performansı veren metodu bulabilmek çok önemli bir konu. Pratikte istatistiksel öğrenmenin en çetrefilli olayı da tam olarak budur: […]