Güncelleme Tarihi:
Regresyon analizi, bağımsız değişkenlerin bağımlı bir değişkenle ne kadar yakından ilişkili olduğunu ölçmek için kullanılabilen bir makine öğrenme algoritmasıdır.
Regresyon Analizi Nedir ve Nasıl Yapılır?
Regresyon analizinin başlangıcında, bir veri kümesi iki gruba ayrılabilir. Bunlar eğitim veri kümesi ve bir test veri kümesidir. Eğitim veri kümesi, grafiğe en uygun çizgiyi uygulamak için en iyi yaklaşımı bulmak üzere bir model oluşturmak için kullanılabilir. Bu nedenle, bağımsız değişken ya da değişkenlerin bağımlı değişkene karşı grafiğine kolayca uyan düz bir çizgi veya bir eğri olabilir.
Bu yeni oluşturulan model, test veri kümesinin bağımlı değişkenini tahmin etmek için kullanılabilir. Daha sonra, tahmin edilen değerler, R-kare, kök ortalama kare hatası, kök ortalama hata, pearson korelasyon katsayısı ve diğerleri gibi farklı doğruluk ölçüleri kullanılarak orijinal bağımlı değişken değerleriyle karşılaştırılabilir.
Doğruluk puanı yeterince doğru değilse ve daha güçlü bir model oluşturulmak istiyorsa, eğitim ve test veri kümelerine tahsis edilen veri kümelerinin yüzdesi değiştirilebilir. Örneğin, eğitim veri kümesinde veri kümesinin% 70'i ve% 30'luk test veri kümesine sahipse, eğitim veri kümesi artık veri kümesinin% 80'ine sahip olabilir ve test veri kümesi% 20'ye sahip olabilir.
Farklı Regresyon Analizi Biçimleri
Doğrusal Regresyon
Doğrusal Regresyon, bağımlı değişkenin değerlerini tahmin etmek için bağımsız bir değişken kullanarak çalışır.
Doğrusal regresyonda, daha sonra test veri setinin değerlerini tahmin etmek için kullanılabilen eğitim veri setinden bir denklem elde etmek için en iyi uyan bir çizgi kullanılır. Denklem şu biçimde olabilir: y = mx + b burada y tahmin edilen değerdir, m doğrunun gradyanıdır ve b, çizginin y eksenine çarptığı noktadır. Aşağıda python'da doğrusal regresyon çalıştırmak için bir dizi kod bulunmaktadır;
Kod, FIFA 19 oyuncu derecelendirmelerinden oluşan bir veri kümesine göre yapıldı. Burada, oyuncuların genel puanlarını tahmin etmek için potansiyel kullanılmaktadır.
Polinom Regresyon
Polinom Regresyon, bağımlı değişkenin değerlerini tahmin etmek için bağımsız bir değişken kullanabilir.
Polinom regresyonunda, daha sonra test veri setinin değerlerini tahmin etmek için kullanılabilen eğitim veri setinden bir denklem elde etmek için en uygun eğri kullanılır.
Polinom regresyon durumunda denklem şu biçimde olabilir: y = ax ^ n + bx ^ n-1 +… + c burada y tahmin edilen değerdir, a ve b denklemin sabitleridir, n en yüksek derecedir eğrinin şeklini belirleyen denklemin ve c, x'in 0 olduğu noktadır . n'nin değerine bağlı olarak, denklem ikinci derece, üçüncü derece, dördüncü derece veya çok daha fazlası olabilir. Aşağıda python'da polinom regresyonu çalıştırmak için bir dizi kod bulunmaktadır;
Kod, FIFA 19 oyuncu derecelendirmelerinden oluşan bir veri kümesine göre yapıldı. Burada, oyuncuların genel puanlarını tahmin etmek için potansiyel kullanılmaktadır.
Çoklu Doğrusal Regresyon
Çoklu Doğrusal Regresyon, bağımlı değişkenin değerlerini tahmin etmek için iki veya daha fazla bağımsız değişken kullanır.
Çoklu doğrusal regresyonda, daha sonra test veri setinin değerlerini tahmin etmek için kullanılabilen eğitim veri setinden genel bir denklem elde etmek için en uygun çoklu satırlar kullanılır. Genel denklem şu biçimde olabilir: y = ax + bx2 +… + c burada y tahmin edilen değerdir, a ve b bağımsız değişkenleri bağımlı değişkene bağlayan çizgilerin gradyanlarıdır ve c, doğrunun bulunduğu noktadır. y eksenine çarpıyor. Aşağıda python'da çoklu doğrusal regresyon çalıştırmak için bir dizi kod bulunmaktadır;
Kod, FIFA 19 oyuncu derecelendirmelerinden oluşan bir veri kümesine göre yapıldı. Oyuncuların genel puanlarını tahmin etmek için yaş, potansiyel, parasal değer ve serbest bırakma maddesi kullanılıyor.
Çoklu Polinom Regresyon
Çoklu Polinom Regresyon, bağımlı değişkenin değerlerini tahmin etmek için iki veya daha fazla bağımsız değişken kullanılarak yapılır.
Çoklu polinom regresyonu için, daha sonra test veri setinin değerlerini tahmin etmek için kullanılabilen eğitim veri setinden genel bir denklem elde etmek için en iyi uyan çoklu eğriler kullanılır.
Birden polinom regresyon durumunda, genel denklem formunda olabilir: y = ax ^ n + x ^ n-1 + ... + c burada y tahmin değer, a ve b denkleminin sabitleri vardır n olduğu Eğrilerin şeklini belirleyen denklemin en yüksek derecesi ve c, x’in 0 olduğu noktadır. N'nin değerine bağlı olarak, denklem ikinci derece, üçüncü derece, dördüncü derece veya çok daha fazlası olabilir. Aşağıda python'da çoklu polinom regresyonu çalıştırmak için bir dizi kod bulunmaktadır;
Kod, FIFA 19 oyuncu derecelendirmelerinden oluşan bir veri kümesine göre yapıldı. Oyuncuların genel puanlarını tahmin etmek için yaş, potansiyel, parasal değer ve serbest bırakma maddesi kullanılıyor.