← Kayıtlar

Vaka Dosyası

Log:route-optimizer·

Kişilik Tabanlı Mekan Öneri ve Rota Sistemi

Anket verisiyle kişilik boyutlarını ve mekan etiketlerini eşleştirip sınıflandırıcıları aynı veri üzerinde kıyasladım.

Alan
Öneri Sistemleri
Odak
Model karşılaştırması, veri analizi
Yığın
Python, Scikit-learn, Pandas
Durum
Tamamlandı
Yıl
2025

Kapak görseli

Özellik önemi (RIASEC ve demografik tahmin ediciler)

Özellik önemi (RIASEC ve demografik tahmin ediciler)

Problem

Tercihler çoğu zaman dolaylı; doğrudan skor yerine anket ve etiketlerden çıkarım gerekiyordu. Hangi sınıflandırıcının genelleme yapacağı önceden bilinmiyordu.

Yaklaşım

Özellik matrisini sabit tutup eğitim/hold-out bölünmesini tekrarlanabilir yaptım. Metrikler: doğruluk, F1, confusion matrix; sınıf dengesizliği için weighted F1.

Teknik Yapı

Veri hazırlama

Anketten kişilik ve mekan tercihi alanları çıkarıldı; eksik ve tutarsız kayıtlar elendi.

Özellik mantığı

Big Five benzeri boyutlar sayısallaştırıldı; mekan türleri one-hot veya ordinal kodlandı.

Model karşılaştırması

Logistic Regression, Random Forest, Gradient Boosting aynı split üzerinde; hiperparametre araması sınırlı grid.

Değerlendirme metrikleri

Accuracy, precision, recall, macro/micro F1; karar eşiği 0.5 varsayılan.

Sonuç

En iyi F1 veren model seçildi; özellik seti ve kodlama şeması dokümante edildi, tekrar çalıştırılabilir.

Model karşılaştırması

MetricScenarioDecision TreesRandom ForestBoosting Methods
Decision TreesMulti Output ClassifierMulti Output RegressorClassifier ChainXGBoostLightGBM
Mikro F-1Standart Model0.62700.67690.67340.64100.65700.6772
Demography0.65990.72470.72290.69380.70860.6807
Hyperparameter-0.73110.7288-0.71490.7287
Makro F-1Standart Model0.58040.58230.62270.57720.60170.6285
Demography0.62050.64920.65640.63500.65450.6297
Hyperparameter-0.65290.6495-0.65430.6792
Hamming LossStandart Model0.28120.22110.23260.24020.24540.2297
Demography0.25380.18950.19680.20460.20920.2237
Hyperparameter-0.18610.1887-0.19940.1956

İlişkili kayıtlar