Muhammad Daffa Nugraha 202110370311335/ Machine Learning A
Stunting adalah kondisi gagal tumbuh pada anak balita akibat kekurangan gizi kronis, infeksi berulang, dan stimulasi psikososial yang tidak memadai. Deteksi penyakit stunting sangat penting untuk mencegah dampak jangka panjang pada kesehatan, pertumbuhan, dan perkembangan anak. Anak yang mengalami stunting berisiko menghadapi masalah kesehatan seperti gangguan kognitif, penurunan produktivitas di masa dewasa. Ada beberapa indikator yang menyebabkan anak balita terkena penyakit stunting seperti usia , tinggi badan , dan jenis kelamin
Proyek ini menggunakan dataset dari Kaggle ini didasarkan pada formula z-score untuk menentukan stunting menurut WHO (World Health Organization), yang berfokus pada deteksi stunting pada anak di bawah usia lima tahun. Dataset ini terdiri dari 121.000 baris data yang memuat informasi mengenai usia, jenis kelamin, tinggi badan, dan status gizi balita. Dataset ini bertujuan untuk membantu peneliti, ahli gizi, dan pembuat kebijakan dalam memahami dan menangani masalah stunting pada anak di bawah usia lima tahun. Pada dataset akan diolah menggunakan 2 algoritma yaitu : Feedforward Neural Network (FFNN) dan Random Forest, analisis data dapat dilakukan dengan lebih cepat dan akurat. Proyek ini bertujuan untuk memprediksi apakah seseorang teridentifikasi Berisiko atau Mengalami Stunting dengan memasukan data input seperti usia , tinggi badan, dan jenis kelamin. Hasil dari inputan akan mengetahui status gizi dari balita tersebut yaitu dengan 4 kelas normal , stunted, tinggi , severly stunted. Hasil dari prediksi tersebut diharapkan dapat mengurangi resiko stunting di indonesia.
Preprocessing data melibatkan beberapa langkah penting untuk menyiapkan dataset agar siap digunakan dalam model machine learning. Langkah pertama adalah pengecekan missing value, yang bertujuan untuk mengidentifikasi dan menangani data yang kosong. Setelah itu, dilakukan encoding label menggunakan LabelEncoder untuk mengubah data kategori menjadi numerik, sehingga model dapat memprosesnya. Selanjutnya, normalisasi dilakukan menggunakan MinMaxScaler, yang menskalakan data numerik ke rentang [0, 1], untuk menghindari bias akibat perbedaan skala antar fitur. Terakhir, data dibagi menjadi dua bagian, yaitu 80% untuk pelatihan dan 20% untuk pengujian.
Untuk Preprocessing sama seperti yang digunakan model Feedforward Neural Network. Melibatkan beberapa langkah penting untuk menyiapkan dataset agar siap digunakan dalam model machine learning. Langkah pertama adalah pengecekan missing value, yang bertujuan untuk mengidentifikasi dan menangani data yang kosong. Setelah itu, dilakukan encoding label menggunakan LabelEncoder untuk mengubah data kategori menjadi numerik, sehingga model dapat memprosesnya. Selanjutnya, normalisasi dilakukan menggunakan MinMaxScaler, yang menskalakan data numerik ke rentang [0, 1], untuk menghindari bias akibat perbedaan skala antar fitur. Terakhir, data dibagi menjadi dua bagian, yaitu 80% untuk pelatihan dan 20% untuk pengujian.