🏆 MA1420 · DATA SAINS · SESI 08

Ujian Tengah Semester

Saatnya mengukur pemahaman Anda terhadap materi sesi 1–7. Halaman ini berisi kisi-kisi ujian, rangkuman rumus penting, dan 10 soal latihan dengan pembahasan lengkap.

BOBOT
30%
DURASI
90 menit
JUMLAH SOAL
25–30
SIFAT
Tutup buku
MATERI
Sesi 1–7

Kisi-Kisi Ujian Tengah Semester

#
TOPIK
% SOAL
1
SESI 1
Pengantar Data Sains
Definisi, pipeline, skill, library Python dasar
10%
2
SESI 2
Statistik Deskriptif I
Mean, median, modus, variance, std, IQR, outlier
20%
3
SESI 3
Statistik Deskriptif II — Visualisasi
Pilih chart yang tepat, skewness, kurtosis, distribusi normal, Q-Q plot
15%
4
SESI 4
Statistik Inferensi I — Estimasi & CI
Populasi vs sampel, CLT, confidence interval, interpretasi CI
20%
5
SESI 5
Statistik Inferensi II — Uji Hipotesis
H₀ vs H₁, p-value, uji t, error tipe I & II, chi-square
20%
6
SESI 6
Tipe Data I — Klasifikasi
Nominal, ordinal, diskrit, kontinu, skala Stevens, operasi yang diizinkan
10%
7
SESI 7
Tipe Data II — Penanganan Khusus
Datetime, missing values (MCAR/MAR/MNAR), imputasi, encoding
5%

Rumus-Rumus Penting yang Perlu Dikuasai

MEAN & VARIANCE x̄ = Σxᵢ / n s² = Σ(xᵢ − x̄)² / (n−1) Pembagi (n−1) untuk variansi sampel (Bessel's correction)
DETEKSI OUTLIER (IQR) IQR = Q3 − Q1 Batas Bawah = Q1 − 1.5×IQR Batas Atas = Q3 + 1.5×IQR Nilai di luar batas = outlier
CONFIDENCE INTERVAL (MEAN) CI = x̄ ± z* × (s / √n) z*(90%)=1.645 z*(95%)=1.960 z*(99%)=2.576 SE = s/√n = standard error
UJI t SATU SAMPEL t = (x̄ − μ₀) / (s / √n) df = n − 1 Tolak H₀ jika p-value ≤ α (atau |t| > t_kritis)
PAIRED t-TEST d_i = x_sesudah_i − x_sebelum_i t = d̄ / (s_d / √n) H₀: d̄ = 0 (tidak ada perubahan)
CHI-SQUARE χ² = Σ (O−E)² / E E = (total baris × total kolom) / N df = (r−1)(c−1) Untuk data kategorikal

Peta Materi Sesi 1–7

S1
Pengantar Data SainsPipeline 5 langkah, library Python, role data scientist
S2
Statistik Deskriptif IMean/median/modus, variance, std, IQR, outlier
S3
Visualisasi & DistribusiPilih chart, skewness ±, kurtosis, normalitas
S4
Estimasi & CICLT, CI = x̄ ± z*SE, interpretasi benar CI
S5
Uji HipotesisH₀/H₁, p-value, uji-t, error I & II, chi-square
S6
Tipe Data INominal/ordinal/diskrit/kontinu, skala Stevens
S7
Tipe Data IIDatetime, MCAR/MAR/MNAR, imputasi, OHE

Soal Latihan UTS — 10 Soal Pilihan Ganda

SKOR LATIHAN ANDA 0 / 10

Jawab semua soal untuk melihat evaluasi Anda.

SOAL 01 Sesi 2 · Statistik Deskriptif I
Data nilai UAS: 70, 75, 80, 80, 85, 90, 92, 95, 100, 200. Ukuran pemusatan mana yang PALING TEPAT digunakan dan mengapa?
SOAL 02 Sesi 2 · IQR & Outlier
Data berikut: 12, 15, 18, 20, 22, 25, 28, 30, 35, 80. Q1 = 17, Q3 = 29. Berapakah batas atas deteksi outlier dengan metode IQR?
IQR = Q3 − Q1 = 29 − 17 = 12 Batas Bawah = Q1 − 1.5 × IQR = ? Batas Atas = Q3 + 1.5 × IQR = ?
SOAL 03 Sesi 3 · Visualisasi
Seorang analis ingin membandingkan distribusi nilai ujian antara tiga angkatan mahasiswa sekaligus, termasuk melihat outlier masing-masing. Visualisasi apa yang PALING TEPAT?
SOAL 04 Sesi 3 · Skewness
Sebuah histogram nilai ujian menunjukkan puncak di sebelah kiri dan ekor panjang ke arah kanan. Pernyataan mana yang BENAR?
SOAL 05 Sesi 4 · Confidence Interval
Sampel 64 mahasiswa memberikan rata-rata tinggi badan x̄ = 168 cm dengan standar deviasi s = 8 cm. Hitung 95% Confidence Interval untuk rata-rata tinggi badan populasi.
Diketahui: n = 64, x̄ = 168, s = 8, z*(95%) = 1.960 SE = s / √n = ? CI = x̄ ± z* × SE = ?
SOAL 06 Sesi 4 · Interpretasi CI
Peneliti menghasilkan 95% CI = [72, 84] untuk rata-rata nilai matematika. Mana interpretasi yang PALING BENAR?
SOAL 07 Sesi 5 · Uji Hipotesis
Peneliti menguji apakah metode belajar baru meningkatkan rata-rata nilai UAS (sebelumnya μ = 70). Dari sampel 30 mahasiswa didapat x̄ = 74, s = 10, α = 0.05. Nilai t-hitung = 2.19 dan t-kritis (df=29, α=0.05, 1-arah) = 1.699. Keputusannya?
SOAL 08 Sesi 5 · Error Tipe I & II
Sebuah algoritma deteksi kanker diuji. H₀: "pasien sehat". Dokter memperketat ambang batas (α dari 0.05 menjadi 0.001) agar mengurangi "alarm palsu". Konsekuensinya?
SOAL 09 Sesi 6 · Skala Pengukuran
Empat variabel berikut: (1) Nomor telepon, (2) Peringkat kepuasan 1–5, (3) Suhu dalam °Celsius, (4) Berat badan dalam kg. Pasangkan masing-masing dengan skala pengukuran yang tepat.
SOAL 10 Sesi 7 · Missing Values
Dataset survei gaji memiliki 25% nilai missing pada kolom "pendapatan_bulanan". Analisis menunjukkan responden dengan pendapatan rendah lebih banyak yang tidak mengisi. Tindakan TERBAIK adalah?
SKOR AKHIR ANDA 0 / 10

Selesaikan semua soal untuk evaluasi lengkap.

Tips Menghadapi UTS

📖
Review Rumus Kunci
Hafalkan rumus CI, uji-t, IQR outlier, dan chi-square. Latih menghitung manual tanpa kalkulator.
🎯
Prioritas Materi
Sesi 4 (CI) dan Sesi 5 (Uji Hipotesis) masing-masing 20% soal — kuasai keduanya dengan baik.
🔍
Baca Soal Teliti
Perhatikan: apakah uji satu arah atau dua arah? σ diketahui atau tidak? n besar atau kecil?
📊
Konteks Interpretasi
Selalu terjemahkan hasil statistik ke konteks nyata. "p=0.03" → "ada bukti signifikan bahwa..."
⏱️
Manajemen Waktu
90 menit untuk ~28 soal ≈ 3 menit/soal. Lewati soal sulit, kerjakan yang mudah dulu, kembali lagi.
🧠
Hindari Jebakan Umum
Jangan bilang "H₀ terbukti benar" (hanya gagal tolak). Jangan pakai mean untuk data ordinal atau saat outlier dominan.
🌟 PESAN SEMANGAT

UTS bukan akhir perjalanan — ini titik tengah untuk mengukur seberapa jauh kita sudah melangkah. Setelah UTS, materi berlanjut ke topik yang lebih praktis dan menarik: pembersihan data, transformasi, korelasi, dan machine learning.

Selamat mengerjakan UTS. Semoga sukses, Mahasiswa MA1420! 🎓