Analisis Korelasi dan Regresi

99 960 Apakah semakin besar biaya iklan yang dikeluarkan akan semakin besar pula profit yang diperoleh? Diamati contoh acak 10 perusahaan yang memprod...

0 downloads 5 Views 2MB Size
Analisis Korelasi dan Regresi

Dr. Kusman Sadik, M.Si Dept. Statistika IPB - 2015

1

Hubungan Dua Peubah atau Lebih PEUBAH

KASUS

PENGUMPULAN DATA

JENIS HUBUNGANNYA

1.Dosis pupuk 2.Banyaknya padi yg dihasilkan /ha

Diduga dosis pupuk mempengaruhi banyaknya padi yg dihasilkan/ha

Dosis pupuk ditentukan dahulu, faktor-faktor lain yg mempengaruhi banyaknya padi dikendalikan sehingga pengaruhnya konstan, ke-mudian diamati banyaknya padi yg dihasilkan

Perubahan banyaknya padi yg dihasilkan/ha dipengaruhi oleh perubahan dosis pupuk  HUB SEBAB AKIBAT

1.Tinggi badan 2.Berat badan

Diduga tinggi badan dan berat badan memiliki hubungan

Dimulai dengan mengamati tinggi badan da-hulu, disusul mengamati peubah yg dianggap relevan (berat badan), atau sebaliknya.

Pengamatan thdp kedua peubah dilakukan secara bersamaan. Sulit untuk mengatakan bahwa perubahan satu peubah disebabkan oleh perubahan peubah lainnya  bukan HUB SEBAB AKIBAT Ingin diketahui kekuatan dan arah hubungannya 2

Hubungan Dua Peubah atau Lebih (2) PEUBAH

KASUS

PENGUMPULAN DATA

JENIS HUBUNGANNYA

1.Banyaknya barang terjual/minggu 2.Adanya hari libur/tidak 3.Harga barang

Diduga banyaknya barang terjual/minggu dipe-ngaruhi oleh berbagai peubah, misalnya harga barang, ada/ tidaknya hari libur dlm minggu tsb

Harga barang ditentukan lebih dahulu, faktorfaktor lain yg mempengaruhi banyaknya barang terjual dikendalikan sehingga pengaruhnya konstan, kemudian diamati banyaknya barang yg terjual pada minggu ada hari libur dan minggu tanpa hari libur

Perubahan banyaknya barang yg terjual dipengaruhi oleh perubahan harga dan ada/tidaknya hari libur  Hub SEBAB AKIBAT

1.Bobot badan 2.Bobot jantung

Diduga bobot badan dan bobot jantung memiliki hubungan

Dimulai dengan mengamati bobot badan terlebih dahulu, segera disusul mengamati peubah yg dianggap relevan (dalam hal ini bobot jantung), atau sebaliknya.

Pengamatan thdp kedua peubah dilakukan secara bersamaan. Sulit untuk mengatakan bahwa perubahan satu peubah disebabkan oleh peubah lainnya. bukan SEBAB AKIBAT. Ingin diketahui model matematisnya (HUB KUANTITATIF) 3

Contoh Kasus Lain • Umur vs tinggi tanaman • Biaya promosi vs volume penjualan • Produktivitas pertanian vs (tanaman bahan pangan, tanaman perkebunan rakyat, peternakan dan perikanan) • Produksi padi vs luas lahan sawah • Tinggi badan vs berat badan • Bobot badan vs bobot jantung 4

Analisis Hubungan 1. Jenis/tipe hubungan

2. Skala pengukuran variabel

3.Ukuran Keterkaitan

4. Pemodelan Keterkaitan 5

Relationship vs Causal Relationship • Tidak semua hubungan (relationship) berupa hubungan sebab-akibat (causal relationship).

• Penentuan suatu hubungan bersifat sebabakibat memerlukan pendapat/pengetahuan dari bidang ilmu terkait.

6

Alat Analisis Keterkaitan/Hubungan • Ditentukan oleh: 1. Skala pengukuran data/variabel 2. Jenis hubungan antar variabel Relationship

Numerik

Kategorik

Numerik

Korelasi Pearson, Spearman

Tabel Ringkasan

Kategorik

Tabel Ringkasan

Spearman (ordinal), Chi Square

7

Hubungan Sebab Akibat (Causal Relationship)

Variabel X Variabel Y Numerik Kategorik

Numerik

Kategorik

Regresi Linier

Regresi Linier

Regresi Logistik Regresi Logistik

8

9

10

Korelasi

r=1

r=0

r=0

r =110

Korelasi

12

Koefisien Korelasi (r) • Tidak menggambarkan hubungan sebab akibat • Nilainya berkisar antara -1 dan 1 • Tanda (+) atau (-)  arah hubungan o (+) searah; o (-) beralawanan arah • Koefisien Korelasi Pearson  hubungan linier • Koefisien Korelasi Spearman (rank correlation)  trend relationship 13

Koefisien Korelasi Pearson (r) rxy 

S xy S xx S yy

S xy   ( xi  x )( yi  y )

S xx   ( xi  x ) dan S yy   ( yi  y ) 2

2

Notasi lain:

14

Korelasi !!!

15

Contoh Diketahui data pengeluaran iklan (x milyar) dengan total profit penjualan suatu produk komputer perbulan (y milyar) selama 4 bulan sebagai berikut: x : 2 1 5 0 y : 5 3 6 2 a. Buat scatter plot untuk data tersebut. b. Hitung koefisien korelasinya. 16

(a) Scatter Plot : x dengan y

17

(b) Koefien Korelasi (r)

18

Mendenhall : Example 12.7, hlm. 534

19

Mendenhall : Example 12.7, hlm. 534

20

21

Definisi • Linier (linear) : linier dalam parameter

• Sederhana (simple) : hanya satu peubah penjelas (x) • Berganda (multiple) : lebih dari satu peubah penjelas (x)

22

linear Regresi Linear

satu

Simple Linear Regression

Peubah penjelas (X)

> satu

Hubungan parameter

non linear

Regresi non linear

Multiple Linear Regression 23

ANALISIS REGRESI • Hubungan Antar Peubah: o Fungsional (deterministik)  Y=f(X) ; misalnya: Y=10X o Statistik (stokastik)  amatan tidak jatuh pas pada kurva o Misal: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi, Profit vs Biaya Iklan • Model regresi linear sederhana:

Yi  0  1 X i   i ; i  1,2,..., n 24

Regresi Makna 0 & 1 ?

Interpretasi : 0 adalah nilai Y ketika X = 0, sedangkan 1 adalah perubahan nilai Y untuk setiap perubahan X sebesar satu satuan unit. 25

Regresi

26

Analisis Regresi • Pendugaan terhadap koefisien regresi:  b0 penduga bagi 0 dan b1 penduga bagi 1 ( x)( y ) S xy  xy  n b1   2 ( x ) S xx  2 x   n b0  y  b1 x

Metode Kuadrat Terkecil (Least Square)

27

Analisis Regresi Bagaimana Pengujian terhadap model regresi ?? • parsial (per koefisien)  uji-t • bersama  uji-F (Anova)

Bagaimana menilai kesesuaian model ?? • R2 (Koefisien Determinasi: persentase keragaman Y yang mampu dijelaskan oleh X)

28

Metoda Kuadrat Terkecil • Pendugaan parameter pada regresi didapat dengan meminimumkan jumlah kuadrat galat (error).

29

Metoda Kuadrat Terkecil

SSE (Sum of Squares for Error) = JKG (Jumlah Kuadrat Galat) 30

Keragaman yang Dapat Dijelaskan dan yang Tidak Dapat Dijelaskan oleh Model

31

Contoh Data Apakah semakin besar biaya iklan yang dikeluarkan akan semakin besar pula profit yang diperoleh? Diamati contoh acak 10 perusahaan yang memproduksi Laptop, kemudian dicatat pengeluaran iklan (dalam milyar) dan profit (dalam milyar) selama tahun 2015. a. Buat scatter plotnya dan jelaskan. b. Tentukan persamaan model regresinya. c. Tentukan penduga bagi parameter model regresi tersebut.

Iklan Profit 31 553 38 590 48 608 52 682 63 752 67 725 75 834 84 752 89 845 99 960 32

Penyelesaian : Plot antara pengeluaran Iklan(milyar) dg Profit (milyar) 950

Emisi

850

Profit (Y)

750

650

550 30

40

50

60

70

Jarak Iklan

80

90

100

(X)

Model : Yi  0  1 X i   i ; i  1,2,..., n 33

Penyelesaian :

Jumlah b1 

S xy S xx

x

y

x2

y2

xy

31 38 48 52 63 67 75 84 89 99 646

553 590 608 682 752 725 834 752 845 960 7,301

961 1,444 2,304 2,704 3,969 4,489 5,625 7,056 7,921 9,801 46,274

305,809 348,100 369,664 465,124 565,504 525,625 695,556 565,504 714,025 921,600 5,476,511

17,143 22,420 29,184 35,464 47,376 48,575 62,550 63,168 75,205 95,040 496,125



( x)( y ) n 2 ( x )   x2  n

 xy 

b0  y  b1 x

Sxy Sxx Syy b1 b0

24,480.4 4,542.4 146,050.9 5.39 381.95

34

Analisis Regresi Contoh output regresi dengan Minitab (1) Regression Analysis

(Iklan

The regression equation is

Predictor Constant Iklan

Coef 381.95 5.3893

S = 42.01

vs

Profit = 381.95 + 5.39*Iklan

StDev 42.40 0.6233

R-Sq = 90.3%

Profit)

T 9.01 8.65

P 0.000 0.000

R-Sq(adj) = 89.1%

Analysis of Variance Source Regression Error Total

DF 1 8 9

SS 131932 14118 146051

MS 131932 1765

F 74.76

P 0.000

35

Uji Hipotesis Bagaimana Pengujian terhadap model regresi ?? • parsial (per koefisien)  uji-t • bersama  uji-F (Anova)

Bagaimana menilai kesesuaian model ?? • R2 (Koefisien Determinasi: persentase keragaman Y yang mampu dijelaskan oleh X)

36

H0 : 1=0 vs H1: 10

Uji Hipotesis : n

n

n

 ( y  y )   ( yˆ  y )   ( y  yˆ ) 2

i 1

i

2

i 1

i

JK Total = JK Regresi + JK Galat

i 1

i

2

i

 JK : Jumlah Kuadrat

Keragaman total = keragaman yang dapat dijelaskan oleh model + keragaman yang tidak dapat dijelaskan oleh model R2 = (JK Regresi)/(JK Total) = JKR/JKT 37

Uji Hipotesis (1) H0 : 1=0 vs H1: 10 b1  1 t  hitung  Sb 1 S b1 

2

s 2 ( x  x )  i

SSE s  n2 2

Sb1 disebut galat baku (standard of error) bagi b1  SE(b1)

Tolak Ho jika: |t-hit| > t(/2; db=n-2)

38

Uji Hipotesis (2) H0 : 1=0 vs H1: 1>0 b1  1 t  hitung  Sb 1 S b1 

2

s 2 ( x  x )  i

Tolak Ho jika: t-hit > t(; db=n-2)

SSE s  n2 2

39

Uji Hipotesis (3) H0 : 1=0 vs H1: 1<0 b1  1 t  hitung  Sb 1 S b1 

2

s 2 ( x  x )  i

Tolak Ho jika: t-hit < - t(; db=n-2)

SSE s  n2 2

40

Latihan (1) • Apakah iklan berpengaruh pada profit perusahaan? Uji hipotesis Anda pada taraf nyata  = 0.05

41

Jawaban Ringkas H0 : 1=0 vs H1: 10 b1  1 b1  0  = 5.39/0.623 = 8.64 ( 4 ). t  hitung  Sb 1 Sb 1 ( 3 ).

Sb1 

s2 2 ( x  x )  i

= √(S2/Sxx) = √(1,764.81/4,542.4) = 0.623

SSE ( 2 ). s  = 1,764.81 n2 2

( 1 ).

Sxy Sxx Syy

24,480.4 4,542.4 146,050.9

= 14,118.45

t(/2; db=n-2) = t(0.025; 8) = 2.306

Karena (t-hit = 8.64) > 2.306 maka TOLAK H0, artinya iklan berpengaruh pada profit perusahaan untuk taraf uji α = 0.05 42

Latihan (2) • Apakah semakin besar iklan akan mengakibatkan semakin besar profit? Uji pada taraf nyata  = 0.05

43

Jawaban Ringkas H0 : 1=0 vs H1: 1> 0 b1  1 b1  0  = 5.39/0.623 = 8.64 ( 4 ). t  hitung  Sb 1 Sb 1 ( 3 ).

Sb1 

s2 2 ( x  x )  i

= √(S2/Sxx) = √(1,764.81/4,542.4) = 0.623

SSE ( 2 ). s  = 1,764.81 n2 2

( 1 ).

Sxy Sxx Syy

24,480.4 4,542.4 146,050.9

= 14,118.45

t(; db=n-2) = t(0.05; 8) = 1.860

Karena (t-hit = 8.64) > 1.860 maka TOLAK H0, artinya semakin besar iklan akan mengakibatkan semakin besar profit untuk taraf uji α = 0.05 44

Latihan (3) • Berapa profit yang dihasilkan jika iklan yang dikeluarkan 76 milyar? Apakah hasil dugaan ini valid? Kenapa?

45

Latihan (4) • Tentukan koefisien determinasinya? Apa maknanya?

46

Koefisien Determinasi (R2) R2 = (JK Regresi)/(JK Total)

=

=

= 0.903 = 90.3%

Artinya, 90.3 persen keragaman pada Y (profit) dapat diterangkan oleh keragaman pada X (iklan)

47

Keterbatasan Korelasi dan Regresi Linear • Korelasi dan Regresi Linear hanya menggambarkan hubungan yang linear

• Korelasi dan metode kuadrat terkecil pada regresi linear tidak resisten terhadap pencilan • Prediksi di luar selang nilai X tidak diperkenankan karena kurang akurat • Hubungan antara dua variabel bisa dipengaruhi oleh variabel lain di luar model 48

Catatan • Apa itu analisis regresi? • Apa bedanya dengan korelasi? Analisis Regresi  Analisis statistika yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya. Korelasi  mengukur keeratan HUBUNGAN LINEAR dari dua variabel 49

PR/Tugas Dikumpulkan di TU Dept Statistika, pada hari Senin minggu depan sebelum jam 12.00 (via Ibu Mar) Catatan : m = (digit ke-8) + (digit ke-9) dari NIM Misal NIM : H24130075  m = 7 + 5 = 12 1. Mendenhall (Exercise 12.7 a-c), hal. 511  y : (data + 0.m) 2. Mendenhall (Exercise 12.20 a-c), hal. 520  y : (data + 0.m)

50

Terima Kasih Materi ini bisa di-download di: kusmans.staff.ipb.ac.id

51