สรุปเกี่ยวกับสมมติฐานงานวิจัย
1.
ตัวแปรที่ใช้บ่อยมี 2 ตัวแปร
ตัวแปรต้นหรือเรียกว่าตัวแปรอิสระ
(Independent Variable) เป็นตัวแปรเหตุ
ตัวแปรตามหรือเรียกว่าตัวแปรผล
(Dependent Variable) หมายถึงตัวแปรที่เกิดเนื่องจากตัวแปรอิสระ
มาตราวัดตัวแปร มี 4 แบบได้แก่
1.มาตรวัดนามบัญญัติ (Nominal Scale) เป็นข้อมูลที่ไม่ได้มีค่าเป็นตัวเลขจริงได้แก่
เพศ คณะ ภาค ตำแหน่ง อายุ จะใช้สถิติเป็น ความถี่ ร้อยละ
เปอร์เซนต์
2.มาตรวัดอันดับ (Ordinal Scale) เป็นข้อมูลที่มีรายละเอียดเพิ่มเติมจาก
Nominal เพราะนอกจากจะแยกความแตกต่างได้แล้วยังสามารถเปรียบเทียบความดีกว่าหรือแย่กว่าได้
แต่บอกไม่ได้ว่าดีกว่าหรือดีกว่าเท่าใด เป็นกี่เท่าแต่สามารถเรียบลำดับได้วยด้วย เช่น
ระดับการศึกษา ใช้สถิติความถี่ ร้อยละ เปอร์เซ็นต์
3.มาตรวัดอันตรภาค (Interval Scale) ข้อมูลเป็นตัวเลข
คูณหาร บวก ลบ ยกกำลังได้ บอกปริมาณได้แต่ไม่มีศูนย์จริง เช่นคะแนนสอบ เกรดเฉลี่ย
อุณหภูมิ คะแนนทัศนคติ สถิติที่ใช้ : ค่าเฉล่ย ส่วนเบี่ยงเบนมาตรฐาน S.D.
4. มาตรวัดอัตราส่วน
(Ratio Scale) เหมือน
Interval แต่มีศูนย์แท้จริง เช่นรายได้ รายจ่าย อายุ น้ำหนัก
สถิติที่ใช้ คือค่าเฉลี่ย Xbar และส่วนเบี่ยงเบนมาตรฐาน S.D.
ตัวอย่างงานวิจัย
1.ถ้าเป็นคำถามเกี่ยวกับคุณลักษณะของประชากรผู้ตอบแบบสอบถาม
ลักษณะแบบสอบถามเป็นมาตราบัญญัติ (Nominal Scale) และแบบมาตราเรียงลำดับ
(Ordinal Scale)
2.ถ้าเป็นคำถามเกี่ยวกับพฤติกรรมผู้บริโภค independent
variable ถ้าเป็นมาตราวัดเรียงลำดับเรียกว่า (ordinal
Scale)
3.ถ้าเป็นปัจจัยทางตลาด กรณีที่ปัจจัยทางตลาดเป็นตัวแปรตาม
หรือความพึงพอใจ ถ้าแบบสอบถามเป็นแบบมาตราอันตราภาค ประมาณค่า 5 4 3 2 1
เราจะเรียกว่า (Interval Scale)
ตัวอย่างสมมุติฐานงานวิจัย
นักศึกษาปริญญาโทที่มีระดับชั้นปี
และสาขาวิชาแตกต่างกัน
มีความพึงพอใจของนักศึกษาที่มีต่อการให้บริการด้านการจัดการศึกษา
มหาวิทยาลัยรามคำแหง แตกต่างกัน
การวิเคราะห์ข้อมูลจากสมมุติฐาน
1. ถ้าข้อมูลเกี่ยวกับความพึงพอใจ ไม่ได้เอาไปเปรียบเทียบกับตัวแปรอื่น
เราจะใช้การวิเคราะห์ข้อมูลโดยใช้การหาค่าเฉลี่ย Xbar และค่าส่วนเบี่ยงเบนมาตรฐาน
S.D.
2. ถ้าต้องการเปรียบเทียบเช่น
เปรียบเทียบความพึงพอใจของนักศึกษาที่มีต่อ
การให้บริการด้านการจัดการศึกษา โดยจำแนกตามระดับชั้นปี (มีแค่ปี 1 กันปี
2) (2x4) เราจะใช้เครื่องมือ T-test
3. เปรียบเทียบความพึงพอใจของนักศึกษาที่มีต่อการให้บริการด้านต่างๆของการจัดการศึกษา
มหาวิทยาลัยรามคำแหง จำแนกตามสาขาวิชา (4X4) จะใช้การวิเคราะห์หาค่าความแปรปรวนทางเดียว (One-way
anova) หากมีความคิดเห็นแตกต่างกันอย่างมีนัยสำคัญทางสถิติจะเปรียบเทียบค่าคะแนนเฉลี่ยเป็นรายคู่ไปทำการทดสอบ
ตามวิธีของเชฟเฟ (Scheffe's Post hoc Comparison)
การแปลผล
1.ถ้าคะแนนเฉลี่ยออกมามากกว่า 4
เท่ากับ ระดับมาก
2. ผลการเปรียบเทียบ T-test ผล
ระดับความพึงพอใจ >4 t = .64
P=0.52
จากตารางผลการวิเคราะห์พบว่า
นักศึกษาระดับปริญญาโทที่มีระดับชั้นปีต่างกัน
มีความพึงพอใจต่อการให้บริการด้านการจัดการศึกษา โดยภาพรวมและรายด้าน
ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
3. ผลการเปรียบเทียบ One-way ANOVA
ความพึงพอใจของนักศึกษา 4 คณะ ได้แก่ บริหารการศึกษา บริหารธุรกิจ
นิติศาสตร์ รัฐศาสตร์ เปรียบเทียบกับรายด้าน 4 ด้าน ด้านบริการวิชาการ
ด้านห้องสมุดอัตโนมัติ ด้านระบบสื่อการ
เรียนการสอน ด้านอาคารสถานที่
ของห้องสมุด พบว่า ผล ค่าความพึงพอใจ 4.15,
4.11, 4.18, 3.99
t=1.746 p=.161
จากตาราง ผลการวิเคราะห์ พบว่า
นักศึกษาระดับปริญญาโทที่ศึกษาสาขาวิชาต่างกัน
มีความพึงพอใจต่อการให้บริการด้านการจัดการศึกษา โดยภพรวม และรายด้าน
ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
- P-Value
โดยทั่วไป
เมื่อเราต้องการสรุปผลการทดสอบสมมติฐานนั้น เราจะสนใจว่า สมมติฐานหลัก (Null hypothesis) ถูกยอมรับหรือปฏิเสธ ถ้าถูกยอมรับ นั่นก็แปลว่า
สมมติฐานเป็นจริง หรือแปลว่าสมมติฐานนั้นไม่เป็นจริง ถ้าถูกปฏิเสธ จึงมีการกำหนดค่าระดับนัยสำคัญ เพื่อที่จะบอกยอมรับหรือปฏิเสธ
Null hypothesis เราเรียกว่า Probability
Value ( P-Value ) ไม่ว่าเราจะทดสอบสมมติฐานประเภทใดก็ตาม
( Pearson
correlation r , t-test , F-test ) เป็นต้น
ผลการทดสอบสมมติฐานหรือโอกาสในการที่จะยอมรับหรือปฎิเสธสมมติฐานนั้นๆจะเป็นไปตามทฤษฎี
Propability ภายใต้ Normal
distribution เท่านั้นค่า P - Value นี้จะอ้างอิงอยู่กับ a โดยที่ P-Value คือค่าจริง ( Actual)
ของ probability ซึงได้จากการคำนวณ
ส่วน a คือเส้นกำหนด หรือจุดแบ่งระหว่างการยอมรับ
หรือปฏิเสธสมมติฐานหลัก ซึ่งก็คือ Probability เหมือนกัน เราจะยอมรับสมมติฐานหลัก ถ้า P-Value มากกว่า a และปฏิเสธ ถ้า P-Value เท่าหรือน้อยกว่าการคำนวณหาค่า
P-Value มีทั้งหมด 3
กรณี ตามการกำหนดรูปแบบการทดสอบสมมติฐาน
คือกรณีการทดสอบมากกว่า ( Upper-tailed
test) ค่า P-value จะเท่ากับพื้นที่ด้านขวามือของค่า Z หรือ
t ที่คำนวณได้ ( Tcalculated) ในกรณีนี้ a
ก็จะเท่ากับพื้นที่ตั้งแต่ขวามือของค่า Tcritical ไปจนสุดขอบ
P-Value = Area in upper tail กรณีการทดสอบน้อยกว่า
( Lower-tailed
test) ค่า P-value จะเท่ากับพื้นที่ด้านซ้ายมือของค่า -Z หรือ
-t ที่คำนวณได้( Tcalculated) ในกรณีนี้ a
ก็จะเท่ากับพื้นที่ตั้งแต่ซ้ายมือของค่า
Tcritical ไปจนสุดขอบ
P-Value = Area in lower tail กรณีการทดสอบไม่เท่ากับ
(Two-tailed test) ค่า P-value
จะเท่ากับผลรวมของพื้นที่ด้านซ้ายมือของค่า
-Z หรือ
-t และทางขวามือของ ค่า Z
หรือ t ที่คำนวณได้ ในกรณีนี้ a
ก็จะเท่ากับสองเท่าของพื้นที่ตั้งแต่ซ้ายมือของค่า
Tcritical หรือ
-Tcriticalไปจนสุดขอบ P-Value = Sum of area in two
tails ดังนั้น a คือ พื้นที่ใต้กราฟ เมื่อใช้ค่า Z หรือ
T- Critical ซึ่งก็คือเกณฑ์ หรือ Limit นั่นเอง ส่วน P-Value
คือพื้นที่ใต้กราฟ เมื่อใช้ค่า Z หรือ T-
Calculated ซึ่งก็คือค่า Actual ที่ได้จากการ วิเคราะห์ จากข้อมูลจริง การคำนวณหาค่า P-Value มีสองแนวทาง1. ใช้ Z-Table
ช่วย โดยมี 3 เงื่อนไขดังนี้
- Hypothesis
Testing การทดสอบสมมติฐานHypothesis Testing หรือการทดสอบสมมติฐาน คือกระบวนการที่เราใช้ข้อมูลจาก Sample มาตัดสินเกี่ยวกับ Population โดยจะตัดสินเลือกสมมติฐานที่มีข้อมูลสนับสนุนเราจะตั้งสมมติฐาน
2 อัน คือNull
Hypothesis, H0 : เป็นแนวความคิดเดิมที่มีปัจจุบัน
(มักจะมีเครื่องหมาย = อยู่)Alternative
Hypothesis, Ha: แนวความคิดใหม่ที่เราต้องการทดสอบ
(มักจะมีเครื่องหมาย
<, >, หรือ ≠ ซึ่งจะต้องตรงข้ามกับ H0)ตัวอย่างเช่น
บริษัทแห่งหนึ่งผลิตน้ำส้มซึ่งในขวดควรจะมีปริมาตร 250 cc ทางผู้จัดการเกิดความสงสัยว่าน้ำส้มในขวดอาจมีการใส่น้อยกว่าความเป็นจริง
จึงมีสมมติฐานดังนี้ (เราจะตั้งให้ไม่มีส่วนที่ซ้ำกัน)H0 : µ >= 250 cc (ที่เป็นอยู่เดิม)Ha: µ < 250 cc (ที่กำลังอยากจะทดสอบ)ที่นี้เราจะรู้ได้ยังไงว่าสมมติฐานอันไหนที่เป็นความจริง?หลักการคิดก็คือให้เราคิดไว้ก่อนว่า Null Hypothesis (H0) นั้นถูกต้องถ้าหากข้อมูลที่สุ่มออกมาเป็นสิ่งที่ไม่น่าจะเกิดขึ้น
แสดงว่า H0 ไม่จริง ดังนั้นเราก็จะหันมาสนับสนุน Ha แทนแล้วเราจะดูยังไงว่าข้อมูลนั้นเป็นสิ่งที่ไม่น่าจะเกิดขึ้น?วิธีคิดคือ ถ้าสมมติว่า H0 เป็นจริง
ความน่าจะเป็นที่จะพบข้อมูลที่สำรวจได้ในปัจจุบันหรือข้อมูลที่ไปในทิศทางเดียวกับ
Ha จะเป็นเท่าไหร่? ซึ่งเราจะเรียกความน่าจะเป็นนี้ว่า
p-value ( แปลว่า เป็นไปได้แค่ไหน ถ้าหากว่า H0 จริง แล้วจะเกิดเหตุการณ์แบบที่เรากำลังเจออยู่ขึ้น)ค่า p-value ที่น้อย แปลว่า
โอกาสที่จะเกิดเหตุการณ์แบบที่กำลังพบอยู่นั้นน้อยมากๆ
ดังนั้นเราก็จะมีหลักฐานไปแย้ง Null Hypothesis ได้อย่างไรก็ตาม
เราอาจจะสรุปผิดได้ เช่น เราดันไปแย้ง H0 ทั้งๆ ที่จริงแล้ว H0 มันถูกต้องอยู่แล้ว ซึ่งความคิดพลาดนี้เราจะเรียกว่า Type I error หรือค่า α
ตามตางรางข้างล่างหลักการคร่าวๆ คือp value > .10 → ความแตกต่าง (ของข้อมูลจาก sample กับ H0) ที่พบ นั้น “ไม่มีนัยสำคัญ”p
value ≤ .10 → ความแตกต่างที่พบนั้น “ค่อนข้างมีนัยสำคัญ”p value ≤ .05 → ความแตกต่างที่พบนั้น
“มีนัยสำคัญ”
(ปกติ จะใช้ค่านี้)p value ≤ .01 → ความแตกต่างที่พบนั้น “มีนัยสำคัญอย่างมาก”* มีนัยสำคัญในที่นี้หมายถึงว่า
ความแตกต่างที่พบนั้นไม่ใช่เป็นเพราะเหตุบังเอิญ นั่นคือ H0 เป็นเท็จนั่นเองจริงๆ แล้วระดับนัยสำคัญนั้นมีอยู่หลายระดับ
เราจึงควรกำหนดเอาไว้ก่อนว่า เราจะคิดที่ระดับเท่าไหร่ดี
เพราะการที่เราจะยอมรับหรือปฏิเสธ H0 นั้นขึ้นอยู่กับค่า p-value และ ระดับนัยสำคัญ significant level (α)หาก p-value
< α เราก็จะทำการปฏิเสธ H0 และยอมรับ Ha
ครับ** ปกติแล้วเรามักจะใช้ significant level (α) ที่ 0.05
ครับเรามาดูตัวอย่างกันครับจะได้เห็นภาพจากผลสถิติปี
1990 ที่สำรวจประชากรทุกคน ( cencus) พบว่า
ค่าเฉลี่ยของคนในการดูทีวีในหนึ่งวันอยู่ที่ 5 ชม. โดยมี standard deviation 2 ชม. นักวิจัยต้องการทดสอบว่าจริงๆแล้ว ค่าเฉลี่ยของการดูทีวีนั้นมากกว่า
5 ชม. เค้าจึงทำการสุ่มตัวอย่างออกมา 100 คน แล้วพบว่า ค่าเฉลี่ยของการดูทีสีอยู่ที่ 5.5 ชม.เราไม่แน่ใจว่า 5.5 ชม.
ที่ได้ซึ่งมากกว่า 5
ชม. ที่เคยได้สำรวจไว้นั้น
มันมากกว่าจริงๆ หรือแค่บังเอิญกันแน่?? วิธีการทดสอบก็คือ
เราต้องตั้งสมมติฐาน 2
อันคือH0 : µ <= 5Ha: µ > 5หากเราสมมติว่า H0 จริง เราจะได้ว่า µ = 5, σ=2, x บาร์ = 5.5ดังนั้น p-value
= โอกาสที่จะเกิดค่าเท่ากับ x บาร์ หรือไปในทิศทางของ Ha นั่นคือ "มากกว่า"
เราสามารถหาได้โดยใช้ทฤษฎี CLT
ครับนั่นตือเราหา ความน่าจะเป็นที่ xบาร์ ≥
5.5 เป็นเท่าไหร่ นั่นเองเมื่อเราใช้ CLT เราจะรู้ว่า sample
100 อันที่สุ่มมานั้น จะมีการแจกแจงดังนี้= xบาร์ ~
N (µ, σ / √ n ) [ ในที่นี้เรารู้ σ จึงใช้ normal
ได้ ถ้าหากไม่รู้ σ ควรใช้ t-distribution
ที่ df=n-1 แทนครับ]= xบาร์ ~
N (5, 2 / √ 100 )= xบาร์ ~ N (5, 0.2 )เราสามารถหาความน่าจะเป็นที่ x บาร์ ≥ 5.5 ได้จาก excel
ได้เลยครับจากสูตร = NORMDIST(x,mean,standard_dev,TRUE)ซึ่งจะให้ค่าความน่าจะเป็นที่น้อยกว่าหรือเท่ากับค่า x จาก normal
distribution ที่มีค่า mean และ standard
deviation ที่กำหนดครับแทนค่า = NORMDIST(5.5 , 5 , 0.2 ,TRUE)จะได้ค่า = 0.993790335
ซึ่งเราจะยังใช้ไม่ได้ครับ
เพราะที่ออกมานั้น เป็นความน่าจะเป็นที่ x < 5.5 ต่างหากดังนั้นความน่าจะเป็นที่
≥ 5.5 = 1-0.9938
=0.0062 ครับแต่ถ้าไม่สามารถใช้ Excel ได้ เราก็ต้องเปลี่ยนจากค่า x ให้เป็นค่า z แล้วเปิดตารางเอาครับxบาร์ ~ N (5, 0.2 )เปลี่ยน xบาร์เป็น z
แล้วเปิดตารางเทียบz = (xบาร์ - µ)
/ (σ / √ n) ~ N (0,1)z = (5.5 - 5) /0.2z = 2.5ดังนั้น โอกาสที่ xบาร์ ≥ 5.5 หรือ z
≥ 2.5 = 0.0062ซึ่งคำนวนได้จากสูตร Excelซึ่งเราจะเห็นว่าโอกาสที่ xบาร์ ≥ 5.5 นั้นมีค่า = 0.0062
ซึ่งน้อยมาก (p-value น้อยมาก)แปลว่า p-value = 0.0062 นั้น <0.05 แปลว่า เราจะปฏิเสธ H0 แล้วยอมรับ Haนั่นคือ เรายอมรับว่า µ > 5 จริงๆครับ (
อย่างไรก็ตาม โอกาสที่จะเกิดความผิดพลาดในการสรุป หรือ Type I Error อยู่ที่ 5%
ครับ เนื่องจากเราใช้ค่า 0.05 เป็นตัวเทียบกับ p-value)หวังว่าพอจะเห็นภาพกันมากขึ้นนะครับผมhttp://www.siraekabut.com
ไม่มีความคิดเห็น :
แสดงความคิดเห็น