วันพฤหัสบดีที่ 19 กุมภาพันธ์ พ.ศ. 2558

สรุปเกี่ยวกับสมมติฐานงานวิจัย

สรุปเกี่ยวกับสมมติฐานงานวิจัย
1.              ตัวแปรที่ใช้บ่อยมี 2 ตัวแปร
ตัวแปรต้นหรือเรียกว่าตัวแปรอิสระ (Independent Variable) เป็นตัวแปรเหตุ
ตัวแปรตามหรือเรียกว่าตัวแปรผล (Dependent Variable) หมายถึงตัวแปรที่เกิดเนื่องจากตัวแปรอิสระ
มาตราวัดตัวแปร มี 4 แบบได้แก่
1.มาตรวัดนามบัญญัติ (Nominal Scale) เป็นข้อมูลที่ไม่ได้มีค่าเป็นตัวเลขจริงได้แก่ เพศ คณะ ภาค ตำแหน่ง อายุ จะใช้สถิติเป็น ความถี่ ร้อยละ เปอร์เซนต์
2.มาตรวัดอันดับ (Ordinal Scale) เป็นข้อมูลที่มีรายละเอียดเพิ่มเติมจาก Nominal เพราะนอกจากจะแยกความแตกต่างได้แล้วยังสามารถเปรียบเทียบความดีกว่าหรือแย่กว่าได้ แต่บอกไม่ได้ว่าดีกว่าหรือดีกว่าเท่าใด เป็นกี่เท่าแต่สามารถเรียบลำดับได้วยด้วย เช่น ระดับการศึกษา ใช้สถิติความถี่ ร้อยละ เปอร์เซ็นต์
3.มาตรวัดอันตรภาค (Interval Scale) ข้อมูลเป็นตัวเลข คูณหาร บวก ลบ ยกกำลังได้ บอกปริมาณได้แต่ไม่มีศูนย์จริง เช่นคะแนนสอบ เกรดเฉลี่ย อุณหภูมิ คะแนนทัศนคติ สถิติที่ใช้ : ค่าเฉล่ย ส่วนเบี่ยงเบนมาตรฐาน S.D.
4. มาตรวัดอัตราส่วน (Ratio Scale) เหมือน Interval แต่มีศูนย์แท้จริง เช่นรายได้ รายจ่าย อายุ น้ำหนัก สถิติที่ใช้ คือค่าเฉลี่ย Xbar และส่วนเบี่ยงเบนมาตรฐาน S.D.

ตัวอย่างงานวิจัย
1.ถ้าเป็นคำถามเกี่ยวกับคุณลักษณะของประชากรผู้ตอบแบบสอบถาม ลักษณะแบบสอบถามเป็นมาตราบัญญัติ (Nominal Scale) และแบบมาตราเรียงลำดับ (Ordinal Scale)
2.ถ้าเป็นคำถามเกี่ยวกับพฤติกรรมผู้บริโภค independent variable ถ้าเป็นมาตราวัดเรียงลำดับเรียกว่า (ordinal Scale)
 3.ถ้าเป็นปัจจัยทางตลาด กรณีที่ปัจจัยทางตลาดเป็นตัวแปรตาม หรือความพึงพอใจ ถ้าแบบสอบถามเป็นแบบมาตราอันตราภาค ประมาณค่า 5 4 3 2 1 เราจะเรียกว่า (Interval Scale)

ตัวอย่างสมมุติฐานงานวิจัย
นักศึกษาปริญญาโทที่มีระดับชั้นปี และสาขาวิชาแตกต่างกัน มีความพึงพอใจของนักศึกษาที่มีต่อการให้บริการด้านการจัดการศึกษา มหาวิทยาลัยรามคำแหง แตกต่างกัน

การวิเคราะห์ข้อมูลจากสมมุติฐาน
1. ถ้าข้อมูลเกี่ยวกับความพึงพอใจ ไม่ได้เอาไปเปรียบเทียบกับตัวแปรอื่น เราจะใช้การวิเคราะห์ข้อมูลโดยใช้การหาค่าเฉลี่ย Xbar และค่าส่วนเบี่ยงเบนมาตรฐาน S.D.
2. ถ้าต้องการเปรียบเทียบเช่น เปรียบเทียบความพึงพอใจของนักศึกษาที่มีต่อ  การให้บริการด้านการจัดการศึกษา โดยจำแนกตามระดับชั้นปี (มีแค่ปี 1 กันปี 2) (2x4)  เราจะใช้เครื่องมือ T-test  
3. เปรียบเทียบความพึงพอใจของนักศึกษาที่มีต่อการให้บริการด้านต่างๆของการจัดการศึกษา มหาวิทยาลัยรามคำแหง จำแนกตามสาขาวิชา (4X4)  จะใช้การวิเคราะห์หาค่าความแปรปรวนทางเดียว (One-way anova) หากมีความคิดเห็นแตกต่างกันอย่างมีนัยสำคัญทางสถิติจะเปรียบเทียบค่าคะแนนเฉลี่ยเป็นรายคู่ไปทำการทดสอบ ตามวิธีของเชฟเฟ (Scheffe's Post hoc Comparison) 

การแปลผล
1.ถ้าคะแนนเฉลี่ยออกมามากกว่า 4 เท่ากับ ระดับมาก
2. ผลการเปรียบเทียบ T-test  ผล ระดับความพึงพอใจ >4   t = .64 P=0.52
    จากตารางผลการวิเคราะห์พบว่า นักศึกษาระดับปริญญาโทที่มีระดับชั้นปีต่างกัน มีความพึงพอใจต่อการให้บริการด้านการจัดการศึกษา โดยภาพรวมและรายด้าน ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
3. ผลการเปรียบเทียบ One-way ANOVA ความพึงพอใจของนักศึกษา 4 คณะ ได้แก่ บริหารการศึกษา บริหารธุรกิจ นิติศาสตร์ รัฐศาสตร์ เปรียบเทียบกับรายด้าน 4 ด้าน ด้านบริการวิชาการ ด้านห้องสมุดอัตโนมัติ ด้านระบบสื่อการ
เรียนการสอน ด้านอาคารสถานที่ ของห้องสมุด พบว่า  ผล ค่าความพึงพอใจ 4.15, 4.11, 4.18, 3.99   t=1.746 p=.161
   จากตาราง ผลการวิเคราะห์ พบว่า นักศึกษาระดับปริญญาโทที่ศึกษาสาขาวิชาต่างกัน มีความพึงพอใจต่อการให้บริการด้านการจัดการศึกษา โดยภพรวม และรายด้าน ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05

  • P-Value โดยทั่วไป เมื่อเราต้องการสรุปผลการทดสอบสมมติฐานนั้น เราจะสนใจว่า สมมติฐานหลัก (Null hypothesis) ถูกยอมรับหรือปฏิเสธ ถ้าถูกยอมรับ นั่นก็แปลว่า สมมติฐานเป็นจริง หรือแปลว่าสมมติฐานนั้นไม่เป็นจริง ถ้าถูกปฏิเสธ  จึงมีการกำหนดค่าระดับนัยสำคัญ เพื่อที่จะบอกยอมรับหรือปฏิเสธ Null hypothesis เราเรียกว่า Probability Value ( P-Value ) ไม่ว่าเราจะทดสอบสมมติฐานประเภทใดก็ตาม ( Pearson correlation r , t-test , F-test  ) เป็นต้น ผลการทดสอบสมมติฐานหรือโอกาสในการที่จะยอมรับหรือปฎิเสธสมมติฐานนั้นๆจะเป็นไปตามทฤษฎี Propability ภายใต้ Normal distribution เท่านั้นค่า P - Value นี้จะอ้างอิงอยู่กับ  a  โดยที่ P-Value คือค่าจริง ( Actual) ของ probability ซึงได้จากการคำนวณ ส่วน a คือเส้นกำหนด หรือจุดแบ่งระหว่างการยอมรับ หรือปฏิเสธสมมติฐานหลัก ซึ่งก็คือ Probability เหมือนกัน  เราจะยอมรับสมมติฐานหลัก ถ้า P-Value มากกว่า a และปฏิเสธ ถ้า P-Value เท่าหรือน้อยกว่าการคำนวณหาค่า P-Value มีทั้งหมด 3 กรณี ตามการกำหนดรูปแบบการทดสอบสมมติฐาน คือกรณีการทดสอบมากกว่า ( Upper-tailed test) ค่า P-value จะเท่ากับพื้นที่ด้านขวามือของค่า Z หรือ  t ที่คำนวณได้ ( Tcalculated)  ในกรณีนี้ a ก็จะเท่ากับพื้นที่ตั้งแต่ขวามือของค่า Tcritical ไปจนสุดขอบ  P-Value = Area in upper tail กรณีการทดสอบน้อยกว่า ( Lower-tailed test) ค่า P-value จะเท่ากับพื้นที่ด้านซ้ายมือของค่า -Z หรือ  -t ที่คำนวณได้( Tcalculated)  ในกรณีนี้ a ก็จะเท่ากับพื้นที่ตั้งแต่ซ้ายมือของค่า Tcritical ไปจนสุดขอบ  P-Value = Area in lower tail กรณีการทดสอบไม่เท่ากับ (Two-tailed test) ค่า P-value จะเท่ากับผลรวมของพื้นที่ด้านซ้ายมือของค่า -Z หรือ  -t และทางขวามือของ  ค่า Z หรือ  t  ที่คำนวณได้  ในกรณีนี้ a ก็จะเท่ากับสองเท่าของพื้นที่ตั้งแต่ซ้ายมือของค่า Tcritical หรือ  -Tcriticalไปจนสุดขอบ P-Value = Sum of area in two tails ดังนั้น  a คือ พื้นที่ใต้กราฟ เมื่อใช้ค่า Z หรือ  T- Critical  ซึ่งก็คือเกณฑ์ หรือ Limit นั่นเอง ส่วน P-Value คือพื้นที่ใต้กราฟ เมื่อใช้ค่า Z หรือ T- Calculated ซึ่งก็คือค่า Actual ที่ได้จากการ วิเคราะห์ จากข้อมูลจริง  การคำนวณหาค่า P-Value มีสองแนวทาง1. ใช้ Z-Table ช่วย โดยมี 3 เงื่อนไขดังนี้
  • Hypothesis Testing การทดสอบสมมติฐานHypothesis Testing หรือการทดสอบสมมติฐาน คือกระบวนการที่เราใช้ข้อมูลจาก Sample มาตัดสินเกี่ยวกับ Population โดยจะตัดสินเลือกสมมติฐานที่มีข้อมูลสนับสนุนเราจะตั้งสมมติฐาน 2 อัน คือNull Hypothesis, H0 : เป็นแนวความคิดเดิมที่มีปัจจุบัน (มักจะมีเครื่องหมาย = อยู่)Alternative Hypothesis, Ha: แนวความคิดใหม่ที่เราต้องการทดสอบ (มักจะมีเครื่องหมาย <, >, หรือ ซึ่งจะต้องตรงข้ามกับ H0)ตัวอย่างเช่น บริษัทแห่งหนึ่งผลิตน้ำส้มซึ่งในขวดควรจะมีปริมาตร 250 cc ทางผู้จัดการเกิดความสงสัยว่าน้ำส้มในขวดอาจมีการใส่น้อยกว่าความเป็นจริง จึงมีสมมติฐานดังนี้ (เราจะตั้งให้ไม่มีส่วนที่ซ้ำกัน)H0 : µ >= 250 cc (ที่เป็นอยู่เดิม)Ha: µ < 250 cc (ที่กำลังอยากจะทดสอบ)ที่นี้เราจะรู้ได้ยังไงว่าสมมติฐานอันไหนที่เป็นความจริง?หลักการคิดก็คือให้เราคิดไว้ก่อนว่า Null Hypothesis (H0) นั้นถูกต้องถ้าหากข้อมูลที่สุ่มออกมาเป็นสิ่งที่ไม่น่าจะเกิดขึ้น แสดงว่า H0 ไม่จริง ดังนั้นเราก็จะหันมาสนับสนุน Ha แทนแล้วเราจะดูยังไงว่าข้อมูลนั้นเป็นสิ่งที่ไม่น่าจะเกิดขึ้น?วิธีคิดคือ ถ้าสมมติว่า H0 เป็นจริง ความน่าจะเป็นที่จะพบข้อมูลที่สำรวจได้ในปัจจุบันหรือข้อมูลที่ไปในทิศทางเดียวกับ Ha จะเป็นเท่าไหร่? ซึ่งเราจะเรียกความน่าจะเป็นนี้ว่า p-value ( แปลว่า เป็นไปได้แค่ไหน ถ้าหากว่า H0 จริง แล้วจะเกิดเหตุการณ์แบบที่เรากำลังเจออยู่ขึ้น)ค่า p-value ที่น้อย แปลว่า โอกาสที่จะเกิดเหตุการณ์แบบที่กำลังพบอยู่นั้นน้อยมากๆ ดังนั้นเราก็จะมีหลักฐานไปแย้ง Null Hypothesis ได้อย่างไรก็ตาม เราอาจจะสรุปผิดได้ เช่น เราดันไปแย้ง H0 ทั้งๆ ที่จริงแล้ว H0 มันถูกต้องอยู่แล้ว ซึ่งความคิดพลาดนี้เราจะเรียกว่า Type I error หรือค่า α ตามตางรางข้างล่างหลักการคร่าวๆ คือp value > .10 → ความแตกต่าง (ของข้อมูลจาก sample กับ H0) ที่พบ นั้น ไม่มีนัยสำคัญ”p value ≤ .10 → ความแตกต่างที่พบนั้น ค่อนข้างมีนัยสำคัญ”p value ≤ .05 → ความแตกต่างที่พบนั้น มีนัยสำคัญ” (ปกติ จะใช้ค่านี้)p value ≤ .01 → ความแตกต่างที่พบนั้น มีนัยสำคัญอย่างมาก”* มีนัยสำคัญในที่นี้หมายถึงว่า ความแตกต่างที่พบนั้นไม่ใช่เป็นเพราะเหตุบังเอิญ นั่นคือ H0 เป็นเท็จนั่นเองจริงๆ แล้วระดับนัยสำคัญนั้นมีอยู่หลายระดับ เราจึงควรกำหนดเอาไว้ก่อนว่า เราจะคิดที่ระดับเท่าไหร่ดี เพราะการที่เราจะยอมรับหรือปฏิเสธ H0 นั้นขึ้นอยู่กับค่า p-value และ ระดับนัยสำคัญ  significant level (α)หาก p-value <  α เราก็จะทำการปฏิเสธ H0 และยอมรับ Ha ครับ** ปกติแล้วเรามักจะใช้ significant level (α) ที่ 0.05 ครับเรามาดูตัวอย่างกันครับจะได้เห็นภาพจากผลสถิติปี 1990 ที่สำรวจประชากรทุกคน ( cencus) พบว่า ค่าเฉลี่ยของคนในการดูทีวีในหนึ่งวันอยู่ที่ 5 ชม. โดยมี standard deviation 2 ชม. นักวิจัยต้องการทดสอบว่าจริงๆแล้ว ค่าเฉลี่ยของการดูทีวีนั้นมากกว่า 5 ชม. เค้าจึงทำการสุ่มตัวอย่างออกมา 100 คน แล้วพบว่า ค่าเฉลี่ยของการดูทีสีอยู่ที่ 5.5 ชม.เราไม่แน่ใจว่า 5.5 ชม. ที่ได้ซึ่งมากกว่า 5 ชม. ที่เคยได้สำรวจไว้นั้น มันมากกว่าจริงๆ หรือแค่บังเอิญกันแน่?? วิธีการทดสอบก็คือ เราต้องตั้งสมมติฐาน 2 อันคือH0 : µ <= 5Ha: µ > 5หากเราสมมติว่า H0 จริง เราจะได้ว่า µ = 5, σ=2, x บาร์ = 5.5ดังนั้น p-value = โอกาสที่จะเกิดค่าเท่ากับ x บาร์ หรือไปในทิศทางของ Ha นั่นคือ "มากกว่า" เราสามารถหาได้โดยใช้ทฤษฎี CLT ครับนั่นตือเราหา ความน่าจะเป็นที่ xบาร์ ≥ 5.5 เป็นเท่าไหร่ นั่นเองเมื่อเราใช้ CLT เราจะรู้ว่า sample 100 อันที่สุ่มมานั้น จะมีการแจกแจงดังนี้= xบาร์ ~ N (µ, σ / √ n ) [ ในที่นี้เรารู้ σ จึงใช้ normal ได้ ถ้าหากไม่รู้ σ ควรใช้ t-distribution ที่ df=n-1 แทนครับ]= xบาร์ ~ N (5, 2 / √ 100 )= xบาร์ ~ N (5, 0.2 )เราสามารถหาความน่าจะเป็นที่ x บาร์ ≥ 5.5 ได้จาก excel ได้เลยครับจากสูตร = NORMDIST(x,mean,standard_dev,TRUE)ซึ่งจะให้ค่าความน่าจะเป็นที่น้อยกว่าหรือเท่ากับค่า x จาก normal distribution ที่มีค่า mean และ standard deviation ที่กำหนดครับแทนค่า = NORMDIST(5.5 , 5 , 0.2 ,TRUE)จะได้ค่า = 0.993790335 ซึ่งเราจะยังใช้ไม่ได้ครับ เพราะที่ออกมานั้น เป็นความน่าจะเป็นที่ x < 5.5 ต่างหากดังนั้นความน่าจะเป็นที่ ≥ 5.5 = 1-0.9938 =0.0062 ครับแต่ถ้าไม่สามารถใช้ Excel ได้ เราก็ต้องเปลี่ยนจากค่า x ให้เป็นค่า z แล้วเปิดตารางเอาครับxบาร์ ~ N (5, 0.2 )เปลี่ยน xบาร์เป็น z แล้วเปิดตารางเทียบz = (xบาร์ - µ) / (σ / √ n) ~ N (0,1)z = (5.5 - 5) /0.2z = 2.5ดังนั้น โอกาสที่ xบาร์ ≥ 5.5 หรือ z ≥ 2.5 = 0.0062ซึ่งคำนวนได้จากสูตร Excelซึ่งเราจะเห็นว่าโอกาสที่ xบาร์ ≥ 5.5 นั้นมีค่า = 0.0062 ซึ่งน้อยมาก (p-value น้อยมาก)แปลว่า p-value = 0.0062 นั้น <0.05 แปลว่า เราจะปฏิเสธ H0 แล้วยอมรับ Haนั่นคือ เรายอมรับว่า µ > 5 จริงๆครับ ( อย่างไรก็ตาม โอกาสที่จะเกิดความผิดพลาดในการสรุป หรือ Type I Error อยู่ที่ 5% ครับ เนื่องจากเราใช้ค่า 0.05 เป็นตัวเทียบกับ p-value)หวังว่าพอจะเห็นภาพกันมากขึ้นนะครับผมhttp://www.siraekabut.com


ไม่มีความคิดเห็น :

แสดงความคิดเห็น