การเสริมแรงและการลงโทษ (B.F.Skinner)

            ทุกท่านอาจคุ้นเคยกับการเสริมแรง และการลงโทษอยู่บ้าง เป็นแนวคิดที่ประยุกต์ใช้ไม่ว่าจะทำงาน การเรียน การปฏิสัมพันธ์ ล้วนมีการเสริมแรงและการลงโทษอยู่รอบ ๆ เสมอ ซึ่งบางทีเราเสริมแรงหรือลงโทษกันและกันโดยไม่ได้ตั้งใจ เช่น การชมเชยลูกเวลาทำความดี การให้ของขวัญแฟน การที่ครูลงโทษนักเรียน  การให้โบนัสของเจ้านาย หรือค่าตอบแทนพิเศษอื่น ๆ ฯลฯ 

            การเสริมแรงและการลงโทษเป็นทฤษฎีการวางเงื่อนไขด้วยการกระทำ (Operant Conditioning Theory) ของนักจิตวิทยาชาวอเมริกัน Burhus Skinner เป็นนักจิตวิทยากลุ่มพฤติกรรมนิยม เขาเชื่อว่า 

"ถ้าคุณให้รางวัลหรือลงโทษอย่างเหมาะสม คุณจะสามารถทำให้ผู้อื่นเกิดพฤติกรรมตามที่ต้องการได้"

            Skinner ให้ความสนใจกับผลกรรม (Consequences) 2 ประเภท ได้แก่ ผลกรรมที่เป็นตัวเสริมแรง (Reinforcement) ที่ทำให้พฤติกรรมที่บุคคลกระทำอยู่นั้นมีอัตราเพิ่มขึ้น ในขณะที่ผลกรรมที่เป็นตัวลงโทษ (Punishment) ที่ทำให้พฤติกรรมที่บุคคลกระทำนั้นจะลดลงหรือยุติลง กล่าวคือ หากเราได้รับแรงเสริมพฤติกรรมที่เรากำลังแสดงอยู่นั้นจะมีอัตราที่เพิ่มขึ้น เช่น นักเรียนแสดงความคิดเห็นในห้องเรียน คุณครูจึงให้ชมนักเรียน นักเรียนจึงแสดงความคิดเห็นเพิ่มมากขึ้นในห้องเรียน ในทางตรงกันข้ามหากเราได้รับการลงโทษพฤติกรรมที่เรากระทำจะลดลงหรือยุติลง เช่น นักเรียนแสดงความคิดเห็นโดยใช้คำหยาบในห้องเรียน คุณครูจึงดุนักเรียน ทำให้นักเรียนยุติการแสดงความคิดเห็นอย่างหยาบคายในห้องเรียน

            ข้อสรุปดังกล่าวมาจาการทดลองที่มีชื่อเสียงของ Skinner ชื่อ Skinner's Box

            ลักษณะของกล่องจะเป็นรูปทรงสีเหลี่ยม มีคันโยก และหลอดไฟอยู่เหนือคันโยก โดยนักวิจัยจะคอยสังเกตสิ่งต่าง ๆ ที่เกิดขึ้นกับหนูขาว เมื่อถึงระยะเวลาหนึ่งที่หนูหิวอย่างมาก จนวิ่งวนไปวนมา เขี่ยสิ่งต่าง ๆ ภายในกล่องเพื่อหาทางออกไป จนในที่สุดหนูเอามือไปแตะกับคันโยกในขณะหลอดไฟสีฟ้าสว่าง จากนั้นอาหารจะตกลงมาจากท่อจ่าย (มีกลไกเชื่อมระหว่างคันโยกกับเครื่องจ่ายอาหารเม็ด) 

            เมื่อเวลาผ่านไปจนหนูหิวอีกครั้งก็จะวิ่งวนไปวนมาจนมือไปโดนอีกครั้งหนึ่ง สักพักมันจะเรียนรู้ว่าการแตะที่คันโยกนี้อาหารจะตกลงมาโดยใช้เวลาน้อยลงเรื่อย ๆ สิ่งนี้เรียกว่าการเสริมแรง (Reinforcement) แต่ในขณะเดียวกันถ้าหนูแตะคันโยกขณะที่ไฟสีแดงสว่างอยู่ จะมีกระแสไฟฟ้าอ่อนมาช๊อต ทำให้หนูเรียนรู้ว่าไม่ควรแตะคันโยกอันนี้ระหว่างที่ไฟสีแดงสว่างอยู่ (Punishment) 

            ทฤษฎีนี้มีประโยชน์ในการอธิบายพฤติกรรมของมนุษย์ และมีหลักการประยุกต์ใช้ที่มีประโยชน์หลายอย่าง ซึ่งหลักการของทฤษฎีนี้คือ พฤติกรรมของบุคคลเป็นผลพวงมาจากปฏิสัมพันธ์กับสิ่งแวดล้อม และพฤติกรรมสามารถเปลี่ยนแปลงได้เนื่องจากผลกรรมที่เกิดขึ้นในสภาพแวดล้อมนั้น อธิบายให้เข้าใจง่าย ๆ คือ มนุษย์เรามีวงจรนิสัยอยู่ โดยจะยกตัวอย่างกรณีอาจารย์และนักศึกษา

            เมื่อนักศึกษาได้รับคำชม หรืออยู่ในสภาพแวดล้อมที่ทุกคนชื่นชมกัน (Antecedent) ย่อมทำให้เขาตั้งใจเรียน (Behavior) และสุดได้เขาจะได้ผลกรรม (Consequences) คือเกรด A ดังนั้นการจะทำให้นักศึกษาได้ A อย่างต่อเนื่องอาจารย์สามารถชมเชยให้นักศึกษาตั้งใจเรียนอย่างต่อเนื่อง จนพฤติกรรมตั้งใจเรียนกลายเป็นนิสัยของนักเรียน กล่าวคือ สภาพแวดล้อมทำให้เกิด พฤติกรรม และตามมาด้วยผลกรรม การจะปรับเปลี่ยนพฤติกรรม จะต้องเสริมแรงที่ผลกรรมทำให้พฤติกรรมตั้งใจเรียนเพิ่มมากขึ้น 

            การแสดงพฤติกรรมของบุคคลจะแตกต่างกันไปตามสภาพแวดล้อมหรือสิ่งกระตุ้น มีทั้งพฤติกรรมที่พึงประสงค์ (พฤติกรรมที่ต้องการ) และพฤติกรรมที่ไม่พึงประสงค์ (พฤติกรรมที่ไม่ต้องการ) โดยสามารถปรับ ให้ลด เพิ่ม หรือยุติ ด้วยการเสริมแรงและการลงโทษ ซึ่งแบ่งออกเป็นหลายรูปแบบดังตารางต่อไปนี้
            การลงโทษทาง + (การให้สิ่งที่ไม่ชอบ) เป็นการที่ให้สิ่งที่ไม่พึงประสงค์ (ไม่ชอบ) แก่เป้าหมาย เมื่อเขา แสดงพฤติกรรมที่ไม่พึงประสงค์ออกมา เช่น นักเรียนพูดหยาบคายในห้องเรียน คุณครูจึงลงโทษด้วยการตำหนิ การลงโทษทางบวก จะทำให้พฤติกรรมที่เราไม่ชอบนั้นลดลงหรือยุติไป 

            การเสริมแรงทาง + (การให้สิ่งที่ชอบ) เป็นการให้สิ่งที่พึงประสงค์ (ชอบ) แก่เป้าหมาย เมื่อเขาแสดงพฤติกรรมที่พึงประสงค์ออกมา เช่น คุณครูพูดชมเชย หรือให้ขนมแก่นักเรียน เมื่อนักเรียนแสดงความคิดเห็นในห้องเรียน การเสริมแรงทางบวกจะไปกระตุ้นให้นักเรียนแสดงพฤติกรรม (ที่เราให้รางวัลไป) ออกมามากขึ้น

            การเสริมแรงทาง - (การถอนสิ่งที่ไม่ชอบ) เป็นการถอนสิ่งที่เป้าหมายไม่พึงประสงค์ (ไม่ชอบ) ออกไป เมื่อเขาแสงพฤติกรรมที่พึงประสงค์ออกมา เช่น คุณพ่อลดเวลาการทำความสะอาดบ้านให้ลูก เนื่องจากลูกขยันทำการบ้าน การเสริมแรงทางลบโดยการเอาสิ่งที่เขาไม่ชอบออกไป จะไปกระตุ้นให้ลูกแสดงพฤติกรรมที่พึงประสงค์ออกมา อย่างไรก็ตามเวลานำไปใช้จะต้องให้เขาเรียนรู้เองว่า หากเขาใช้เวลาทำการบ้าน เรียนรู้ อ่านหนังสือมากขึ้น เวลาในการทำความสะอาดบ้านจะลดลง 

            การลงโทษทาง - (การถอนสิ่งที่ชอบ) เป็น การที่เราถอนสิ่งที่เป้าหมายพึงประสงค์ (ชอบ) ออกไป เมื่อเขาแสดงพฤติกรรมที่ไม่พึงประสงค์ออกมา เช่น นักเรียนเล่น Smart Phone ในห้องเรียน คุณครูจึงยึดเอาไปเก็บไว้จนหมดคาบเรียน การลงโทษทางลบ จะไปกระตุ้นให้นักเรียนยุติหรือลดการเล่น Smart Phoneในคาบนั้น

            อย่างไรตาม Daniel Kahneman ได้กล่าวว่า "การให้รางวัลเมื่อทำผลงานได้ดีขึ้น ถือเป็นวิธีที่ใช้ได้ผลกว่าการลงโทษเมื่อทำผิดพลาด" สอดคล้องกับเจ้าของแนวคิดอย่าง Skinner ที่แม้ว่าจะผ่านมากว่าครึ่งศตวรรษ เขาก็ยังบอกว่าการเสริมแรงให้ผลดีมากกว่าการลงโทษ เนื่องจากเวลาที่ทำโทษเป้าหมายของเราจะมีพฤติกรรมต่อต้าน ซึ่งจะมากหรือน้อยขึ้นอยู่กับบุคลิกภาพ และประสบการณ์ในอดีตของเขา เช่น นักเรียนอาจจะประสบการณ์ด้านลบในวัยเด็ก จากครอบครัวที่ชอบทำโทษ ตำหนิ ทำให้เขาต่อต้านคุณครูเวลาทำโทษ หรือเด็กบางคนอาจจะเป็นโรคออทิสติก จึงทำให้เขาจัดการอารมณ์ไม่เก่ง เมื่อโดนคุณครูตำหนิ จึงแสดงออกต่อต้านออกมารุนแรง

            อีกทั้งเวลาที่เด็กบางคนทำได้ดีมาก เราจึงให้คำชมแต่เมื่อคาบเรียนต่อไปเด็กคนนี้กลับไม่ได้ทำได้ดีเท่าเดิม เราไม่ควรจะกังวล เพราะแสดงว่านักเรียนคนนี้กำลังถอยกลับไปยังค่าเฉลี่ย (Regression to the mean) กล่าวคือเมื่อวานเด็กคนนี้อาจจะโชคดีที่คำถามเป็นเรื่องที่เขาถนัด เขาจึงตอบได้ แต่พอมาอีกเรื่องหนึ่งที่เขาไม่ถนัด เขาจึงตอบได้น้อยลง 

            ยกตัวอย่างผู้ฝึกนักเรียนการบินที่บอกกับ Daniel Kahneman ในระหว่างที่สอนจิตวิทยาที่กองทัพอากาศว่า "ผมกล่าวชมนักเรียนหลายต่อหลายครั้งเมื่อพวกเขาสามารถใช้ท่าบินผาดโผนบางท่าได้อย่างสมบูรณ์แบบ แต่ครั้งต่อไปที่พวกเขาพยายามบินผาดโผนด้วยท่าเดิมพวกเขามักจะทำได้แย่ลง ในทางกลับกัน บางครั้งเมื่อผมตะคอกใส่นักเรียนที่ทำผลงานได้แย่ และส่วนใหญ่ครั้งต่อไปพวกเขากลับทำผลงานได้ดีขึ้น"

            Kahneman ให้ความเห็นว่า "โดยปกติแล้วผู้ฝึกสอนจะกล่าวชมเฉพาะนักเรียนที่ทำผลงานได้ดีกว่าค่าเฉลี่ยพอสมควรแต่นักเรียนคนดังกล่าวอาจแค่โชคดีในครั้งนั้น และมีแนวโน้มที่จะทำผลงานได้แย่ลงอยู่แล้วไม่ว่าจะถูกชมหรือไม่ก็ตาม ในทำนองเดียวกัน ผู้ฝึกสอนจะตะคอกใส่นักเรียนเวลาที่พวกเขาทำผลงานได้แย่ แต่นักเรียนมีแนวโน้มที่จะทำผลงานได้ดีขึ้นอยู่แล้ว ไม่ว่าผู้สอนจะทำอย่างไรกับพวกเขาก็ตาม

            กล่าวคือ หากนักเรียนทำผลงานในครั้งนี้ได้แย่ พวกเขาจะทำผลงานได้ดีขึ้นในครั้งถัดไป แต่หากพวกเขาทำผลงานในครั้งนี้ได้ดี ครั้งถัดไปก็มักจะทำผลงานได้แย่ลง โดยที่การชื่นชมหรือลงโทษไม่มีส่วนเกี่ยวข้องใด ๆ เลย ผู้คนมักเข้าใจผิดในเรื่องนี้ และใจร้อนตัดสินว่าการปรับพฤติกรรมของตนเองประสบความสำเร็จแล้ว ทั้ง ๆ ที่ในความจริงการเปลี่ยนแปลงพฤติกรรมใดก็ตามจำเป็นต้องใช้เวลา และการชื่นชมที่ดีนั้นจะต้องชมที่ความพยายาม มิใช่ชมที่ความสำเร็จ เพราะว่ามนุษย์เราจะเปรียบเทียบกับผู้อื่นอัตโนมัติ หากเราได้รับคำชมแต่เพื่อนรอบ ๆ ตัวทำได้ดีกว่า เราก็จะรู้สึกน้อยเนื้อต่ำใจว่าทำไมตนเองถึงทำได้แย่กว่า แต่หากชื่นชมเขาเพราะความพยายาม เขาก็จะพยายามมากขึ้นไปอีก ดังนั้นการเสริมแรงและการลงโทษจึงมีความซับซ้อน ต้องอาศัยการสังเกตและการเข้าใจบุคคลที่เราจะนำไปใช้ให้ดี 

อ่านบทความรูปแบบการเสริมแรงต่อไปที่ลิ้งนี้

สามารถอ่านบทความอื่นเพิ่มเติมจากลิ้ง สารบัญ

อ้างอิง

Duhigg C. (2014). The Power of Habit: Why We Do What We Do in Life and Business. NY: Random House.

McLeod, S. (2018). How Reinforcement and Punishment Modify Behavior. https://www.simplypsychology.org/operant-conditioning.html

Kahneman, D. (2013). Thinking Fast and Slow. NY: Farrar, Straus and Giroux.

ความคิดเห็น