ปัญญาประดิษฐ์ ใช้เวลาฝึกแค่ 3 วัน ดวลเกมไพ่ เก่งเท่ามนุษย์ 4 คน

คณะนักวิทยาศาสตร์จีนเปิดเผยการพัฒนาโปรแกรมปัญญาประดิษฐ์ (AI) ชื่อว่าอัลฟาโฮลเอ็ม (AlphaHoldem) ที่มีความคิดว่องไวและมีฝีมือการเล่นเกมไพ่เท็กซัส โฮลเอ็ม (Texas hold’em) แบบเฮดส์ อัป (heads-up) เทียบเท่าผู้เล่นมนุษย์ระดับมืออาชีพ

รายงานที่เตรียมนำเสนอในงาน เอเอเอไอ 2022 (AAAI 2022) การประชุมด้านปัญญาประดิษฐ์ระดับโลกที่มีกำหนดจัด ณ เมืองแวนคูเวอร์ของแคนาดา ในเดือนกุมภาพันธ์ปีหน้า ระบุว่าโปรแกรมดังกล่าวมีความสามารถเท่าผู้เล่นมนุษย์ชาญฉลาด 4 คน หลังจากฝึกฝนด้วยตนเองเป็นเวลาเพียง 3 วัน ในเกมการแข่งขันแบบผู้เล่น 2 คน ที่ใช้ไพ่ 10,000 ชุด

เท็กซัส โฮลเอ็ม เป็นเกมไพ่ยอดนิยมที่ผู้เล่นมักใช้ทักษะการหลอกให้หลงกล ทำให้เกมประเภทนี้คล้ายคลึงโจทย์ในโลกความจริงมากกว่าเกมหมากรุกทั่วไป เนื่องจากผู้เล่นต้องตัดสินใจโดยใช้ข้อมูลที่อาจไม่สมบูรณ์และไม่ใช่ข้อมูลจริง

คณะนักวิจัยจากสถาบันระบบอัตโนมัติ สังกัดสถาบันบัณฑิตวิทยาศาสตร์จีน (CAS) รายงานว่าอัลฟาโฮลเอ็มเป็นโปรแกรมที่เรียนรู้ว่องไว และใช้เวลาเพียง 3-4 มิลลิวินาทีต่อการเคลื่อนไหวแต่ละครั้ง ซึ่งเร็วกว่าผู้เล่นปัญญาประดิษฐ์รุ่นแรกอย่างดีปสติก (DeepStack) และลิบราตัส (Libratus) ราว 1,000 เท่า และยังเก่งกาจกว่าดีปสติกในการแข่งขันด้วยไพ่ 100,000 ชุดด้วย

รายงานเสริมว่าโปรแกรมดีปสติกพัฒนาโดยมหาวิทยาลัยอัลเบอร์ตา ขณะที่ลิบราตัสพัฒนาโดยมหาวิทยาลัยคาร์เนกีเมลลอน ผู้เล่นปัญญาประดิษฐ์ทั้งสองนี้เอาชนะผู้เล่นมืออาชีพในเกมไพ่เฮดส์ อัป แบบผู้เล่น 2 คน เมื่อปี 2016 และปี 2017 โดยใช้อัลกอริธึมที่เรียกว่าการลดทอนความผิดพลาดให้น้อยสุด (counterfactual regret minimization) โดยในการเคลื่อนไหวแต่ละครั้งนั้นจะใช้เวลา 3 วินาที และ 4 วินาทีตามลำดับ ทำให้สิ้นเปลืองพลังงานการคำนวณมหาศาล

ปัญญาประดิษฐ์ ใช้เวลาฝึกแค่ 3 วัน ดวลเกมไพ่ เก่งเท่ามนุษย์

แถลงการณ์ล่าสุดจากสถาบันฯ เผยว่าอัลฟาโฮลเอ็ม ใช้ชุดคำสั่งใหม่ผ่านการผสมผสานการเรียนรู้เชิงลึกเข้ากับอัลกอริธึมการเล่นด้วยตนเองแบบใหม่ ซึ่งใช้หน่วยประมวลผลกราฟิกส์เพียง 8 ตัวระหว่างการฝึกฝน จึงเบามากเป็นพิเศษเมื่อเทียบกับหน่วยประมวลผล 13,000 ตัวของโปรแกรมดีปสติก

ทั้งนี้ คณะนักวิจัยกล่าวว่าพวกเขาจะประยุกต์ใช้เทคโนโลยีใหม่นี้กับเกมอื่นๆ อาทิ ไพ่นกกระจอกและไพ่บริดจ์ เพื่อสรรสร้างปัญญาประดิษฐ์อันชาญฉลาดต่อไป

(แฟ้มภาพซินหัว : ผู้เล่นมนุษย์กำลังเล่นเกมไพ่เท็กซัส โฮลเอ็ม กับโปรแกรมปัญญาประดิษฐ์ ในอำเภอเฉิงไม่ มณฑลไห่หนานทางตอนใต้ของจีน วันที่ 10 เม.ย. 2017)