royal coronation
วันที่ 23 สิงหาคม 2562
เจาะประเด็นร้อน

"เติมสมองเอไอ"... หุ่นยนต์กับคนไทยในอนาคต

วันที่ 27 เมษายน 2561 - 09:44 น.
หุ่นยนต์,เอไอ
Shares :
เปิดอ่าน 499 ครั้ง

"เติมสมองเอไอ".. หุ่นยนต์กับคนไทยในอนาคต : โดย...  ดร.ชัย วุฒิวิวัฒน์ชัย ผู้อำนวยการหน่วยวิจัยวิทยาการสื่อสารของมนุษย์และคอมพิวเตอร์

 
          บูมเหลือเกินครับสำหรับ “เอไอ” หรือปัญญาประดิษฐ์ (Artificial Intelligence) ในยุคไทยแลนด์ 4.0 จากงานวิจัยที่เป็นแค่ส่วนช่วยเพิ่มมูลค่ากลายมาเป็นผลิตภัณฑ์หลักที่เหล่าสตาร์ทอัพตั้งเป้ากัน สำหรับผมและทีมวิจัยพัฒนาด้านการสื่อสารของมนุษย์และคอมพิวเตอร์กว่า 70 ชีวิตตอนนี้หัวบันไดไม่แห้ง

          วันนี้อยากถือโอกาสเปิดเบื้องลึกเบื้องหลังของเอไอที่ผ่านเข้ามาในชีวิตและเชื่อว่าจะกระทบต่อสังคมไทยในอนาคตอันใกล้ มาอัปเดทเล่าให้ฟังกันครับ
 
          ยุคนี้การเปิดโปงคดีคอร์รัปชั่น คดีการเมือง คดีคนดัง ยันคดีหวยเริ่มหยิบยกเอาหลักฐานวัตถุประเภทวิดีโอคลิปหรือคลิปเสียงมาอ้างกันมากมาย ผมมีประสบการณ์ทำวิจัยตรวจเสียงผู้พูดมาตั้งแต่ช่วงปี 2540 หรือ 20 ปีที่แล้ว ตอนนั้นงานวิจัยยังเป็นวุ้น ทำๆ หยุดๆ จนมาช่วงปี 2555 จึงได้ผลักดันจริงจังโดยร่วมมือกับ Institute of Infocomm Research (I2R) ประเทศสิงคโปร์ สำเร็จผลกลายเป็น “ต้นแบบซอฟต์แวร์” ที่ใช้ในการตรวจเสียงผู้พูดได้ถูกต้องในระดับสากล
 

 

          หลังจากนั้นผมรับงานช่วยตรวจคลิปวิดีโอ คลิปเสียง จากหน่วยงานรัฐโดยเฉพาะการตรวจหลักฐาน แต่ในทางปฏิบัติจริงยังมีข้อจำกัดในการทำงานอยู่มาก เช่น เสียงต้นฉบับและเสียงต้องสงสัย ต้องยาวอย่างน้อย 3 นาที ควรถูกบันทึกมาจากสภาพแวดล้อมเดียวกัน ซึ่งตรงนี้แหละครับที่เป็นไปได้ยาก
 

         ยกตัวอย่างเช่น “เสียงต้องสงสัย ของนาย ก.” มีเนื้อหาชัดเจนว่ากำลังทำความผิดอะไรบางอย่างบันทึกจากโทรศัพท์มือถือ แต่พอส่งมาให้พิสูจน์ความถูกต้องว่าเป็นเสียงใคร ด้วยการไปบันทึกเสียงพูดของ นาย ก. บนเวทีปาฐกถาดังนั้นเสียงต้นฉบับจากมือถือ กับเสียงจากการพูดบนเวทีไม่สามารถเทียบเคียงกันได้ หลักฐานแบบนี้ส่งมาก็ไม่มีประโยชน์ เพราะผลการตรวจเชื่อถือไม่ได้
   
          งานตรวจแบบนี้ส่งมาให้ผม 4–5 คดี แต่สุดท้ายต้องยกเลิกบริการนี้ไปเพราะนักวิจัยไม่เพียงพอ ปัจจุบันหน่วยงานไหนต้องการตรวจเสียงผู้พูดจะใช้วิธีส่งข้อมูลเสียงไปตรวจในต่างประเทศ เช่น มาเลเซีย ราคาค่าตรวจคิดเป็นชั่วโมง ประมาณ 8,000 บาทต่อการทำงาน 1 ชั่วโมง ได้ยินแล้วก็อยากให้มีศูนย์บริการแบบนี้เองในประเทศไทย นอกจากเงินทองไม่รั่วไหล ยังเป็นการดีที่ข้อมูลสำคัญไม่ต้องไปตกอยู่ในมือต่างชาติครับ

 


  
          ทุกวันนี้พวกเราคนไทยกำลังส่งเสริมความร่ำรวยของธุรกิจชาติอื่นๆ อยู่ครับ เช่นเฟซบุ๊กไลน์แอปเปิล กูเกิล ฯลฯ ชาวต่างชาติสร้างสิ่งอำนวยความสะดวกออกมาให้ชาวสังคมออนไลน์ในไทยใช้ส่งข้อมูลข่าวสารอย่างเมามัน (ซึ่งผมเองยังไม่แน่ใจนักว่ามันแคบหรือกว้าง เพราะวนไปวนมา ข่าวเดียวกันส่งมาถึงผมผ่านหลายกลุ่มที่ไม่น่าเกี่ยวข้องกันเลย)
   
          โปรแกรมยอดนิยมพวกนี้พระเอกที่อยู่เบื้องหลัง คือการใช้หุ่นยนต์ปัญญาประดิษฐ์ “เอไอ” มาช่วยเรียนรู้พฤติกรรม เรียนรู้วิธีการสื่อสารปฏิสัมพันธ์ของผู้ใช้บริการ แล้วเอากลับไปปรับปรุงเพิ่มเติมคุณสมบัติให้ใช้งานดีขึ้นเรื่อยๆ วิธีการทำงานของ “เอไอ” ต้องใช้ข้อมูลขนาดใหญ่มาวิเคราะห์ครับ หมายถึงข้อมูลของพวกเราที่ใช้งานโปรแกรมเหล่านี้นั่นเอง ยิ่งใช้โปรแกรมไหนมาก เอไอที่ซ่อนตัวในนั้นอยู่ก็ยิ่งมีข้อมูลของพวกเรามากขึ้น
  
          แต่การจะนำข้อมูลของผู้ใช้บริการไปสร้างรายได้ทางธุรกิจต้องได้รับความยินยอมเสียก่อน

          คำถาม:เราอนุญาตให้ใช้ข้อมูลของเราตั้งแต่เมื่อไหร่
 
          (เฉลย...ตั้งแต่วันแรกที่ “กดสมัคร” แล้ว)
  
          ปัญหาการละเมิดสิทธิส่วนบุคคลเกิดขึ้นอย่างต่อเนื่องล่าสุดเฟซบุ๊กต้องออกมาประกาศขอโทษชาวโลกที่ข้อมูลของผู้ใช้อาจสูงถึง 50 ล้านคน รั่วไหลไปยังบริษัทวิเคราะห์ด้านการตลาด

          พึงระวังไว้นะครับ นับจากนี้ไปอาจเกิดคดีอาชญากรรมไซเบอร์ที่ใช้ข้อมูลส่วนตัวของพวกเราแน่ๆ
  
          หนึ่ง ...ไม่มีความลับในโลกนี้ สอง...อย่าเอาอะไรส่วนตัวไปโพสต์หรือเก็บไว้บนคลาวด์เลยครับ

 

 

           หากมองอีกมุมหนึ่ง ระบบการทำงานของ “เอไอ” หลายอย่างเป็นประโยชน์อย่างยิ่งต่อมนุษยชาติครับ โดยเฉพาะเครื่องมือแปลภาษา อาทิ Google Translate มีความสามารถในการแปลภาษาดีขึ้นเรื่อยๆ เมื่อได้รับการใช้งานอย่างต่อเนื่อง ยิ่งภาษาที่มีผู้ใช้เยอะการแปลจะมีประสิทธิภาพใกล้เคียงภาษาที่ถูกต้องของมนุษย์มากขึ้น บางครั้งผมแอบคิดว่าในอนาคตลูกหลานของพวกเราในอนาคตไม่ต้องเรียนภาษาอื่นๆ ให้วุ่นวายอีกต่อไป ใช้โปรแกรมแปลภาษาแทน ยกเว้นภาษาชนกลุ่มน้อยที่ต้องการอนุรักษ์เอาไว้เท่านั้น
 
          ระบบแปลภาษาอัตโนมัติเหมาะกับภูมิภาคอาเซียนมากครับ เพราะภาษาอังกฤษของพวกเราก็ลุ่มๆ ดอนๆ บางประเทศก็ดีบ้าง บางประเทศก็ไม่กระดิก เมื่อปี 2555 เนคเทคเป็นเจ้าภาพในเวทีอาเซียนริเริ่มเชิญชวนหน่วยวิจัยในแต่ละประเทศมาร่วมกันวิจัยและพัฒนาระบบแปล 10 ภาษาอาเซียนรวมทั้งภาษาอังกฤษโครงการนี้คงต้องใช้เวลาพัฒนาอีกพักถึงจะมีประสิทธิภาพนำมาใช้ได้จริง
  
          สำหรับวงการธุรกิจในประเทศไทยยุคดิจิทัล ผมได้ยินคำว่า “แชตบอต” (Chat bot) บ่อยมาก คืออย่างนี้ครับ เริ่มต้นจากบริการคอลเซ็นเตอร์ให้โทรศัพท์สอบถามปัญหาหรือข้อมูลต่างๆ พอ "เทคโนโลยีอินเทอร์เน็ตเข้ามา" ก็ใช้วิธีให้ค้นหาข้อมูลทางเว็บไซต์หรือทิ้งคำถามให้ตอบกลับทางอีเมล พอเข้าสู่ “ยุคสังคมออนไลน์” ก็ถามตอบติดต่อกันผ่านไลน์ ผ่านอินบ็อกซ์ จนกลายเป็นไลฟ์แชท (Live chat) ที่มีพนักงานนั่งตอบคำถามผ่านระบบแชท แต่คำถามเริ่มเยอะมากขึ้นเรื่อยๆ

 


  
          สุดท้ายเลยคิดวิธีหาหุ่นยนต์มาตอบคำถามแทน นั่นก็คือ “เอไอ” ที่กลายมาเป็นแชทบอตบริษัทจำนวนมากตั้งเป้าจะมีแชทบอตจะคอยบริการตอบคำถามต่างๆ ของลูกค้าแต่ปัญหาใหญ่คือ

          แชทบอตส่วนใหญ่มีแต่โครงร่าง ไม่มีสมอง หรือมีสมองเพียงน้อยนิด คือตอบคำถามง่ายๆ ตอบกว้างๆ คำถามมากกว่า 50% ตอบได้เพียงว่า “ไม่เข้าใจคำถาม”
 
          ภารกิจ “เติมสมอง” ให้แชทบอต กลายเป็นหนึ่งในภารกิจสำคัญที่ทีมวิจัยของผมกำลังเร่งพัฒนาซึ่งต้องอาศัยความสามารถด้านการประมวลผลภาษาไทยในหลายระดับ ตั้งแต่แยกประโยคยาวๆ เป็นคำๆ วิเคราะห์ไวยากรณ์ แบ่งวลี วิเคราะห์ความต้องการของข้อความที่เขียนเข้ามา ตลอดจนวิเคราะห์อารมณ์ความรู้สึก กำลัง “บ่น” หรือ “ต่อว่า” หรือไม่ และจะตอบกลับอย่างไรให้เป็นที่พึงพอใจ ผมเชื่อว่าอีกไม่นานเกินรอ เราๆ ท่านๆ จะได้เห็นแชทบอตที่ชาญฉลาดเกิดขึ้นมากมายในภาคธุรกิจ
 
          แชทบอตสมัยใหม่มาพร้อมกับอุปกรณ์ไฮเทคที่เราคงได้เห็นกันบ้างแล้ว เรียกว่า “ลำโพงอัจฉริยะ” (Smart speaker) ตัวนี้เป็นอุปกรณ์ปลายทางติดตั้งในบ้านเรือนเรา แล้วใช้สนทนาตอบสนองได้เหมือนกับการถามตอบในแชทบอต หรือใช้ค้นหาข้อมูลได้เหมือนกับการค้นในกูเกิล 
  
          “ลำโพงอัจฉริยะ” ที่จริงแล้วทำงานแค่เป็นตัวเชื่อมต่อ “รับสัญญาณเสียงจากผู้พูด” ส่งขึ้นไปบนคลาวด์ แปลงเสียงเป็นข้อความ แล้วส่งข้อความไปยังแชทบอตอีกที ผลตอบกลับของแชทบอตถูกแปลงเป็นเสียงกลับออกมาที่ลำโพง ความล้ำเลิศของอุปกรณ์อยู่ที่ความสามารถในการรับสัญญาณเสียงแบบรอบด้าน แยกแยะเสียงรบกวนจากสภาพแวดล้อม ตัดสินใจว่าเสียงนั้นเป็นคำสั่งหรือยังและสั่งคำว่าอะไร

 

 


 
          จุดนี้เป็นสิ่งที่ท้าทายมาก เพราะคนเราพูดได้หลากหลาย แถมยังอาจมีเสียงผู้พูดหลายคนทับซ้อนกัน มีสัญญาณรบกวนเกิดขึ้นได้มากมายด้วย เช่นเสียงจากทีวี ผลลัพธ์ของเสียงที่ผิดพลาดนี้อาจกลายเป็นข่าวใหญ่
 
          เช่น กรณีผู้บริโภคร้องเรียนว่าลำโพงอัจฉริยะไปสั่งออเดอร์ซื้อสินค้า โดยเจ้าของไม่ได้รับรู้ด้วย หรือล่าสุดข่าวที่สร้างความสยองขวัญน่าขนลุกคือช่วงค่ำคืนดึกดื่น อยู่ๆ เจ้าลำโพงตัวนี้ก็มีเสียงคนหัวเราะออกมา แถมไม่ได้เกิดขึ้นแค่เครื่องเดียว ทำให้บริษัทเจ้าของผลิตภัณฑ์รีบนำกลับไปตรวจสอบแก้ไข
 
          ผมวิเคราะห์ดูแล้ว เสียงหัวเราะสยองขวัญนี้ น่าจะเกิดจากความผิดพลาดของการรับสัญญาณเสียงและตัดสินใจว่าเป็นคำสั่งหรือไม่ เมื่อพบว่าเป็นคำสั่ง ค่าแรกๆ ของการแปลงเสียงออกมาเป็นข้อความ อาจกลายเป็นคำสั่งว่า “หัวเราะ” เจ้าลำโพงจึงหัวเราะตามคำสั่ง ฮา
 
          ชีวิตมนุษย์ในยุคดิจิทัลต่างดิ้นรนสรรหา “นวัตกรรม” มาอำนวยความสะดวกให้ตัวเองครับ ที่กล่าวมาคงเป็นตัวอย่างให้เห็นถึง “เอไอ” ที่กำลังจะเข้ามาเป็นส่วนหนึ่งในชีวิตประจำวันของเรา
 
          เอไอ ปัญญาประดิษฐ์ก็เหมือนเหรียญ 2 ด้าน มีทั้งคุณูปการและข้อจำกัดที่อาจสร้างปัญหาตามมาหลายอย่างได้ แต่สุดท้ายพวกเราคงหลีกเลี่ยงไม่ได้ ต้องอยู่เรียนรู้ไปด้วยกันและสนุกกับ “เอไอ” ให้ได้ครับ
 
 

Shares :
เปิดอ่าน 499 ครั้ง

ไม่พลาดข่าวสำคัญ แค่กดเป็นเพื่อนกัน ไลน์@komchadluek ที่นี่

5 อันดับข่าวฮิต
Recommended
ข่าวที่คุณอาจสนใจ