Challenges of Thai NLP with Thai Chatbot

หลายคนอาจจะสงสัยว่า NLP (Natural Language Processing) คืออะไร? และเป็น AI (artificial intelligence) หรือเปล่า?

“NLP” คือ ระบบประมวลผลจากภาษาที่มนุษย์ใช้ ให้เป็นภาษาที่เครื่องสามารถเข้าใจจุดประสงค์และเจตนาของการสื่อสารนั้นได้ และเป็นแขนงหนึ่งของ AI ในที่อยู่ในหมวดของการกระทำที่คล้ายมนุษย์ (Acting Humanly)

เมื่อเรารู้จัก NLP แล้ว ขอนำทุกคนเข้าสู่หัวข้อ “WHAT’S SPECIAL ABOUT THE THAI LANGUAGE?”

เพื่อให้ทุกคนได้เข้าใจความต่างของภาษาไทยกับภาษาอื่น ๆ เราจะมาเปรียบเทียบภาษาไทยกับภาษาที่ใช้กันในโลก ที่มีกว่า 7,000 ภาษา จะพบว่าภาษาในโลกที่มีระบบการเขียนเป็นของตัวเองนั้นมีน้อยกว่า 350 ภาษา และภาษาไทยก็เป็นหนึ่งในนั้น

เราขอรวบรวม ความโดดเด่น ของภาษาไทยมาอธิบายให้ทุกคนเข้าใจง่าย ๆ ดังนี้

1. Thai is an isolating language. (ภาษาคำโดด)

ภาษาไทยเป็นภาษาที่แยกได้ คือ สามารถแยกโดด ๆ เป็นคำ ๆ ออกไป ไม่มีการผันคำ จะคงรูปเดิมไม่เปลี่ยนแปลง ดังตัวอย่าง ประโยคของภาษาอังกฤษและภาษาไทยมาเปรียบเทียบกันแล้วจะเห็นจากได้จาก คำว่า

  • Needed to restart/ จำเป็นต้องเริ่มทำ
  • Drinking/ ดื่ม

จะไม่มีการผันรูป เหมือนภาษาอังกฤษ เช่น คำว่า Needed มาจาก Need, Drinking มาจาก Drink เมื่อสลับตำแหน่งของคำในประโยค ความหมายก็จะเปลี่ยนไป เช่น งูกินไก่ และ ไก่กินงู ก็จะได้คนละความหมายกัน!

เมื่อเราได้ลองหาข้อมูลเพิ่มเติมเกี่ยวกับภาษาคำโดดในโลก ก็จะพบว่าเพื่อนบ้านของเราก็เป็นภาษาคำโดดกันค่อนข้างเยอะ (จุดสีขาวในแผนที่)

แผนที่ (เครดิตจาก WALS) แสดงการกระจายตัวของภาษาคำโดด (จุดสีขาว) ซึ่งมีกระจุกตัวกันอยู่สูงบริเวณเอเชียตะวันออกเฉียงใต้

2. Thai does not have a grammatical tense.

ภาษาไทยไม่มีแกรมม่าเพื่อบอกเวลาจากคำกริยา เช่น

  • ภาษาอังกฤษ “needed” เติม ed เพื่อบอกเวลาว่าเหตุการณ์นั้นเป็นอดีตไปแล้ว
  • ภาษาไทย “จำเป็นต้อง” ไม่มีการผันคำหรือเติมอักษรเพื่อบอกเวลาของเหตุการณ์

3. Thai has lexical tones.

คำในภาษาไทยมีหลายโทนเสียงและเมื่อเปลี่ยนโทนเสียงความหมายก็จะเปลี่ยนไป ยกตัวอย่างเช่น

  • คาว ข่าว ข้าว ขาว
  • เข่า เข้า เค้า เขา

จากตัวอย่างจะเห็นว่ามีโทนเสียงที่ใกล้เคียงกัน แต่คนละความหมายกัน จะว่าไปก็ไม่ใช่แค่ภาษาไทย เช่น ภาษาจีนกลาง ก็เป็น lexical tones เหมือนกัน

4. Thai has an extensive set of modal particles.

ภาษาไทยเป็นภาษาที่สามารถใช้คำได้หลากหลายแบบ ยกตัวอย่างเช่น

  • บอสกำลังจะไปประชุมค่ะ
  • บอสกำลังจะไปประชุมล่ะ
  • บอสกำลังจะไปประชุมน่ะสิ
  • บอสกำลังจะไปประชุมนะ

ทุกประโยคข้างต้นมีความหมายเดียวคือ “บอสกำลังจะไปประชุม ” แต่การเขียนหรือการพูดของภาษาไทยสามารถเพิ่มเติมคำลงท้ายได้หลายแบบ หลากหลายโทนเสียง ถ้าเป็น ภาษาอังกฤษแค่พูดว่า “Boss is going to meeting” แบบเดียว จบเลย

ในบางครั้งเราเองก็ชอบติดนิสัยการพูดและเขียนแบบไทยคือจะต้องมีการลงเสียงที่ท้ายประโยค เช่นเวลาที่เราส่ง E-mail หาเพื่อนร่วมงานที่เป็นคนไทยด้วยกัน ก็จะชอบตามด้วยคำว่า Ka หรือ Kha ลงท้ายประโยค เพื่อให้ดูอ่อนน้อมและฟังดูนิ่มนวลมากขึ้น เช่น

  • Please let me know if you have any questions kha.
  • Dear Khun A and team ka.
  • Thank you for your cooperation ka.

5. Thai script has no word boundaries.

ภาษาไทยไม่มีการเว้นวรรคคำในประโยค เช่น

  • ปีนี้เดินตลาดยังไม่เห็นมะม่วงน้อยเลย
  • ตามรอยออเจ้ากับเมนูข้าวเหนียวมะม่วง

จากตัวอย่างจะไม่ได้แยกคำในประโยค ซึ่งจะต่างจากภาษาอังกฤษที่จะมีการเว้นวรรคคำ และมีจุด Full stop (.) ที่จุดสิ้นสุดของประโยค เช่น

  • Rome is the capital of Italy.
  • I born in Khon kaen and now live in Bangkok.

ทำให้เป็นเรื่องยากสำหรับการเรียนรู้ของเครื่องกับประโยคของภาษาไทย เพราะไม่รู้ว่าจุดสิ้นสุดประโยคอยู่ตรงที่ใด

ภาษาไทยอาจจะยาก แต่ทั้งหมดทั้งมวลทั้ง 5 ข้อนั้นก็ไม่ได้เป็นอุปสรรคที่ยิ่งใหญ่ที่สุดของ Thai NLP, อุปสรรคที่ยิ่งใหญ่ที่ทำให้ NLP ของภาษาไทยตอนนี้ ยังพัฒนาไปได้ไม่มากนักนั้น เป็นเพราะเรายังขาดทรัพยากร ไม่ว่าจะเป็นการขาดข้อมูลที่มีความหลากหลายและมีคุณภาพ, งบประมาณที่จะนำมาใช้ในสนับสนุนการพัฒนา Thai NLP อย่างต่อเนื่อง และหลายที่ยังขาดความรู้ที่จะนำมาใช้กับ Thai NLP ให้ได้ประสิทธิภาพมากขึ้น อาจจะต้องอาศัยความร่วมมือจากทุกภาคส่วนไม่ว่าจะเป็นองค์กรเอกชนและภาครัฐ ให้ร่วมมือกันมากขึ้น เพื่อให้คนไทยทุกคนมี Thai NLP ที่มีประสิทธิภาพ เป็นข้อมูลกลางที่ทุกคนสามารถนำมาใช้ร่วมกันได้


บริษัท ZyGen ได้เล็งเห็นถึงความสำคัญในการนำเทคโนโลยีมาช่วยให้ธุรกิจเติบโตยิ่งขึ้น จึงได้ทำการพัฒนา NICE Smart Assistance ผู้ช่วยอัจฉริยะที่จะช่วยให้การทำงานมีประสิทธิภาพมากยิ่งขึ้น และก้าวทันการเปลี่ยนแปลงในยุคที่มีการแข่งขันทางด้านดิจิตอล โดย NICE Smart Assistance สามารถติดต่อกับ Back end ของบริษัทได้ เป็น Hero ที่จะเชื่อมโยงข้อมูลต่างๆจาก Source data ที่หลากหลายในองค์กร ทำให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้จากที่เดียว การทำงานไม่ซับซ้อน สะดวก รวดเร็ว ตัดสินใจทางธุรกิจได้ทันท่วงที เพิ่มโอกาสในการขายมากยิ่งขึ้น

ตัวอย่างการใช้งาน NICE SMART ASSISTANCE

การแจ้งเตือนเอกสารที่รอการ Approve พร้อมทั้งยังสามารถทำการ Approve ผ่านทาง Chat application ได้ทันที

ทั้งนี้ทาง ZyGen ได้ร่วมกับบริษัทในเครือ Humanize Co,. Ltd. พัฒนา API NLP ของตนเอง ซึ่งมีความโดดเด่นในการเรียนรู้ภาษาไทยและภาษาอังกฤษได้อย่างแม่นยำ เนื่องจากเราได้ศึกษาโครงสร้างของภาษา, มีความคุ้นชินกับภาษาไทย อีกทั้งยังมีผู้เชี่ยวชาญทางด้านเทคโนโลยี AI and Chatbot ที่พัฒนา Algorithm และกระบวนการเรียนรู้ให้เหมาะสมกับภาษาไทยที่สุดอีกด้วย

NICE ยังสามารถเชื่อมต่อกับระบบ SAP และ Legacy อื่น ๆ ได้ ทังนี้เรามุ่งเน้นที่จะพัฒนาให้ NICE เป็นผู้ช่วยอัฉริยะ และเป็น Thai Chatbot ที่จะมาช่วยเพิ่มประสิทธิภาพในการทำงาน ที่สามารถทำงานได้ตลอดทั้ง 24*7 ชม. สามารถรองรับทุกอุปกรณ์และสามารถใช้งานได้ทุกเมื่อทุกเวลาที่ต้องการ สนใจข้อมูลเพิ่มเติมเกี่ยวกับ NICE Smart Assistant สามารถติดต่อเพื่อสอบถามข้อมูลเพิ่มเติมได้ เรายินดีที่จะให้คำปรึกษาในการที่จะผสานระหว่างเทคโนโลยี AI และธุรกิจเข้าด้วยกัน เพิ่อเพิ่มประสิทธิภาพและลดขีดจำกัดในการทำงาน ในทุกธุรกิจ

Author : Parichat Pinidmontree (SAP Functional Consultant)

Reference:


แชร์ :
Scroll to Top