Tableau prep builder เครื่องมือจัดการข้อมูล (Cleansing Data) ก่อนทำ Analytics

ปัจจุบันเริ่มมีการใช้ข้อมูลจำนวนมหาศาลที่เกิดขึ้นในองค์กรธุรกิจมาวิเคราะห์เชิงลึกเพื่อได้ผลลัพธ์ที่น่าเชื่อถือและสร้างคุณค่าแก่องค์กรธุรกิจมากที่สุด จึงทำให้เครื่องมืออย่าง Tableau มีบทบาทในธุรกิจเพิ่มมากขึ้นเรื่อยๆ โดยส่วนใหญ่แล้วข้อมูลจะมีจำนวนมากและยังมีซับซ้อนอยู่ หากข้อมูลไม่ถูกจัดการให้ดี เราอาจจะไม่ได้ผลลัพธ์เท่าที่ควรจะเป็นและยังทำให้เสียเวลาในการกลับมาแก้ไขข้อมูลต้นฉบับ สำหรับ Tableau จึงได้มีการแบ่ง ซอฟแวร์เป็นทั้งหมด  3 ประเภท โดยแต่ละประเภทจะมีการใช้งานต่างกันออกไป เรามาดูกันว่ามีอะไรบ้าง

  1. Tableau Desktop เป็นตัวหลักในการสร้าง Visualization และการทำ Visual Analytics
  1. Tableau Server เป็นตัวกลางที่รวบรวมรายงานต่างๆ ที่ทำจาก Tableau Desktop ซึ่งการกำหนดสิทธิ์การเข้าถึงหน้ารายงานต่างๆ นั้น ต้องทำที่ Tableau Server
  1. Tableau Prep Builder เป็นเครื่องมือที่มาช่วยในเรื่องของ Data Preparation / Data Manipulation ซึ่งหากฐานข้อมูลที่เรานำมาทำ Data Analytics นั้นมีความซับซ้อน ไม่เป็นระเบียบก็สามารถใช้ Tableau Prep Builder มาช่วย Cleansing Data เพื่อให้ข้อมูลของเรามีคุณภาพ (Data Quality) พร้อมส่งต่อให้กับ Tableau Desktop สร้าง Visual Analytics

ในบทความนี้เราจะมาลงรายละเอียดเกี่ยวกับ Tableau Prep Builder ว่าการใช้งานนั้นสามารถนำไปใช้วางแผนการจัดการข้อมูลอย่างไรบ้าง

จากงานวิจัยจะพบว่ากว่า 80% ของเวลาทั้งหมดถูกใช้ในการเตรียมข้อมูลและอีก 20% คือเวลาที่ใช้วิเคราะห์ข้อมูล ซึ่งส่วนใหญ่การทำ Data Preparation จะนำข้อมูลจากหลายแหล่งข้อมูลมา เช่น ข้อมูลจากการผลิตสินค้า ข้อมูลทางบัญชี ข้อมูลทรัพยากรบุคคล เป็นต้น มาแปลงรูปแบบให้เหมาะสมกับสิ่งที่จะวิเคราะห์มุมมองทางธุรกิจและโหลดข้อมูลเก็บไว้ใน Data Warehouse เพื่อไปใช้งานต่อไป ซึ่งขั้นตอนเหล่านี้เรียกว่า ETL (Extract-Transform-Load) โดยหน้าที่หลักของกระบวนการ ETL ก็ต้องใช้ทักษะ ความรู้เชิงเทคนิคและใช้เวลาในการทำงานนาน เป็นสาเหตุให้การจัดเตรียมข้อมูลจึงใช้เวลานานที่สุดนั้นเอง

Tableau Prep จึงถูกออกแบบมาเพื่อ Business User สามารถจัดทำ Data Flow (ตามภาพด้านบน) ได้ด้วยตัวเอง สะดวกและรวดเร็วขึ้นอย่างมาก โดยเริ่มตั้งแต่การเลือกข้อมูลจากหลายแหล่งไม่ว่าจะเป็น Excel Files, SQL Database, SAP HANA เป็นต้น โหลดข้อมูลมาไว้ใน Tableau Prep Builder และนำข้อมูลจากหลายแหล่งมาทำรวมกัน (Blending Data) โดยมีฟีเจอร์ที่ทำให้เราสามารถทำงานได้ง่ายขึ้น ยกตัวอย่างเช่น

  • Correcting หรือการแก้ไขข้อมูลที่ผิดพลาด เช่นการกรอกคำผิด ข้อมูลที่ตกหล่นจาก human error
  • Standardizing ให้ข้อมูลออกมาในรูปแบบเดียวกัน เช่น การกรอกเดือน กย. ให้เป็น กันยายน เป็นต้น
  • Duplicate Elimination เพื่อจัดการกับข้อมูลที่ซ้ำซ้อน ไม่ว่าจะมีข้อมูลยุ่งเหยิงแค่ไหนก็สามารถจัดการได้ก่อนนำมาใช้งานจริง

หลังจากนั้นข้อมูลที่เราได้ก็จะเป็นข้อมูลที่มีคุณภาพสามารถวิเคราะห์มุมมองทางธุรกิจได้รวดเร็วขึ้น ซึ่ง Data Flow ที่เกิดขึ้นใน Tableau Prep สามารถ public ขึ้นไป Tableau Server เพื่อตั้งเวลา Execute Output ในรูปแบบตารางข้อมูลเก็บไว้ที่ Database ต่างๆ ได้ (Write-Back to Database) หรือจะทำเป็น dataset ของ Tableau เพื่อนำไปใช้ทำ Visualize ผ่าน Tableau Desktop ได้เช่นกัน

Tableau Prep Builder ถือว่าเป็นตัวช่วยสำคัญในการออกแบบข้อมูลจำนวนมหาศาลและซับซ้อน โดยที่ผู้ใช้ไม่จำเป็นต้องเขียนโปรแกรม ซึ่งเป็นซอฟแวร์ที่เข้ามาเสริมการใช้งาน Tableau ให้ครบถ้วนยิ่งขึ้น ที่สำคัญ Tableau Prep จะช่วยรวบรวมข้อมูลจากหลากหลายแหล่งเข้าด้วยกัน ไม่ว่าข้อมูลจะอยู่ในรูปแบบไหนก็ตาม และจัดรูปแบบข้อมูลได้ตามที่ต้องการอีกด้วย หากต้องใช้งาน Flow ที่ออกแบบไว้นั้น สามารถเรียกใช้งานได้ง่าย ข้อมูลทุกส่วนที่บันทึกไว้จะถูกนำมาใช้งานโดยอัตโนมัติ เมื่อจัดเตรียมข้อมูลเสร็จแล้วสามารถ Publish บน Tableau Server เพื่อนำมาจัดทำ Dashboard ต่อไปนั้นเอง

Author: Sithipat F.


แชร์ :
Scroll to Top