ผมเคยเข้าไปหลายหน่วยงานที่มีความต้องการทำ Big Data Analytics แต่พอไปถามหาข้อมูลที่มีอยู่และจะให้หน่วยงานย่อยต่างๆรวบรวมมาก็มักจะมองเรื่องข้อมูลสรุป (Summary data) แต่หน่วยงานกลับคาดหวังว่าจะนำข้อมูลสรุปเหล่านี้มาวิเคราะห์ข้อมูลต่างๆเช่นพฤติกรรมลูกค้าหรือทำความเข้าใจกับปัญหาต่างๆอย่างละเอียด ซึ่งผมก็มักจะตอบไปว่าทำได้ยาก
การจะทำ Big Data Analytics ที่ดีได้ต้องมีข้อมูลที่เป็นรายละเอียดย่อยมากที่สุดเท่าที่ทำได้ อาทิเช่น Transactional data ที่อาจมองถึงการทำธุรกรรมทุกรายการ เพื่อให้เห็นภาพที่ชัดเจนขึ้น ผมขอเปรียบเทียบรูปที่ 1 ซึ่งเป็นข้อมูลสรุปที่บอกถึงการใช้บัตร Startbucks ของลูกค้ารายหนึ่ง กับข้อมูลที่เป็น Transaction ของลูกค้ารายเดียวกันในรูปที่ 2 จากข้อมูลสรุปของลูกค้าเราอาจเห็นเพียงว่าลูกค้ามีบัตรสามใบและเป็นลูกค้าบัตรทองที่มีวงเงินอยู่ 1,871.25 บาท แต่ถ้าจะถามและวิเคราะห์ข้อมูลต่างๆอาทิเช่น
- ลูกค้ามาทาน Starbucks บ่อยแค่ไหน?
- ลูกค้าจะมาร้านเวลาไหน และคาดการณ์ว่าเขาจะมาอีกเมื่อไร?
- ลูกค้ามาทานกาแฟปกติคนเดียวหรือหลายคน?
ข้อมูลต่างๆเหล่านี้ ที่เราต้องการทำ Big Data Analytics ในลักษณะการคาดการณ์จะไม่สามารถที่จะหามาได้จากการใช้ Summary data แต่ถ้าเรามีข้อมูลรายละเอียดอย่าง Transaction data ในรูปที่ 2 เราจะเห็นได้ว่าเราอาจพอคาดการณ์ได้ว่า ลูกค้ารายนี้มักจะมาทานกาแฟตอนเช้าและอาจมาคนเดียวโดยดูจากเวลาที่มาและอาจดูยอดเงินที่ใช้จ่าย และหาก Transaction data มีรายละเอียดมากกว่านี้เช่น รายการอาหารที่สั่ง หรือสาขาที่ไปทาน เราก็จะยิ่งสามารถวิเคราะห์ข้อมูลได้ละเอียดยิ่งขึ้น
รูปที่ 1 Summary data บัตร Starbucks ของลูกค้ารายหนึ่ง
รูปที่ 2 Transactional data ของลูกค้ารายเดียวกัน
ดังนั้นหลักการสำคัญของ Big Data Analytics ก็คือการที่เราสามารถเก็บข้อมูล Transactional data ให้มากที่สุดและมีรายละเอียดมากที่สุดเท่าที่ทำได้ ผมมักจะถามคนเสมอว่าหน่วยงานในประเทศหน่วยงานมีข้อมูลที่มีขนาดใหญ่และเหมาะกับการทำ Big Data อย่างมาก หลายครั้งผมมักจะได้ยินคำตอบว่าเป็นข้อมูลของกรมการปกครองที่เก็บข้อมูลประชาชน ซึ่งโดยแท้จริงแล้วกรมฯจะมีเพียงข้อมูลสรุปและข้อมูลเคลื่อนไหวในลักษณะ Transactional data จะมีน้อยมาก (จึงไม่แปลกใจที่บางครั้งที่อยู่ในบัตรก็ยังไม่ถูกต้องเมื่อเทียบกับที่อยู่จริงๆ) แต่จริงๆหน่วยงานที่มีข้อมูลเยอะจริงๆในประเทศไทยคือกลุ่ม Telecom ที่ให้บริการโทรศัพท์เคลื่อนที่ ซึ่งจะมีข้อมูลการใช้มือถือตลอดเวลาที่ป้อนเข้ามาอย่างเช่น CDR ที่มีปริมาณข้อมูลต่อวันเป็นหมื่นหรือแสนล้านเรคอร์ด ด้วยข้อมูลมหาศาลขนาดนี้ก็ทำให้ผู้ให้บริการมือถือสามารถวิเคราะห์ข้อมูลลูกค้าได้เป็นอย่างดี เพราะทราบตำแหน่ง รูปแบบการใช้งาน เวลาในการโทร โทรศัพท์ที่ใช้ ค่าใช้จ่ายต่างๆ
นอกเหนือจากกลุ่มผู้ให้บริการโทรศัพท์เคลื่อนที่แล้วธุรกิจกลุ่มไหนอีกละที่มีข้อมูลขนาดใหญ่ในลักษณะ Transactional data
- ธนาคารจะมีข้อมูล Transaction จากการที่ลูกค้ามาทำธุรกรรมที่สาขา, Intenet banking หรือ mobile banking และหากมีข้อมูลจาก QR payment ในอนาคตก็จะมีข้อมูลลูกค้าละเอียดยิ่งขึ้น
- หลักทรัพย์ก็จะมีธุรกรรมการซื้อขายแต่ละรายการอย่างละเอียด ทำให้ทราบว่าใครซื้อขาย หุ้นตัวไหน เวลาใด
- ค้าปลีกจะมีข้อมูลรายการซื้อ ขายและสั่งสินค้ามาอย่างละเอียด และถ้าสามารถเก็บข้อมูลลูกค้าได้ ก็จะยิ่งทำให้เข้าใจได้ว่าลูกค้าคือใคร ยิ่งมีจำนวนธุรกรรมมากขึ้นเท่าไรก็ยิ่งสามารถวิเคราะห์ได้ละเอียดยิ่งขึ้น
- โรงพยายบาลก็จะมีข้อมูลการเข้ามาตรวจรักษาของลูกค้า การสั่งยา
- Smart home จะมีข้อมูล Log การใช้งานอุปกรณ์ต่างๆ
จากที่กล่าวมาทั้งหมดนี้จะเห็นได้ว่าถ้าเราจะทำ Big Data Analytics ได้ดีเราต้องพยายามหา Transactional data มาเก็บให้มากที่สุด อาทิเช่น
- หากภาครัฐมีข้อมูลรายละเอียดการจ่ายภาษี VAT ของผู้เสียภาษีแบบปลีกย่อยมาที่สุดลงเป็นรายการ รายวัน หรือมีข้อมูลรายรับของประชาชนเป็นรายการย่อยมากที่สุดก็จะทำให้วิเคราะห์และประมาณการภาษีได้อย่างถูกต้อง
- หากเราต้องการทราบข้อมูลคนจนที่ลงทะเบียนผู้มีรายได้น้อยของภาครัฐ เราอาจต้องเก็บข้อมูลการใช้บัตรคนจนตามร้านธงฟ้าหรือบริการต่างๆของภาครัฐเป็นรายการย่อยๆทั้งหมด เราก็อาจวิเคราะห์พฤติกรรมและตอบได้ว่าคนเหล่านี้จนจริงหรือไม่
- หากกระทรวงสาธารณสุขมีข้อมูลรายละเอียดการใช้บริการการแพทย์ของประชาขน อย่างละเอียดมากที่สุด เราก็จะสามารถบริหารงานด้านสาธารณสุขให้มีประสิทธิภาพได้ดียิ่งขึ้น
ดังนั้นการเริ่มทำ Big Data จำเป็นต้องคำนึงถึง Transactional data ที่มีในองค์กรและต้องเอามาเก็บให้ได้เสียก่อน ถึงจะทำการวิเคราะห์ข้อมูลได้อย่างถูกต้อง ไม่ใช่เป็นการเล่นกับ Summary data โดยเราอาจต้องตั้งคำถามว่าเรามีข้อมูลลูกค้าแต่ละรายหรือข้อมูลสินค้าแต่ละรายการมากพอที่จะมาทำการวิเคราะห์หรือไม่ ถ้ามีข้อมูลลูกค้าเพื่อเดือนละรายการมันเพียงพอไหม หรือควรจะต้องเห็นทุกวัน หรือต้องเห็นทุกชั่วโมง หรือบางอย่างอาจมีข้อมูลทุกนาที ขึ้นอยู่กับธุรกิจและลักษณะงานแล้วเราถึงจะวิเคราะห์ข้อมูลได้
ธนชาติ นุ่มนนท์
IMC Institute
มกราคม 2561