ครั้งก่อนผมเขียนบทความเรื่อง AI คือหัวใจสำคัญของการทำ Digital Transform และข้อมูลคือองค์ประกอบหลักของ AI พร้อมทิ้งท้ายไว้ว่าจะเขียนเพิ่มเติมในตอนถัดไปว่าเราจะเอาข้อมูลมาจากไหน ซึ่งถ้าเราจะพิจารณาถึงนิยามของ Big Data ว่ามี 4 V คือ Volume, Variety, Velocity และ Veracity ประกอบกับพิจารณาการเปลี่ยนแปลงของสรรพสิ่งต่างๆที่จะต้องมีการเคลื่อนไหวตลอดเวลา การเคลื่อนที่ การงาน การศึกษา สุขภาพ หรือ การทำธุรกรรม แลัวเราจะเห็นได้ว่า Big Data ถ้ามีเพียงแต่ข้อมูลขนาดใหญ่ (Volume) ก็อาจจะไม่เพียงพอต่อการวิเคราะห์พฤติกรรมหรือเข้าใจในสถานการณ์ปัจจุบัน เพราะองค์ประกอบที่สำคัญสุดประการหนึ่งของ Big Data กลับกลายเป็นเรื่องของ Velocity ที่เราจะต้องมีข้อมูลที่เข้ามาอย่างต่อเนื่อง ตัวอย่างเช่นเราต้องมีข้อมูลที่เข้ามาอย่าต่อเนื่องเพื่อทราบ
- การใช้ชีวิตประจำวันเช่น การเดินทาง ที่อยู่ การเข้าพักที่ต่างๆ
- สุขภาพเช่น การออกกำลัง ผลการตรวจการสุขภาพ การรับประทานอาหาร
- ความคิดเห็นของผู้คนเช่น การโพสต์ใน Social Media การค้นหาข้อมูลออนไลน์ การอ่านหนังสือ
- ฐานะการเงิน เช่น การทำธุรกรรมธนาคาร รายรับ การจับจ่ายใช้สอย
- อื่นๆ
ซึ่งหากเราจะพิจารณาเทคโนโลยีที่จะได้มาซึ่งองค์ประกอบด้าน Velocity ของ Big Data เราอาจเห็นอยู่สี่ประเภทคือ
- Social media ก็คือการที่ผู้คนเข้าไปโพสต์ข้อมูลต่างๆ เข้าไปค้นหาข้อมูล หรือสื่อสารกันออนไลน์
- Mobile ก็คือการที่ผู้คนเข้าไปใช้โทรศัพท์เคลื่อนที่ และมีการส่งข้อมูลมายังผู้ให้บริการ (Telecom operator) อย่างต่อเนื่อง
- Internet of things คือการที่สรรพสิ่งต่างๆเชื่อมต่ออยู่กับระบบอินเตอร์เน็ต และมีการส่งข้อมูลเข้ามายัง IoT Platform อย่างอัตโนมัติ เช่น wearable device หรือ smart device sensor
- Transaction คือข้อมูลที่มีการทำธุรกรรมแล้วถูกบันทึกในรูปดิจิทัล เช่นข้อมูลจาก Point of Sales (POS) ของร้านค้า, ข้อมูล CRM, ข้อมูล ERP หรือข้อมูลธุรกรรมการเงินที่มีการบันทึกอย่างต่อเนื่อง
รูปที่ 1 ข้อมูลทีมีองค์ประกอบ Velocity สำหรับการสร้าง Big Data
ความท้าทายอีกอย่างหนึ่งของการใช้ข้อมูลเหล่านี้ในการทำ AI คือ จะต้องมีข้อมูลขนาดใหญ่ที่มีปริมาณที่มากพอ ในการที่จะวิเคราะห์เพื่อทำให้เกิดความเข้าใจในเรื่องต่างๆได้ ซึ่งข้อมูขนาดใหญ่เหล่านี้ที่ถ้ามีปริมาณเข้ามาเป็นหมื่น แสน หรือล้านชุดต่อวัน ก็จะมีความแม่นยำขึ้น ซึ่งก็จำเป็นต้องมีเทคโนโลยีที่สามารถเก็บข้อมูลในราคาถูกและวิเคราะห์ข้อมูลขนาดใหญ่ได้ ซึ่งคงจะไม่ข้อกล่าวเรื่องของเทคโนโลยีในที่นี้ แต่สิ่งหนึ่งที่น่าสนใจก็คือ การที่มีข้อมูลมากขึ้น นอกจากจะมีความแม่นยำของ AI ดีขึ้น ก็จะทำให้เราเข้าใจลูกค้าดีขึ้นกำหนดกลยุทธ์ได้ดีขึ้น รายได้ก็จะมากขึ้นตาม ดังรูปที่ 2 มันจึงเป็นที่มาของคำว่า Data is the new oil
รูปที่ 2 วัฎจักรของข้อมูล AI และรายได้ [จาก AI Frontiers : The Era of Artificial Intelligence, Kai-Fu Lee]
คำถามที่น่าสนใจต่อไปคือแล้วหน่วยงานใดละมีข้อมูลขนาดใหญ่ เวลาผมถามคำถามนี้หลายๆคนมักจะตอบผมว่า กรมการปกครองเพราะคิดถึงข้อมูลของประชากร แต่ถ้าเรามาวิเคราะห์ด้าน Velocity แล้วจะพบว่าข้อมูลนั้นค่อนข้างนิ่งและไม่มี Velocity จึงอาจไม่ทราบข้อมูลที่แท้จริงว่า บุคคลนั้นที่อยู่ปัจจุบันอยู่ไหน ทำอาชีพอะไร เพื่อให้เห็นโอกาสว่าอุตสาหกรรมใดมีโอกาสที่จะใช้ Big Data ที่มี Velocity ผมขอลองลงรายละเอียดรายอุตสากรรมดังนี้
- บริษัทด้านอินเตอร์เน็ตขนาดใหญ่ อย่าง Facebook, Google, Instagram, Twitter บริษัทเหล่านี้มีข้อมูลที่มี Velocity จำนวนมหาศาลที่ถูกป้อนเข้ามาอย่างต่อเนื่องตลอดเวลาโดยผู้ใช้ แต่ข้อมูลเหล่านี้ส่วนใหญ่เป็นของบริษัทต่างชาติ
- บริษัทผู้ให้บริการโทรศัพท์เคลื่อนที่ อย่าง AIS, DTAC หรือ True น่าจะจะเป็นกลุ่มอุตสาหกรรมที่มีข้อมูลใหญ่ที่สุดในประเทศไทย ซึ่งมีข้อมูลจากการใช้งานของลูกค้า 30-40 ล้านคนต่อบริษัทโดยเป็นข้อมูล CDR (Call Detail Record) หลายหมื่นล้านเรคคอร์ดหรือหลาย Terabyte ต่อวัน ยังไม่รวมถึงข้อมูล Billing หรือ CRM จุดเด่นของอุตสาหกรรมนี้คือมีข้อมูลตำแหน่งของลูกค้า และพฤติกรรมการใช้โทรศัพท์ของลูกค้า
- อุตสาหกรรมค้าปลีก เช่น 7-11 จะมีข้อมูลขนาดใหญ่ที่มีการจากการซื้อสินค้า จะเห็นพฤติกรรมของผู้บริโภค เข้าใจลักษณะสินค้าที่ขาย แต่บางครั้งอาจไม่ทราบว่าลูกค้าคือใคร เว้นแต่จะมีบัตรสมาชิกและเก็บช้อมูลสมาชิกอย่าง Starbucks ที่สามารถทราบว่าลูกค้าแต่ละรายไปทานอะไร สาขาไหน เวลาไหน และถ้าอุตสาหกรรมทำ E-commerce ก็ทราบ Log การเข้าใช้งานของลูกค้า เช่นการเข้ามาดูเว็บ การกดเข้าดูสินค้า ทำให้เข้าใจผู้บริโภคได้มากขึ้น
- กลุ่มการเงินการธนาคาร จะมีข้อมูลธุรกรรมการเงิน ข้อมูลการเงินของลูกค้า แต่ลูกค้าทั่วไปอาจไปทำธุรกรรมที่ไม่บ่อยนัก อาจเป็นรายการขนาดใหญ่ แต่การเข้ามาของ Mobile/Internet Banking และe-Payment ก็จะทำให้ธนาคารมีปริมาณธุรกรรมของลูกค้ามากขึ้น มี Log การเข้ามาใช้ของลูกค้า
- กลุ่มธุรกิจประกันภัย กลุ่มเหล่านี้จะไม่ได้มีข้อมูลของลูกค้าแต่ละรายที่เข้ามาต่อเนื่องมากนัก เพราะลูกค้าจะมาทำธุรกรรมไม่กี่ครั้งต่อปี ดังนั้นจุดเปลี่ยนของธุรกิจนี้อยู่ที่การใช้ IoT เข้ามาเพื่อให้ได้ข้อมูลของลูกค้ามากขึ้นเช่นการใช้ wearable device, Telematic หรือ smart home sensor
- อุตสาหกรรมการท่องเที่ยว กลุ่มนี้จะมีธุรกรรมค่อนข้างมากเช่น การเดินทาง การจองที่พัก เพียงแต่ข้อมูลในแต่ละรายอาจไม่มากนัก ยกเว้นเป็นบริษัทขนาดใหญ่เช่น สายการบิน หรือหน่วยงานอย่าง การท่าอากาศยาน
- โรงพยาบาลและสาธารณสุข จะเป็นหน่วยงานที่มีขนาดใหญ่ และจำนวนธุรกรรมค่อนข้างมาก และมีข้อมูลหลากหลายทั้งใน รูปแบบของรูปภาพ บันทึกทางการแพทย์ แต่ปัญหาโดยมากคือขาดการจัดเก็บข้อมูลที่เป็นระบบ และข้อมูลมีขนาดใหญ่มากยากต่อการเก็บและวิเคราะห์
- กลุ่มสื่อและธุรกิจบันเทิง จะเป็นอุตสาหกรรมที่มีข้อมูลที่เป็นเนื้อหา (content) แต่อาจขาดข้อมูลที่ทราบถึงการบริโภคของลูกค้าโดยตรง ยกเว้นทำเป็นสื่อออนไลน์เช่น เว็บข่าวที่อาจเห็น Log ของลูกค้า หรือ Streaming TV อย่าง NetFlix หรือ AIS Play ที่จะทราบได้ว่าลูกค้าเข้ามาดูรายการใดอย่างไร
- กลุ่มภาคการศึกษา จะมีข้อมูลที่ค่อนข้างน้อยเว้นแต่จะปรับเป็นเนื้อหาออนไลน์ ที่อาจทำให้เข้าใจพฤติกรรมของผู้เรียน มีตะแนนการวัดผลที่เก็บไว้ จะทำให้วัดผลมีประสิทธิภาพมากขึ้น
- กลุ่มสาธารณูปโภค เช่น การไฟฟ้า การประปา กลุ่มเหล่านี้ก็อาจมีข้อมูลการใช้จากมิเตอร์ต่างๆ
- หน่วยงานภาครัฐ โดยมากข้อมูลจะขาด Velocity ทำให้ไม่มีข้อมูลที่ดีพอในการนำวิเคราะห์รายคน แต่ก็มีหน่วยงานอย่างของกระทรวงการคลังที่อาจมีปริมาณธุรกรรมเยอะเช่น กรมสรรพากร กรมศุลกากร หรือหน่วยงานอย่าง กรมการกงศุล หรือประกันสังคม ที่อาจมีข้อมูลเข้ามาต่อเนื่องเยอะ แต่ปัญหาที่มักพบคือข้อมูลเหล่านี้มักไม่ถูกจัดเก็บในรูปแบบที่ไปวิเคราะห์ Big Data ได้ และขาดการเชื่อมโยงข้อมูลกับหน่วยงานรัฐด้วยกัน
จากที่กล่าวมาทั้งหมด จะเห็นได้ว่า Big Data เป็นเรื่องสำคัญถ้าเราอยากจะทำ Digital transform หน่วยงานอาจต้องพิจารณาว่าจะทำอย่างไรให้ได้มาซึ่ง Big Data ที่มี Velocity จำเป็นจะต้องใช้เทคโนโลยีใดเข้าช่วย หรือเวลาเรามีข้อมูลอยู่แล้วแต่ไม่สามารถจัดเก็บได้ ดังนั้นองค์กรจึงจำเป็นต้องมีกลยุทธ์ด้านข้อมูลเพื่อผลสำเร็จของการทำ Digital transform
ธนชาติ นุ่มนนท์
IMC Institute