กรกฎาคม 2017

ผมเขียนบทความนี้ตอนที่ 1 ไว้นานมากแล้ว (Big Data เพื่อสร้าง Digital Disruption ในองค์กร (ตอนที่ 1)) เพิ่งมีเวลาเขียนตอนที่สองในวันนี้ ซึ่งในตอนนี้จะกล่าวถึงประเด็นที่ควรทำในเรื่องของการทำ Big Data ต่างๆดังนี้

Big Data คือหลักการของ Data Lake องค์กรที่คิดว่าจะนำ Big Data มาสร้างความเปลี่ยนแปลงองค์กร จำเป็นต้องรวบรวม Data ต่างๆที่มีอยู่ทั้งภายในและภายนอกในลักษณะข้อมูลดิบ (Raw Data) มาเก็บไว้ใน Data Lake เพื่อที่นำข้อมูลต่างๆมาใช้ในการวิเคราะห์และประมวลต่อไป กล่าวคือ Big Data จะเริ่มต้นด้วยการเก็บรวบรวมข้อมูลแล้วค่อยตั้งคำถามต่างๆในอนาคต
Big Data ไม่ใช่เริ่มด้วยการทำ Data Warehouse หรือการทำ Business Intelligence (BI) แบบเดิม แต่ Data Warehouse และ BI คือส่วนหนึ่งของ Big Data ทั้งนี้การทำ Data Warehouse จะคำนึงถึงการทำ Data Cleansing และการทำรายงานเป็นครั้งๆไป ซึ่งการทำ Data Cleansing และ Load Data เข้าสู่ Data Warehouse จะทำให้ Information หลายๆอย่างในข้อมูลดิบ จำนวนมากถูกลดทอนไปเพื่อทำรายงาน และเมื่อต้องการทำรายงานใหม่ๆ ก็อาจจะทำการ Load Data ชุดใหม่เข้ามาทำให้เสียเวลาในการทำงาน
องค์กรจะต้องมีการลงทุนโครงสร้างพื้นฐานสำหรับ Big Data ซึ่งควรจะเป็นการลงทุนด้าน Data Lake เช่นการจัดหา Hadoop มาใช้ในองค์กร ดังแสดงในรูปที่ 1 และไม่ควรที่จะต้องลงทุนไปกับ Data Warehouse ด้วยอุปกรณ์หรือซอฟต์แวร์ที่ราคาสูงเกินไป เพราะ Data Lake จะมีราคาที่ถูกกว่า และสามารถ Offload ข้อมูลจาก Data Warehouse ลงมาได้ ดังนั้นการทำ Big Data Project คือการเริ่มต้นจากการทำ Data Lake
องค์กรที่สามารถใช้ Public Cloud ได้ อาจพิจารณาการทำ Big Data โดยใช้ Big Data as a Service ที่อยู่บน Platform ต่างๆเช่น AWS, Google Cloud หรือ Microsoft Azure ซึ่งจะมีบริการอย่าง Cloud Storage หรือ Hadoop as a Service
คุณค่าของ Big Data ทีสำคัญเป็นเรื่องของการทำ Predictive Analytics ซึ่งต้องการทีมงานที่มีความรู้ทาง Data Science ที่มีความรู้และแนวคิดที่แตกต่างจากกลุ่มคนที่ทำ Data Warehouse และ BI องค์กรควรจะสร้างทีมขึ้นมาใหม่ที่มีความรู้ด้าน Data Science แยกออกมาจากกลุ่มคนเดิม ทีมงาน Data Science จำเป็นอย่างยิ่งที่ต้องมีคนที่เข้าใจธุรกิจขององค์กร ดังนั้นบางครั้งการสร้างทีมจากภายในจะเป็นเรื่องที่ดีกว่า โดยอาจผสมผสานกับคนใหม่ที่มาจากภายนอก ทั้งนี้การเลือกคนมาทำต้องเน้นคนที่มีความเข้าใจเรื่อง คณิตศาสตร์และสถิติ มากกว่าคนไอทีที่เน้นการพัฒนาโปรแกรม
องค์กรควรจะมีการพัฒนาบุคลากรในทุกระดับให้เข้าใจหลักการของ Big Data และประโยชน์ที่จะได้รับ ให้เข้าใจว่า Big Data จะมา Disrupt ธุรกิจอย่างไร
การทำ Big Data Analytics แต่ละเรื่องจำเป็นต้องใช้เวลาในการศึกษาข้อมูล หา Algorithm ที่เหมาะสม ผู้บริหารไม่ควรที่จะคาดหวังว่าจะได้ผลลัพธ์ภายในระยะเวลาอันสั้น ซึ่งแตกต่างจากการขอรายงานที่ได้จาก BI ที่พนักงานสามารถจะหารายงานได้รวดเร็วกว่ามาก
อย่าเริ่มต้นการทำ Big Data ด้วยการลงทุนขนาดใหญ่ และโครงการ Big Data ที่ดีไม่ควรเริ่มจากฝ่ายไอทีตามลำพัง

datalake21

รูปที่ 1 ตัวอย่างของ Data Lake Architecture โดยใช้ Hadoop

ทั้งหมดนี้คือข้อคิดสั้นๆที่ผมอยากแนะนำต่อ เพื่อให้องค์กรเริ่มทำโครงการ Big Data ในแนวทางที่เหมาะสม

ธนชาติ นุ่มนนท์

IMC Institute

กรกฎาคม 2560

เดือน: กรกฎาคม 2017

Big Data เพื่อสร้าง Digital Disruption ในองค์กร (ตอนที่ 2)