ขั้นตอนการทำโครงการ Big Data

Screenshot 2018-05-03 16.00.42

คำว่า Big Data กำลังเป็นศัพท์เทคนิคที่น่าสนใจในมุมของผู้บริหารองค์กรหลายๆแห่งทั้งภาครัฐและเอกชน ซึ่งนอกจากว่าผู้บริหารจำนวนหนึ่งจะมาใช้เป็นศัพท์ในการตลาดแล้วบางครั้งก็ทำให้ราวเหมือนกับว่ามันจะเป็นเทคโนโลยีวิเศษที่จะสร้างประโยชน์ให้กับองค์กรอย่างมากมาย

มีคนเคยบอกความหมายของคำว่า Big data ในเชิงคบขำไว้ว่า “Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, so everyone claims they are doing it... ”  (Prof. Dan Ariely ) คำพูดก็คล้ายกับที่ประเทศเราในตอนนี้ที่ทุกคนต่างก็พูดถึง Big Data บางทีข้อมูลเล็กนิดเดียวก็บอกว่าทำ Big Data บางครั้งก็สั่งงานให้ฝ่ายเทคโนโลยสารสนเทศไปเริ่มทำโครงการ Big Data ทั้งๆที่ Big Data น่าจะเริ่มจากกลยุทธ์ไม่ใช่เริ่มที่เทคโนโลยี แล้วบางคนก็บอกว่าทำโครงการ Big Data  เสร็จแล้ว

Untitled (1)

รูปที่ 1 ขั้นตอนการทำโครงการ Big Data

เมื่อวันก่อนผมมีโอกาสเขียนรูปภาพแสดงขั้นตอนง่ายๆให้เห็นว่าเราจะเริ่มทำโครงการ Big Data ได้อย่างไร  โดยมีขั้นตอนดังแสดงในรูปที่ 1

โครงการ  Big Data ต้องเริ่มต้นด้วยการทำกลยุทธ์ข้อมูล (Data strategy) ที่ผู้บริหารหน่วยงานต่างๆในองค์กรมากำหนดร่วมกัน ซึ่งกลยุทธ์ที่ดีไม่ได้ดูที่ว่ามีข้อมูลอะไรอยู่ในองค์กร แต่อยู่ที่ว่าธุรกิจมีเป้าหมายอะไร และข้อมูลใดที่จะช่วยให้บรรลุเป้าหมายนั้น

ซึ่งเมื่อได้กลยุทธ์แล้วเราจะเริ่มเข้าใจได้ว่าลักษณะข้อมูลที่ต้องการใช้เป็นอย่างไร ทั้งนี้ข้อมูลที่ต้องการจะนำมาใช้อาจแบ่งเป็นสองกลุ่มคือ

  • ข้อมูลที่มีอยู่ในปัจจุบันอยู่แล้ว แต่เราไม่เคยนำมาวิเคราะห์ ข้อมูลลักษณะนี้เราเรียกว่า Dark data ซึ่งก็อาจเป็นข้อมูลขนาดใหญ่ในองค์กร
  • ข้อมูลที่ยังไม่มี แต่คิดว่าน่าจะเป็นประโยชน์ ทั้งนี้อาจต้องไปหาข้อมูลเหล่านี้มาจากแหล่งอื่นๆเช่น พันธมิตร หรืออาจต้องซื้อข้อมูล บางครั้งอาจต้องหาเทคโนโลยีเช่น IoT เข้ามาช่วยในการเก็บซึ่งอาจต้องใช้เวลากว่าจะสะสมหรือหาข้อมูลได้

หากกลยุทธ์ต้องการข้อมูลกลุ่มหลังก็อาจต้องใช้เวลากว่าที่จะเริ่มทำโครงการได้ หรือบางครั้งเราอาจไม่มีข้อมูลเหล่านั้นเลยก็เป็นไปได้ ซึ่งสุดท้ายเราอาจจะต้องปรับกลยุทธ์ใหม่เพื่อให้ได้ข้อมูลที่มีอยู่แล้วเพื่อความรวดเร็วในการทำโครงการ

เมื่อเรามีข้อมูลที่เพียงพอคำถามถัดมาก็คือว่า ข้อมูลเหล่านั้นเป็นไปตามนิยามของ Big data ที่ว่า Volume, Variety, Velocity, Varacity จริงหรือไม่

  • ถ้าใช่ เราก็อาจต้องลงทุนโครงสร้างพื้นฐานด้าน Big data เช่นการจัดหา Data Lake อย่าง Hadoop หรือ Cloud storage
  • ถ้าไม่ใช่ บางครั้งโครงสร้างพื้นฐานที่มีอยู่อย่าง  ระบบ Database  ที่เป็น RDBMS ก็อาจเพียงพอและไม่จำเป็นจะต้องจัดหาระบบอย่าง  Data Lake

กรณีที่ข้อมูลที่ต้องการไม่ใช่ Big Data ก็คงต้องวิเคราะห์ต่อว่า จะมีการทำ Predictive Analytic โดยการใช้ Machine Learning หรือ เพราะถ้ามี ก็อาจจำเป็นต้องจัดหาเครื่องมือในการทำเรื่องนี้มาใช้ เพราะภาษา SQL ที่ใช้กับระบบ Database ไม่สามารถจะมาใช้ทำ Predictive Analytic ได้

แต่ถ้าข้อมูลไม่ใช่ Big data มีแค่จำนวนเป็นหลักสิบล้านและไม่ได้เข้าข่ายนิยามอะไรที่เป็น Big data แลัวก็ยังไม่มีการทำ Predictive Analytic  เน้นแต่การสอบถามข้อมูล (Data query) ทำ Dashboard เป็นโครงการทำ Data warehouse และ Business Intelligence แต่ผู้บริหารอยากเรียกว่า Big data เราก็คงต้องเข้าใจว่าเป็นอย่าง Prof. Dan Ariely ว่า ก็ยอมๆไปแล้วกันครับ เพราะผู้บริหารต้องการใช้คำว่า Big data ในการตลาด

สุดท้ายถ้าเรามีข้อมูลขนาดใหญ่และต้องการทำ Predictive analytics เราก็อาจใช้ทีม Data science ที่เข้าใจ Machine learning มาช่วยงาน และอาจต้องมีการแสดงผลผ่าน Data visualisation ซึ่งเราก็จะอาจจะได้ผลลัพธ์ตามกลยุทธ์ที่กำหนดไว้ในตอนต้น แต่โครงการทั้งหมดก็ต้องใช้เวลาในการทำงาน ตั้งแต่รวบรวมข้อมูล การทำโครงสร้างพื้นฐาน และการวิเคราะห์ข้อมูล ไม่มี Quick win ในการทำโครงการ  Big data ครับ

ธนชาติ นุ่มนนท์

IMC Institute

พฤษภาคม 2561