Big Data เป็นเทคโนโลยีที่ถูกกล่าวขานกันมากที่สุดในช่วง 1-2 ปีนี้ Big Data ไม่ใช่เรื่องที่พูดกันเฉพาะวงการไอทีแต่มีการพูดถึงกันมากในทุกภาคส่วนอุตสาหกรรมทั้งด้านการตลาด ภาคการค้าขาย ภาคสาธารณสุข วงการวิทยาศาสตร์ ภาครัฐบาล หรือแม้แต่ภาคการเงินการธนาคาร หลายๆคนกล่าวกันการเข้ามาของ Big Data จะทำให้เรามีข้อมูลที่ดีขึ้น สามารถคาดการณ์ข้อมูลแม่นยำยิ่งขึ้น และเมื่อเห็นโลกของ Social Network ที่โตขึ้นอย่างรวดเร็ว หลายคนก็คิดว่าน่าจะเป็นโอกาสที่ดีของ Big Data บางคนพยายามจะบอกว่า Big Data ของประเทศไทยกำลังจะโตขึ้นมากจะมีการใช้กันมากมายเพราะเรามีการใช้อินเตอร์เน็ตแบะ Social Media มากขึ้น และบ้างก็เข้าใจว่าบ้านเราพร้อมและอยู่แนวหน้าทางด้าน Big Data ในฐานะที่ผมอยู่ในภาคอุตสาหกรรมและเกี่ยวข้องการภาคการศึกษาโดยตรงในการพัฒนาบุคลากร และได้เริ่มสนใจเรื่อง Big Data อย่างจริงจังในช่วงสองปีที่ผ่านมา อาจเห็นแย้งในเรื่องนี้ จึงขอให้เหตุผลประกอบว่าทำไมบ้านเรายังต้องพัฒนาเรื่อง Big Data อีกมากก่อนจะพร้อมที่แข่งขันกับที่อื่นๆได้ดังนี้

การขาดความเข้าใจเรื่อง Big Data

คนจำนวนมากยังไม่เข้าใจว่า Big Data คืออะไร หลายๆคนก็ไปแปลตรงๆว่าคือข้อมูลใหญ่ซึ่งส่วนหนึ่งก็ไม่ผิดอะไร ผมเคยเขียนบทความหลายๆครั้งแล้วเรื่องความหมายของ Big Data จึงไม่อยากกล่าวซ้ำอีก แต่สิ่งสำคัญคือ Big Data คือการมองอนาคตที่จะเปลี่ยนแปลงรูปแบบของการจัดการข้อมูล แผนกไอทีจะต้องพร้อมที่จะบริหารจัดการกับข้อมูลแบบผสม (Hybrid Data) ที่จะมีทั้ง structure data และ unstructure data รวมถึงความสามารถในการที่นำ Dark Data ซึ่งเป็นข้อมูลที่เราเก็บไว้แต่ไม่เคยนำมาใช้ประโยชน์ มาสร้างประโยชน์ให้กับหน่วยงาน นอกจากนี้บางครั้งเรายังไม่เข้าใจถึงประโยชน์ของ Big Data ที่ได้จากการทำ Predictive Analytics ซึ่งมันแตกต่างกับการทำ Business Intelligence ที่เราเคยทำกัน และการทำ Big Data Analytics ต้องการบุคลากรที่เป็น Data Scientist ไม่ใช่เฉพาะ Programmer หรือ Business Analytist  ความเข้าใจคาดเคลื่อนเกี่ยวกับ Big Data ทำให้องค์กรขาดการเตรียมพร้อมเกี่ยวกับเรื่องนี้ และเข้าใจผิดคิดว่าโครงสร้างข้อมูลในปัจจุบันรองรับแล้ว ขาดการเตรียมพร้อมด้านบุคลากรทั้งทางด้านไอทีและนักวิเคราะห์ข้อมูล

ขาดข้อมูลขนาดใหญ่

ข้อมูลส่วนใหญ่ในบ้านเรายังเป็นข้อมูลแบบปิดยังไม่มีการทำ Open Data กันมากเท่าไร และข้อมูลที่มีอยู่ส่วนมากก็เป็นเพียง structure data ขนาดที่แนวโน้มของ Big Data ระบุว่าข้อมูลเกือบ 80% จะเป็น unstructure data ขณะที่ข้อมูลที่เก็บอยู่ในบ้านเราจะมีเพียงเล็กน้อย หน่วยงานที่จะมีข้อมูลมากกว่า 10 TB ก็หาค่อนข้างยาก หน่วยงานที่มีข้อมูลมากๆก็จะเป็นข้อมูล Transaction ของลูกค้าเช่น CDR ของบริษัทด้าน Telecom เรายังไม่มีผู้ให้บริการที่ให้ข้อมูล unstructure เช่น Web Crawler, Social Network ที่ให้เราดึงข้อมูลขนาดใหญ่มาวิเคราะห์ได้ แต่การจะใช้ประโยชน์จาก Big Data ได้อย่างเต็มที่ส่วนหนึ่งก็คือการต้องนำข้อมูลภายนอกองค์กร (External Data) เหล่านี้มาช่วยในการวิเคราะห์ คาดการณ์ต่างๆ เราจะเห็นได้ว่าเราสามารถไปดึงข้อมูลจากต่างประเทศที่เป็น unstructure หรือ semi-structure ขนาดใหญ่เช่น ข้อมูล Twitter หรือข้อมูลจากYelp มาได้ หรือแม้แต่ข้อมูลจาก Web Crawler ที่มีขนาดมากกว่า 500 TB ก็ยังมีให้บริการ ขณะที่บ้านเราไม่มีบริการข้อมูลเหล่านี้ การทำ Big Data ให้ได้ประโยชน์อย่างเต็มที่ ต้องมีข้อมูลขนาดใหญ่ๆที่ว่าแต่บ้านเรายังขาดอยู่ คงต้องใช้เวลาอีกหลายปีจึงจะได้ข้อมูลที่ดีขึ้น

ขาดบุคลากรด้าน Big Data

ปัญหานี้ถ้าพูดไปเป็นเป็นคลาสสิคในวงการไอที ไม่ว่าเทคโนโลยีใหม่อะไรเข้ามาบ้านเรามักจะขาดคนไม่ว่าจะเป็นด้าน Mobile Developer, Cloud Computing Expert หรือ Enterprise Architect แต่ปัญหาการขาดบุคลากรด้าน Big Data เป็นปัญหาทั่วโลก เพราะสำนักวิจัย Gartner คาดการณ์ว่าจะมีความต้องการบุคลากรด้านนี้ทั่วโลกถึง 4.4 ล้านตำแหน่งในปี 2015 และเป็นตำแหน่งงานทึ่สหรัฐอเมริกาถึง 1.9 ล้านตำแหน่ง แต่ปรากฎว่าจะมีเพียง 1/3 เท่านั้นที่หาบุคลากีที่มีทักษะตรงกับที่ต้องการได้ งานทางด้าน Big Data หนึ่งตำแหน่งจะสร้างงานตำแหน่งอื่นๆนอกกลุ่มไอทีได้ถึงสามตำแหน่ง การขาดแคลนบุคลากรทางด้านนี้ทำให้หน่วยงานต้องเร่งพัฒนาบุคลากรและหาวิธีการดึงดูดบุคลากรเข้ามาในหน่วยงาน เทคโนโลยี Big Data ต้องการบุคลากรที่มีทักษะใหม่ๆในการบริหารจัดการข้อมูลที่กำลังเปลี่ยนแปลง ต้องรู้ถึงการใช้เทคโนโลยีใหม่ๆ และต้องการบุคลากรที่มีความสามารถในการวิเคราะห์ข้อมูลและคาดการณ์เรื่องต่างๆได้ ซึ่งบ้านเรายังขาดบุคลากรเหล่านี้อีกมาก

ขาดเทคโนโลยีสำหรับโครงสร้างข้อมูลแบบใหม่

การเข้ามาของ Big Data ทำให้หน่วยงานจะต้องลงทุนโครงสร้างพื้นฐานด้านข้อมูลเพิ่มเติม ฐานข้อมูลแบบ RDBMS เดิมไม่สามารถจะรองรับ unstructure data ได้ ทาง Gartner เองก็ระบุว่า 75% ของ Data Warehouse ในปัจจุบันจะไม่สามารถรองรับข้อมูลในเรื่องของ Velocity และ Variety ได้ การเข้ามาของ unstructure data ขนาดใหญ่ทำให้หน่วยงานต้องนำเทคโนโลยีใหม่อย่าง Hadoop หรือ No SQL เข้ามาใช้ โดย Hadoop ก็เป็นหนึ่งในเทคโนโลยีที่น่าสนใจที่สุดสำหรับเก็บข้อมูลหลายร้อย TB ซึ่งจากการสำรวจองค์กร 86% ทั่วโลกก็ยังไม่สามารถบริหารจัดการข้อมูลได้อย่างเหมาะสม นอกจากนี้องค์กรก็อาจต้องลงทุนทางด้าน BI & Analytics Tool เพื่อจะได้ประโยชน์จากการใช้ข้อมูลต่างๆทั้งแบบ Structure และ unstructure ที่อยู่ภายในและภายนอกองค์กร  ซึ่งในปัจจุบันมีหน่วยงานเพียง 13% ที่มีเครื่องมือแบะสามารถทำ Predictive Analytics ได้

จากที่กล่าวมาทั้งหมดนี้ จะเห็นว่าการประยุกต์ใช้ Big Data เป็นเรื่องที่ยากและซับซ้อนกว่าที่เราคิด และเป็นเรื่องที่ท้าทายสำหรับองค์กรต่างๆทั่วโลก แม้จะบอกว่าบ้านเรายังไม่พร้อม แต่เชื่อว่าถ้าเราตั้งใจทำกันจริงๆ ปรับความเข้าใจ สร้างข้อมูลให้มากขึ้น พัฒนาบุคลากร และพัฒนาโครงสร้างพื้นฐานด้านข้อมูล บ้านเราแข่งกับเขาได้แน่

ธนชาติ นุ่มนนท์

IMC institute

ตุลาคม 2557

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out /  เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

w

Connecting to %s