Big Data เป็นเรื่องที่กล่าวขานกันอย่างมากในปัจจุบัน และอาจเป็นเทคโนโลยีไอทีเพียงไม่กี่อย่างที่กล่าวกันมากในวงการธุรกิจ กลุ่มผู้บริหารเริ่มเห็นความสำคัญของการนำข้อมูลขนาดใหญ่มาวิเคราะห์หรือคาดการณ์แนวโน้มของธุรกิจ เรื่อง Big Data ยังเป็นเรื่องใหม่ คนจำนวนมากย้งไม่เข้าใจเรื่องนี้อย่างแท้จริง มันเหมือนศัพท์ขั้นเทพที่ทุกคนอยากกล่าวถึงแต่ก็ย้งไม่เข้าใจอย่างแท้จริง เรื่องบุคลากรก็เป็นอีกเรื่อง บางหน่วยงานพอมีคำว่า Big Data ผู้บริหารก็เริ่มบอกว่าต้องการ Data Scientist ทั้งๆที่ยังไม่รู้ว่าจะกำหนด Job Description ในองค์กรให้เขาอย่างไร หรือจำเป็นแค่ไหนที่เราต้องการบุคลากรด้านนี้ในองค์กร
คำถามที่มักจะเจอก็คือเราจะเริ่มต้นทำ Big Data อย่างไร เราต้องการบุคลากรอย่างไร ทักษะเปลี่ยนไปจากเดิมมากน้อยอย่างไร เราต้องการ Data Scientist ในองค์กรเพื่อทำ Big Data จริงหรือ? คำถามเหล่านี้ไม่มีคำตอบที่ชัดเจน แต่มันก็ขึ้นอยู่กับระดับความต้องการใช้งาน Big Data ขององค์กร แต่ที่แน่ๆทักษะของบุคลากรในยุคใหม่ที่มีเทคโนโลยี Big Data จะเปลี่ยนแปลงจากสมัยเดิมที่เรื่องแต่เรื่องของ RDBMS ในมุมมองของผมงานทางด้าน Big Data น่าจะแบ่งบุคลากรด้านต่างๆได้ดังนี้
- Chief Data Officer ในอดีตเราอาจมีผู้บริหารสูงสุดด้านไอที แต่แนวโน้มเราอาจต้องการผู้บริหารสูงสุดด้านข้อมูล ที่มีอำนาจในการดูแลข้อมูลภายในและภายนอกองค์กร การนำข้อมูลไปใช้งาน การบริหารจัดการเทคโนโลยีสารสนเทศด้านข้อมูล การออกแบบสถาปัตยกรรม การดูแลเรื่องคุณภาพข้อมูล และอาจรวมไปถึงทรัพย์สินทางปัญญาที่อาจเกิดขึ้น จากข้อมูลหรืออัลกอริทึกจากการวิเคราะห์คาดการณ์ข้อมูล
- Big Data Architect เทคโนโลยีด้านข้อมูลเปลี่ยนไปจากเดิมมากที่แต่ก่อนอาจพูดถึงแค่ RDBMS หรือ Data WareHouse แต่ในปัจจุบันทุกองค์กรจะต้องปรับโครงสร้างพื้นฐานด้านข้อมูลและอาจต้องนำเทคโนโลยีใหม่เข้ามาใช้งานทั้ง Hadoop, NoSQL, Storage หรือ แม้แต่ Cloud Service ซึ่งเทคโนโลยีเหล่านี้ยังมีบริการหรือเทคโนโลยีเสริมต่างๆที่หลากหลาย อาทิเช่น Data Ingestion อย่าง KafKa, Sqoop หรือ Flume หรือเทคโนโลยีด้านประมวลผลเช่น Spark, Impala หรือเทคโนโลยีการทำ Visualisation ดังจะเห็นได้จากรูปที่ 1 ที่แสดง Big Data Landscape ที่ประกอบด้วยเทคโนโลยีต่างในปัจจุบัน ซึ่งเราจำเป็นต้องการ IT Architect ที่เข้าใจการออกแบบระบบที่รองรับเทคโนโลยีหลากหลายเหล่านี้ได้
- Big Data Engineer/Administrator งานอีกด้านหนึ่งที่จำเป็นคือคนที่มีความสามารถในการติดตั้งระบบ Big Data ต่างๆเช่น Hadoop, RDBMS, NoSQL รวมถึงการ Monitor และการทำ Performance Tuning ซึ่งงานแบบนี้อาจต้องการทักษะคนที่เข้าใจระบบปฎิบัติการ มีความสามารถที่จะเป็นผู้ดูแลระบบเหมือน System Admin แต่บุคลากรแต่ละรายอาจไม่สามารถดูแลทุกระบบได้เพราะแต่ละระบบต้องการทักษะที่ต่างกัน
- Big Data Developerในอดีตงานนี้อาจหมายถึงคนที่จะมาช่วยพัฒนา SQL เพื่อจะเรียกดูข้อมูลจาก DataBase แต่ปัจจุบันระบบประมวลผลขนาดใหญ่ต้องการทักษะด้าน Programming มากขึ้นและมีเทคโนโลยีที่หลากหลายมากขึ้นทั้ง MapReduce, Spark, Hive, Pig หรือ Impala แต่ละเทคโนโลยีก็ต้องการทักษะที่ต่างกัน ดังนั้นก็มีแนวโน้มที่องค์กรต้องการบุคลากรด้านนี้จำนวนมากและแต่ละคนอาจทำงานใช้เทคโนโลยีคนละด้านกัน
- Big Data Analyst หมายถึงนักวิเคราะห์ข้อมูลที่อาจรวมไปถึงการนำข้อมูลมาแสดงผล โดยใช้ Visualisation Tool ที่หลากหลาย โดยในปัจจุบันอาจต้องดึงข้อมูลมาจาก Data Lake และใช้ Tool ใหม่ๆ บางครั้งบุคลากรด้านนี้อาจไม่ได้เก่งด้านการพัฒนาโปรแกรมนัก แต่จะต้องรู้ว่าจะวิเคราะห์ข้อมูลอะไร และมีทักษะในการผลที่ได้มาแสดงให้คนทั่วไปเข้าใจ คนกลุ่มนี้ควรมีพื้นฐานด้านสถิติและรู้ด้านธุรกิจ
- Data Scientist ตำแหน่งงานที่ดูน่าสนใจที่สุดในปัจจุบัน แต่ก็ใช่ว่าทุกองค์กรต้องการ เพราะบุคลากรด้านนี้จำเป็นถ้าเราต้องการวิเคราะห์ข้อมูลโดยเฉพาะในลักษณะ Predictive Analytics บุคลากรด้านนี้ต้องรู้เรื่องของ Algorithm อาจต้องเก่งด้านคณิตศาสตร์ เข้าใจเรื่อง Machine Learning และต้องมีความเข้าใจด้านธุรกิจที่ต้องการวิเคราะห์ โดยมากคนเก่งทางด้านนี้น่าจะจบปริญญาโทหรือเอกด้านคณิตศาตร์, Computer Science หรือ Computer Engineering มา
รูปที่ 1 Big Data Landscape 2016
จากที่กล่าวมาทั้งหมดจะเห็นว่า ในอนาคตองค์กรยังมีความต้องการบุคลากรด้านนี้ที่หลากหลาย และยังมีความต้องการอีกจำนวนมาก ผมคิดว่าถึงเวลาที่หน่วยงานต่างๆต้องมาวางแผนการพัฒนาบุคลากรด้านนี้ร่วมกัน เท่าที่ทราบทาง สำนักงานการอุดมศึกษาก็มีการตั้งอนุกรรมการดูหลักสูตรทั่วประเทศเพื่อพัฒนาคนทางด้านนี้ และได้ให้ผมเข้าร่วม แต่ก็ยังขับเคลื่อนกันช้าอยู่ ถึงเวลาที่เราคงต้องรีบเร่งแล้วครับ
ธนชาติ นุ่มนนท์
IMC Institute
กุมภาพันธ์ 2559