คำถามหนึ่งที่เรามักจะเจอบ่อยคือ “ข้อมูลใหญ่ขนาดไหนถึงจะเรียกว่า Big Data” หรือบางทีเราก็มักจะเจอคำถามว่า “เราต้องซื้อ Product อะไรเพื่อมาทำโครงการ Big Data เราต้องลงทุนซื้อเทคโนโลยี Hadoop หรือไม่” จริงๆแล้ว Big Data มันก็เป็นศัพท์ทางการตลาดที่พยายามจะบอกให้ผู้คนเข้าใจได้ว่าข้อมูลในปัจจุบันมีขนาดใหญ่ขึ้น (Volume) เพิ่มขึ้นอย่างรวดเร็ว (Velocity) มีรูปแบบที่หลากหลาย (Variety) และมีความไม่แน่นนอน(Vacirity) ซึ่งข้อมูลมหาศาลเหล่านี้มีทั้งข้อมูลภายใน ภายนอกองค์กรหรือจาก Social Media การที่ข้อมูลปัจจุบันเป็นอย่างนี้ถ้าใครรู้จักนำข้อมูลเหล่านี้มาวิเคราะห์มาใช้งานก็จะเป็นประโยชน์ต่อองค์กรมหาศาล หลายองค์กรเริ่มสนใจจะทำโครงการ Big Data แต่บางครั้งไปเริ่มที่ฝ่ายไอที ก็มักจะกลายเป็นโจทย์ในการหาโซลูชั่นหรือ Product ซึ่งพอเป็นโครงการอย่างนี้บางทีก็คิดว่าจะต้องลงทุนด้วยงบประมาณสูงๆ ทางบริษัท Vendor ต่างๆก็จะพยายามนำเสนอโซลูชั่นราคาแพงที่สามารถเก็บข้อมูลจำนวนมหาศาลได้และสามารถประมวลผลได้อย่างรวดเร็วทั้งๆที่อาจยังไม่รู้ด้วยว่าจะนำโซลูชั่นไปวิเคราะห์ข้อมูลอะไร โครงการ Big Data ที่ดีควรเริ่มที่ฝั่งธุรกิจ ควรจะต้องพิจารณาก่อนว่าต้องการทำอะไร อาทิเช่นต้องการหาข้อมูลลูกค้าเพิ่ม วิเคราะห์ความเสี่ยง พยากรณ์ยอดขาย ทำ Social Media Analysis. ต้องการคาดการณ์ความต้องการของลูกค้า ซึ่งโจทย์แต่ละอย่างอาจมีความต้องการข้อมูลที่แตกต่างกัน Product ที่ต่างกันและวิธีการวิเคราะห์ข้อมูลต่างกัน

Screenshot 2015-07-30 11.22.37

Big Data มีองค์ประกอบที่สำคัญสามอย่าง

  • Data Source คือแหล่งข้อมูลที่าจจะเป็นข้อมูลภายในองค์กร หรือข้อมูลภายนอกองค์กร หรืออาจต้องนำข้อมูลจากSocial Media มาใช้ ข้อมูลอาจเป็นข้อมูลรูปแบบเดิมที่เป็น structure หรือข้อมูลแบบใหม่ที่เป็น unstructure แต่หลักการหนึ่งที่สำคัญในเรื่องของ Big Data คือถ้าเรามีข้อมูลมากขึ้นก็น่าจะมีประโยชน์ต่อองค์กรมากขึ้นตาม
  • Technology คือโซลูชั่นที่จะช่วยทำให้เราสามารถจะเก็บข้อมูลและประมวลผลได้รวดเร็วขึ้น การจะใช้เทคโนโลยีใดก็ขึ้นอยู่กับข้อมูลที่ต้องการ ถ้าขนาดข้อมูลไม่ได้มากไปข้อมูลที่ต้องการยังเป็นแบบเดิมก็อาจใช้เทคโนโลยีแบบเดิมในการเก็บ หรือถ้าข้อมูลมีจำนวนมากก็อาจพิจารณาเทคโนโลยใหม่ๆที่เป็น Hadoop หรือ MPP รวมถึงอาจต้องพิจารณาเครื่องมือต่างๆในการวิเคราะห์ข้อมูลเช่น BI หรือ Analytics Tool
  • Analytics คือกระบวนการในการนำข้อมูลมาวิเคราะห์ ทั้งนี้ก็ขึ้นอยู่กับโจทย์ว่าต้องการทำอะไรงานบางอย่างก็อาจใช้เครื่องมือ BI ทั่วๆไปแต่งานบางงานก็อาจต้องหาผู้เชี่ยวชาญที่เป็น Data Scientists เข้ามาช่วย โดยเฉพาะกรณีที่ต้องการใช้ข้อมูลเพื่อคาดการณ์ต่างๆที่อาจต้องหาอัลกอริทึมที่เหมาะสม

จากที่กล่าวมาจะเห็นว่าบางครั้งโครงการ Big Data อาจไม่ต้องลงทุนซื้อเทคโนโลยีใดเลยก็ได้ ถ้าเริ่มจากความต้องการทางธุรกิจและเข้าใจว่าต้องการ Data Source และต้องวิเคราะห์ข้อมูลอย่างไร

ธนชาติ นุ่มนนท์

IMC Institute

กรกฎาคม 2558

 

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

Connecting to %s