Online Courseware และหนังสือ Big Data ที่น่าอ่าน

ผมเริ่มสนใจเรื่อง Big Data มาได้ซักพักหนึ่ง และโชคดีที่มีโอกาสได้อ่านหนังสือหลายเล่ม เรียนรู้ทั้งจาก  Online Courseware ต่างๆทั้งที่ฟรีและเสียเงิน จริงๆท่านหนึ่งที่ต้องขอบคุณอย่างมากคือ คุณดนัยรัฐ ธนบดีธรรมจารี จาก Oracle ที่ได้มาช่วยสอนและแนะนำการติดตั้ง Hadoop ทำให้ผมได้เริ่มลงมือปฎิบัติในเรื่องของ Big Data มากขึ้นไม่ใช่แค่อ่านแต่หนังสือ ซึ่งก็ได้ศึกษา Hadoop และ Big Data มาอย่างต่อเนื่อง ทั้งการใช้เครื่องมือต่าง การใช้ Big Data as a Service บน Cloud เช่น Amazon Elastic Map Reduce การเรียนรู้ภาษาหรือ Tool ต่างๆเช่น  Hive, Pig, HBase, Hue หรือ Mahout รวมถึงการอ่านหนังสืออีกหลายสิบเล่ม ลองมาดูกันครับว่ามีแหล่งข้อมูลไหนบ้างครับสำหรับการศึกษา Big Data และ  Hadoop

Online Courseware

มีเว็บไซต์ดีๆหลายอันที่สอนเรื่อง  Big Data โดยเฉพาะเรื่องของ Hadoop อาทิเช่น

  • www.bigdatauniversity.com : ซึ่งเป็นเว็บไซต์การเรียนรู้ Big Data  ของ IBM จะมี Courseware  ดีๆอยู่หลายหลักสูตรที่มีทั้ง Slide  เสียงบรรยาย และ Hand-on Lab  อาทิเช่น Big Data Fundamentals, Hadoop Fundamentals หรือ Course ที่เรียนรู้เครื่องมือบางอย่างเช่น Moving Data into Hadoop แต่อย่างไรก็ตาม Hand-on Lab ใน courseware  เหล่านี้จะผูกอยู่กับ IBM Infosphere BigInsight
  • Cloudera Online Training: Cloudera เป็นบริษัทที่เด่นที่สุดบริษัทหนึ่งในการทำ Hadoop Distribution ส่วนหนึ่งก็เป็นเพราะว่าคนที่เริ่มคิดโปรเจ็ค Hadoop อยู่ที่บริษัทนี้ Cloudera จะมี Online Courseware ดีๆหลายตัว อาทิเช่น Introduction to Hadoop and MapReduce นอกจากนี้ยังมี Hand-on Training  ซึ่งใช้เครื่องมือของ Cloudera Live ที่อยู่บน Cloud ให้สามารถฝึกและเรียนรู้การใช้เครื่องมือต่างๆอย่าง Pig หรือ Hive ได้
  • Simplilearn: ในปัจจุบันมี Courseware ที่ผู้เรียนสามารถจ่ายเงินเรียน Online ได้หลายๆหลักสูตร ผมเองเคยเรียนหลักสูตรของ Simplilearn ที่ค่าเรียนประมาณร้อยกว่าเหรียญ เนื้อหาก็ดีพอควรสำหรับผู้สนใจเรีิ่มต่้นการทำ Big Data โดยใช้  Hadoop พร้อมทั้งมีแบบฝึกหัดให้ทำ

Screenshot 2014-10-12 07.03.06

หนังสือด้าน Big Data

มีหนังสือหลายเล่มมากที่เกี่ยวข้องกับ Big Data ที่ผมมีโอกาสอ่าน ที่ได้อ่านหลายเล่มเป็นเพราะผมเป็นสมาชิก Safari Book Online ทำให้สามารถค้นหนังสือมาอ่านได้จำนวนมาก แต่บางเล่มก็ซื้อมาอ่านใน Kindle หนังสือต่างๆที่ผมอยากแนะนำมีดังนี้

Screenshot 2014-10-12 16.24.31

Big Data: Understanding How Data Powers Big Business หนังสือเล่มนี้เหมาะกับผู้บริหารที่ต้องการทำความเข้าใจเกี่ยวกับ Big Data ซึ่งไม่ได้ต้องการลงด้านเทคนิคมากนัก หนังสือเล่มนี้จะให้คำตอบความหมายของ Big Data ผลกระทบต่อธุรกิจ การวางแผนกลยุทธ์ Big Data สำหรับองค์กร การกำหนดทีมงาน และการวางแผนต่างๆ นับเป็นหนังสือที่ดีมากสำหรับผู้บริหารที่ต้องการทำความเข้าใจและวางแผน Big Data ขององค์กร

Big Data Analytics: Turning Big Data into Big Money: เป็นหนังสืออีกเล่มสำหรับผู้บริหาร โดยจะกล่าวถึงความหมายของ Big Data พูดถึง Business Case การสร้าง  Big Data Team การหา Big Data Source  และอื่นๆ ผมว่าหนังสือเล่มนี้อ่านง่ายกว่าเล่มแรก แต่เล่มแรกจะมีทฤษฎีและ template ต่างๆ ให้เรานำไปใช้ได้ดีกว่า

Planning for Big Data: หนังสืออีกเล่มหนึ่งที่เป็นการกล่าวถึง Big Data ในลักษณะ High Level หนังสือออกมาเมื่อปี 2012 ซึ่งน่าจะอิงกับ Microsoft พอสมควร แต่ข้อดีคือเป็นหนังสือที่สามารถหาอ่านได้ฟรีทาง Amazon Kindle  ในหนังสือจะพูดถึงความหมายของ Big Data, Apache Hadoop, Big Data Market Survey, Big Data in the Cloud และจะมีบทหนึ่งพูดถึง Microsoft’s Plan for Big Data

Hadoop Real-World Solutions Cookbook: หนังสือเล่มนี้เหมาะสำหรับนักไอทีที่ต้องการเรียน Hadoop และโปรแกรมอื่นๆที่เกี่ยวข้องของ Hadoop จะมีบทที่แนะนำ Hadoop และองค์ประกอบอื่นๆเช่น HDFS, MapReduce, Hive และ Pig หนังสือเล่มนี้จะมีเนื้อหาที่ดีในการแนะนำการเขียนโปรแกรม MapReduce โดยใช้ภาษา Java และมีตัวอย่างทีดีในการเขียนโปรแกรมโดยเฉพาะในบทที่  6 ที่ว่าด้วยเรื่อง Big Data Analysis

Hadoop in Practice: หนังสือด้่านเทคนิคอีกเล่มหนึ่งที่ค่อนข้างจะละเอียด และอาจจะอ่านยากกว่าเล่มก่อนหน้านี้ เหมาะสำหรับ Programmer ที่เข้าใจ command line ของ Linux เนื้อหาข้างในละเอียดมาก จุดเด่นของหนังสือเล่มนี้คือส่วนที่ 4 ที่กล่าวถึง Data Science และจะมีบทที่พูดถึง Algorithm ตัวอย่างการใช้ R และ Mahout

Hadoop: The Definitive Guide: หนังสืออีกเล่มที่แนะนำ Hadoop หนังสือเล่มนี้จะแนะนำซอฟต์แวร์ต่างๆของ Hadoop ไว้ได้ครอบคลุมทั้งหมดตั้งแต่ Hive, Pig, Sqoop, HBase หรือ Zookeeper รวมถึงพูดถึงการติดตั้ง Hadoop Cluster เล่มนี้เหมาะสำหรับ Administor ที่ต้องการติดตั้งและเข้าใจ Hadoop แต่ก็มีการกล่าวถึงการโปรแกรม MapReduce อยู่หลายบทเหมือนกัน

Programming Hive: หนังสือเล่มนี้สำหรับผู้สนใจจะใช้คำสั่งคล้าย SQL บน Hadoop เพื่อที่จะสืบค้นข้อมูล Unstructure โดยใช้โปรแกรม  Hive  หนังสือเหมาะกับผู้ที่สนใจเล่น Hive อย่างจริงจัง เพราะมีหลายละเอียดค่อนข้างมากตั้งแต่ Data Types การใช้ภาษา  Hive QL ผมเองได้แค่อ่านผ่านๆเพราะไม่ได้ต้องการเจาะลึกการใช้ Hive

Mahout in Action: หนังสือนี้เหมาะกับ Data Scientist ที่ต้องการพัฒนา Scalable Machine Learning โดยใช้ Mahout ที่รันอยู่บน Hadoop หนังสือเล่มนี้จะอ่านยากมากเพราะจะเต็มไปด้วยสูตรคณิตศาสตร์ต่างๆและโปรแกรมภาษาจาวาโดยใช้ Mahout หนังสือจะกล่าวถึงการทำ Preditive Analysis สามเรื่องที่ Mahout สามารถทำได้คือ Recommendation, Classification และ Clustering

ธนชาติ นุ่มนนท์

IMC Institute

ตุลาคม 2557

 

Gartner: Top 10 Strategic IT Trends 2015

ทุกๆปลายปี สำนักวิจัย Gartner  จะประกาศให้เห็นถึง Top 10  แนวโน้มของเทคโนโลยีในปีต่อไป แต่ปีนี้ Gartner ประกาศออกมาค่อนข้างเร็วตั้งแต่ต้นสัปดาห์นี้ และก็ได้ระบุถึงเทคโนโลยีไอทีต่างๆ 10  ด้าน ตามที่แสดงในรูปที  ซึ่งถ้าเปรียบเทียบกับปีที่แล้วหรือ 2-3  ปีที่ผ่านมา จะเห็นได้ว่าในปีนี้ไม่ค่อยมีคำว่า Cloud Computing, Mobile Technology, Social Networks  หรือ Big Data  ทั้งนี้ก็เพราะว่า Mega Trends  เหล่านี้ได้กลายมาเป็นส่วนหนึ่งในระบบไอทีที่เราใช้อยู่ทุกวัน และแทบทุก Strategic IT Trends ที่ Gartner พูดถึงก็จะเกี่ยวข้องกับ Mega Trends  เหล่านี้ สำหรับ IT Trends ในปีนี้มีเรื่องต่างๆที่น่าสนใจดังนี้

10649099_396528190494527_5178840512740960137_o

1) Computing Everywhere: การใช้งานอุปกรณ์ smartphone  ที่แพร่หลาย ทำให้เกิดผู้ใช้้ที่เป็น mobile มากขึ้น และต้องสามารถเข้าถึงการใช้งานได้ทุกที่ ระบบการใช้งานก็จะต้องคำนึงสภาพแวดล้อมที่จะมีอุปกรณ์หลากหลายต่อมาจากทุกๆที่มากกว่่าที่จะพัฒนามุ่งมาให้อุปกรณ์เดี่ยวใช้งาน และยิ่งมีกระแสของอุปกรณ์อย่าง  waerable technology ก็จะยิ่งทำให้การประมวลผลผ่านอินเตอร์เน็ตมีการใช้งานอย่างกว้างขวางขึ้นที่ผู้คนจะเข้าถึงจากทุกๆที่ และต่อไปการออกแบบที่เน้นประสบการณ์ของผู้ใช้ (User Experience Design) จะมีความสำคัญยิ่งขึ้น

2) The Internet of Thing (IoT): Gartner ให้ความสำคัญกับ IoT อย่างต่อเนื่องมาสามปีแล้ว ซึ่งการเติบโตอย่างต่อเนื่องของอุปกรณ์จะทำให้เกิดข้อมูลที่มากขึ้นและก็จะมีบริการต่างๆเพิ่มมากขึ้นตาม เราจะเห็นการนำอุปกรณ์มาใช้งานในเชิงธุรกิจมากขึ้น อาทิเช่น การนำโมเดลการจ่ายเงินตามการใช้งาน (Pay-per-use )มาใข้กับการบริการอย่างระบบประกันภัยที่อาจชำระเฉพาะเมื่อมีการขับรถโดยเราใช้อุปกรณ์ IoT ตรวจจับ  หรือที่จอดรถที่อาจมีอุปกรณ์ IoT ติดอยู่

3)  3D Printing: ตลาดการพิมพ์สามมิติในปี 2015 จะโตขึ้นถึง 98% และคาดการณ์ว่าจำนวนเครื่องพิมพ์สามมิติจะถูกจำหน่ายเพิ่มเป็นสองเท่าและจะมีจำนวนเป็นสามเท่าในอีกสามปีข้างหน้า โดยเครื่องก็จะมีราคาถูกลงและถูกนำมาใช้ในอุตสาหกรรมต่างๆมากขึ้น ซึ่งการนำ 3D Printer มาใช้ก็จะช่วยลดค่าใช้จ่ายในการออกแบบหรือการพัฒนาอุปกรณ์ต้นแบบ

4) Advanced, Pervasive and Invisible Analytics: Analytics จะกลายเป็นเรื่องสำคัญเพราะเราจะมีข้อมูลทั้งที่เป็น  structure และ unstructure มากขึ้น Application ต่างๆก็ต้องมีระบบที่มีความสามารถด้าน Analytics อยู่ใน และองค์กรก็ต้องเตรียมรองรับกับข้อมูลมหาศาลที่จะมาจาก IoT, Social Media และ อุปกรณ์ Wearable ซึ่ง Analytics จะมีความสำคัญในการจะหาคำตอบต่างๆมากกว่าเพียงแค่ Big Data

5) Context-Rich Systems: Gartner ได้กล่าวถึง Ubiquitous embedded intelligence ซึ่งจะเป็นการพัฒนาระบบต่างๆที่จะช่วยเตือนและคาดการณ์เรื่องต่างๆที่อยู้รอบตัวได้ล่วงหน้า อาทิเช่นระบบอย่าง  Context-Aware Security

6) Smart Machines: เมื่อปีที่แล้ว  Gartner ก็กล่าวถึง smart machine ที่เป็นระบบที่สามารถเรียนรู้เองได้ (เช่น IBM Watson) ซึ่งจะมีระบบ  Analytics ที่ชาญฉลาด โดยยุคของ smart machine ที่จะมาถึงนี้ก็จะเป็นการเปลี่ยนแปลงครั้งสำคัญของประวัติศาสตร์ไอที ซึ่งในปัจจุบันก็เริ่มมีการพัฒนาต้นแบบของ รถยนต์แบบautonomous, หุ่นยนต์ที่ก้าวหน้าขึ้น หรือผู้ช่วยอัจฉริยะเสมือนจริง (virtual personal assistant)

7) Cloud/Client Architecture:  เทคโนโลยี Mobile และ Cloud กำลังเข้ามารวมกัน โดยฝั่ง Client จะเป็น Rich Application ที่ทำงานบนอุปกรณ์ที่เชื่อมต่อระบบอินเตอร์เน็ตเช่นอุปกรณ์พีซี smartphone หรือ Tablet ส่วนฝั่งของ Server ก็จะเป็น Applications หลากหลายที่ทำงานอบู่บนระบบ Cloud Computing ที่ยืดหยุ่น (Elastic) และพร้อมที่จะรองรับผู้ใช้จำนวนมากได้ (Scability) นอกจากนี้ความต้องการการใช้งานฝั่ง Client ผ่านอุปกรณ์โมบายจะยิ่งทำให้ระบบ Server และ Storage มีขนาดใหญ่มากขึ้นเรื่อยๆ ผู้พัฒนา Application ก็ต้องต้องเตรียมรองรับกับผู้ใช้จำนวนมากจากอุปกรณ์ที่มีหน้าจอที่หลากหลาย และจะต้องสามารถ sync ข้อมูลของ App ในทุกๆอุปกรณ์ได้

8) Software Defined Infrastructure and Applications: ต่อไปเราจะเห็นการโปรแกรมที่ยืดหยุ่น (Agile Programming)  สำหรับทุกๆอย่างตั้งแต่การพัฒนา Application ไป จนถึงการทำ Infrastructure ที่จะมีเรื่องของ Software-defined networking, storage, data centers และ security โดยจะมีการใช้ Application Programming Interface (APIs) ที่จะเข้าถึงข้อมูลและระบบเหล่านี้ผ่านบริการที่อยู่บน Cloud

9) Web-Scale IT: การให้บริการไอทีกำลังเปลี่ยนไปเพราะมีผู้ใช้จำนวนมหาศาล ระบบอย่าง Facebook, Amazon และ Google ทำให้ Enterprise Data Center ต่างๆต้องออกแบบระบบที่จะรองรับผู้ใช้จำนวนมากที่จะเพิ่มขึ้นอย่างรวดเร็วได้ ซึ่งจะเป็นเรื่องยากที่องค์กรส่วนใหญ่จะทำระบบแบบนั้นได้ ดังนั้นในอนาคตเราอาจจะเห็นองค์กรต่างๆมาใช้ระบบ Cloud มากขึ้น และขั้นตอนแรกขององค์กรต่างๆที่จะเข้าสู่่  Web-Scale IT คือการใช้ DevOps  ซึ่งเป็นการรวมกันของ Development กับ  Operation

10) Risk-Based Security and Self-Protection: สุดท้าย Gartner ก็ยังให้ความสำคัญกับเรื่องของระบบความปลอดภัยและเชื่อว่าไม่มีองค์กรใดป้องกันได้  100%  ดังนั้นการประเมินความเสี่ยงและการใช้กระบวนการและเครื่องมือในการลดความเสี่ยงจะเป็นเรื่องที่สำคัญ ในมุมทางเทคนิคการออกแบบ Application ที่มีการป้องกันความปลอดภัยอยู่ในตัวจะมีความสำคัญยิ่งขึ้น

ธนชาติ นุ่มนนท์

IMC Institute

Screenshot 2014-10-11 12.05.57

Big Data on Cloud ตอนที่ 2: BI/Analytics as a Service

เมื่อเดือนก่อนผมเขียนบทความเรื่อง การคาดการณ์แนวโน้มของ Big Data โดยคาดการณ์ด้านๆต่างไว้  10 เรื่อง และได้กล่าวถึงเรื่อง Big Data as a Service (BDaaS) ไว้ โดยเชื่อว่าจะมีการให้ความสำคัญกับการทำ  Big Data บน Cloud มากขึ้น ซึ่งมีการคาดการณ์ว่ามูลค่าการตลาดของ Big Data ในปี 2021  จะสูงถึง 88 พันล้านเหรียญสหรัฐและถ้าคิดมูลค่า Big Data as a Service ว่าจะมีมูลค่าประมาณ 35% ของตลาดก็จะทำให้มีมูลค่าสูงถึง 30 พันล้านเหรียญสหรัฐ และผมได้แสดงแผนภาพของ  BDaaS ที่เริ่มพูดถึง as a Service อื่นๆ นอกเหนือจากคำว่า IaaS, PaaS และ SaaS ที่เราคุ้นเคยกันดี ดังรูปที่  1

BDaaSรูปที่ 1 Big Data as a Service

จากจะรูปจะเห็นว่า BDaaS จะมีบริการอย่าง  Compute as a Service  เช่น EC2 บน Amazon Web Services (AWS) หรือ Storage as a Service เช่น S3 บน AWS หรือบริการอย่าง Data as a Service  อาทิเช่น

  • Database as a Service  อย่าง SQL Server บน Azure  หรือ  RDS บน AWS หรือ
  • NoSQL as a Service  เช่น  Mongo DB บน Bluemix หรือ  Heroku
  • Hadoop as a  Service  อย่าง Amazon EMR, Microsoft Azure HDInsight, Rackspace Cloud Big Data Platform, IBM Bluemix และ  Qubole (ผมเองก็ได้เขียนบทความเรื่อง “Big Data on Cloud: Hadoop as a Service “)

คราวนี้พอมาถึงเรื่องสุดท้าย Analytics as a Service ก็เริ่มมีประเด็นขึ้นมาบ้างเพราะหลายๆคนไม่เข้าใจความแตกต่างระหว่าง  Big Data, Business intelligence และ  Analytics  พอดีได้อ่านบทความของดร.อธิป อัศวานันท์ รองประธานกรรมการธุรกิจเทคโนโลยีสารสนเทศและการสื่อสาร หอการค้าไทย เรื่อง “ความเข้าใจที่ผิดๆ เกี่ยวกับ Big Data และ Analytics (1)” ก็ยิ่งทำให้เห็นสอดคล้องกับท่านว่าคนไทยยังไม่เข้าใจเรื่องนี้ดี คิดไปว่า  Programmer  หรือ  BI Analyst  จะสามารถเป็น Data Scientist ทำเรื่อง  Analytics ได้ ผมเลยได้เขียนบทความเรื่อง “Big Data Analytics กับความต้องการ Data Scientist ตำแหน่งงานที่น่าสนใจในปัจจุบัน” เพื่อย้ำให้เห็นว่าอะไรคือคำว่า  Analytics และต่่างกับ BI อย่างไร

ตัวผมเองเรียนปริญญาโทและเอกมาทางด้าน Electrical and Electronic  Engineering สมัยนั้นจำได้ว่ามีเพื่อนหลายๆคนทำวิทยานิพนธ์ทางด้าน Neural Networks  ซึ่งก็เป็นคณิตศาสตร์โมเดลด้าน  Analytics แบบหนึ่ง และปีท้ายๆของการเรียนปริญญาเอกและการทำวิจัยหลังจากจบปริญญาเอกก็ต้องมาจัับเรื่อง Analytics กับเขาบ้าง ตอนนั้นทำเรื่อง Parallel Genetic Algorithm เพื่อคาดการณ์ราคาจำหน่ายไฟฟ้าของ Spot Market ที่โรงไฟฟ้าใน New Zealand ต้องแข่งขันกัน การเรียนปริญญาเอกที่ใช้เวลาหลายปี ดูวุ่นวายกับโมเดลคณิตศาสตร์ และ Algorithm  ทำให้บางครั้งก็ท้อ และถามตัวเองหลายครั้งว่า เรามาทำอะไรเสียเวลาอยู่หลายๆปีกับการคำนวณอะไร ขณะที่เพื่อนๆหลายคนจบออกมาก็มีความก้าวหน้าทางการงานไปประกอบอาชีพแล้ว พอจบมาสอนหนังสือนักศึิกษาอีกสิบกว่าปี ก็ได้ใช้โมเดลคณิตศาสตร์เหล่านี้อีกน้อยมาก จนลืมเรื่องเหล่านี้ไป

มาวันนี้พอคำว่า Big Data  Analytics กำลังเข้ามา และได้มีโอกาสให้คำปรึกษาอาจารย์และนักศึกษา รวมถึงให้คำปรึกษาบริษัทต่างๆด้่าน Big Data ทำให้เริ่มเห็นคุณค่าของสิ่งที่ได้เรียนมา และเริ่มเข้าใจว่าอะไรคือประโยชน์ของการเรียนรู้ Predictive Analytics และน่าจะเป็นประโยชน์ในอนาคตไม่มากก็น้อย ซึ่งก็จะช่วยทำให้เราเข้าใจการวิเคราะห์ข้อมูลในอนาคตได้ดีขึ้นซึ่่งเป็นการใช้  Big Data  ให้ได้ประโยชน์มากขึ้น

ถ้าเรามาพิจารณา Product ทางด้าน  BI and Analytics จะพบว่ามีรายงานของ Gartner เมื่อเดือนกุมภาพันธ์ปีนี้เรื่อง Magic Quadrant for Business Intelligence and Analytics Platforms ที่วิเคราะห์ Product ทางด้านนี้ ซึ่งทาง Gartner จะพิจารณา Product จากคุณลักษณะต่างๆ อาทิเช่น ความสามารถในการทำ Report, Dashboard, Interactive visualization หรือการพิจารณาว่ามีความสามารถด้าน advanced analytics เช่น forecasting algorithms หรือดูความสามารถในการที่เชื่อมโยงกับข้อมูล Big Data  อื่นๆอย่าง Hadoop  ซึ่งผลการวิเคราะห์จะพบว่า Product หลายๆตัวก็จะมีความสามารถที่แตกต่างกันและไม่ได้มี feature ที่ทำได้ทุกด้าน โดย Gartner ได้สรุปรูปของ Magic Quadrant ดังนี้

 Screenshot 2014-10-09 17.57.12

รูปที่  2 Gartner’s Magic Quadrant for Business Intelligence and Analytics Platforms

เมื่อพูดถึงความแตกต่างระหว่าง BI กับ Predictive Analytics และ Product ต่างๆที่กล่าวมาแล้ว เราอาจจะเริ่มเห็นความแตกต่างระหว่าง BI as a Service  และ Analytics as a Service ซึ่งในปัจจุบันบริการบน Cloud ส่วนใหญ่จะระบุว่าเป็น BI as a Service ตัวอย่างเช่น

Screenshot 2014-10-09 12.44.21

รูปที่ 3  BIME: BI as a Service

BI as a Service บน Cloud เหล่านี้โดยมากจะสามารถวิเคราะห์ข้อมูลจาก Data ที่มาจากแหล่งต่างๆได้ บางตัวก็อาจสนับสนุน Big Data ที่เป็น  unstructure หรือบางตัวก็จะมี Analytics Engine ที่ Embedded เข้ามาและทำให้เราใช้ Algorithm วิเคราะห์และคาดการณ์ข้อมูลได้ก่อนที่จะใช้ เครื่องมืออย่าง BI ในการที่จะทำ Report/ Dashboard  หรือทำ  Visualization ในมุมมองต่างๆ อาทิเช่น  Birst  ดังแสดงให้เห็นในรูป

Screenshot 2014-10-09 18.05.11

รูปที่  4 Birst Data Sheet

Screenshot 2014-10-09 19.49.48

รูปที่  5 IBM Watson Analytics

แต่เมื่อมาดู Analytics บน Cloud ส่วนใหญ่ก็ยังไม่ได้มี Analytics Algorithm ที่ชาญฉลาดมากนัก แต่ก็อาจช่วยลดความจำเป็นของความต้องการ Data Scientist ไปได้บ้าง เพราะอาจใช้เครื่องมือเหล่านี้เข้ามาช่วยได้ แต่ที่น่าสนใจและกำลังเป็นเรื่องที่น่าจับตามองก็คือการเปิดตัวของ  IBM Watson Analytics ซึ่งเป็น  ระบบคอมพิวเตอร์ Artificial Intelligent ของ IBM ที่จะให้บริการบน Cloud ในเดือนพฤศจิกายนนี้ และก็น่าจะเป็น Analytics as a Service บน  Cloud ที่แท้จรืงตัวหนึ่ง ซึ่งจะเปลี่ยนโลกของการวิเคราะห์  Big Data ไปอย่างมาก และเครื่องมือเหล่านี้อาจเข้ามาช่วยแทนที่ความต้องการหา  Data Scientist   ในอนาคตไปได้

ธนชาติ นุ่มนนท์

IMC Institute

ตุลาคม 2557

สรุปผลสำรวจ “ความพร้อมด้าน Cloud Computing ของหน่วยงานในประเทศไทย”

cloudmgmt

ช่วงเดือนพฤษภาคมถึงกันยายนที่ผ่านมาทางทีมวิจัยของ IMC Institute ได้ทำโครงการวิจัยเชิงสำรวจในหัวข้อ การสำรวจความพร้อมด้าน Cloud Computing ของหน่วยงานในประเทศไทย หรือ Cloud Computing in Thailand Readiness Survey 2014 ขึ้น ทั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบ (Benchmarking) ความพร้อมของประเทศไทยกับประเทศอื่นๆในภูมิภาค ทั้งนี้การสำรวจจะทำการสำรวจทั้งหน่วยงานภาครัฐและเอกชน ทั้งที่เป็นขนาดใหญ่และขนาดกลาง ขนาดเล็ก และเพื่อเป็นแนวทางและข้อมูลในการเตรียมความพร้อมบุคลากรและองค์กรในประเทศไทยต่อไป

บทความนี้จึงขอนำผลการสำรวจบางส่วนมาเผยแพร่ สำหรับผู้ต้องการอ่านผลการสำรวจฉบับเต็มสามารถรอหาอ่านได้จากยนิตยสาร e-Leader  ฉบับเดือนพฤศจิกายน การสำรวจนี้ทีมวิจัยได้จำนวนตัวอย่าง 177 ราย โดยจำแนกตามขนาดองค์กรเป็น หน่วยงาน/บริษัทขนาดใหญ่ (Large Enterprises) ที่มีพนักงานมากกว่า 1,000 คน จำนวน 61 ราย คิดเป็นสัดส่วนร้อยละ 34 ของกลุ่มตัวอย่าง และองค์กรขนาดกลางและขนาดย่อม (SMEs) ที่มีพนักงานน้อยกว่า 1,000 คน จำนวน 116 ราย คิดเป็นสัดส่วนร้อยละ 66 ของกลุ่มตัวอย่าง

โดยมีผลการสำรวจแบ่งเป็น 3 ส่วนคือ

  • การสำรวจข้อมูลการใช้ IT และแผนงานการใช้บริการด้าน Private Cloud
  • การสำรวจแผนงานและการใช้บริการด้าน Public Cloud
  • การสำรวจความพึงพอใจในภาพรวม เหตุผลและปัญหาอุปสรรคในการใช้บริการ Cloud Computing

โดยสามารถแจกแจงรายละเอียดผลการสำรวจได้ดังต่อไปนี้

ผลการสำรวจแผนงานด้าน Private Cloud ของหน่วยงานในประเทศไทย

จากการสำรวจเกี่ยวกับแผนด้านการใช้งาน Private Cloud ในภาพรวมจากกลุ่มตัวอย่าง 167 ราย ที่ตอบว่ามี Servers ใช้งานในองค์กรนั้น พบว่าจำนวน 47 รายหรือคิดเป็นร้อยละ 28 มีการใช้งาน Private Cloud อยู่แล้วในปัจจุบัน จำนวน 48 ราย หรือคิดเป็นร้อยละ 29 มีแผนการใช้ติดตั้งในอนาคต แต่ส่วนใหญ่ถึงร้อยละ 43 หรือ 72 ราย ยังไม่มีแผนงานด้าน Private Cloud แต่อย่างใด

Screenshot 2014-10-08 07.51.16

รูปที่ 1 แผนงานด้าน Private Cloud

ผลการสำรวจแผนงานด้าน Public Cloud ของหน่วยงานในประเทศไทย

ในปัจจุบันการใช้บริการ Cloud Computing ในประเทศไทย เริ่มแพร่หลายมากขึ้น โดยเฉพาะรูปแบบการบริการ Infrastructure as a Services (IaaS) และ Software as a Service (SaaS) ซึ่งในปัจจุบันมีจำนวนผู้ให้บริการ (Service Providers) ในประเทศจำนวนเพิ่มขึ้น แต่ในส่วนรูปแบบการบริการ Platform as a Service (PaaS) ยังไม่มีข้อมูลว่ามีผู้ให้บริการภายในประเทศ

ทั้งนี้จากการวิเคราะห์ผลสำรวจจากกลุ่มตัวอย่าง พบว่ามีหน่วยงานกว่า 81 หน่วยงาน หรือคิดเป็นสัดส่วนร้อยละ 45.76 มีแผนงานใช้บริการ Public Cloud โดยสามารถจำแนกรายละเอียดความต้องการใช้งานตามรูปแบบการให้บริการ Cloud Computing หรือ Cloud Service Models โดยสามารถสรุปผลสำรวจเกี่ยวกับความต้องการของหน่วยงานที่มีแผนการใช้บริการ Public Cloud ดังนี้

  • มีความต้องการใช้บริการรูปแบบ IaaS มากเป็นอันดับที่ 1 คิดเป็นสัดส่วนร้อยละ 66.67

  • มีความต้องการใช้บริการรูปแบบ SaaS มากเป็นอันดับที่ 2 คิดเป็นสัดส่วนร้อยละ 60.49

  • มีความต้องการใช้บริการรูปแบบ PaaS น้อยที่สุด คิดเป็นสัดส่วนเพียงร้อยละ 39.51

Screenshot 2014-10-08 07.54.08

รูปที่ 2 แผนงานด้าน Public Cloud

เมื่อสอบถามถึงประเภทของ Software ที่ต้องการใช้บริการ SaaS Public Cloud ทีมงานวิจัยพบว่า 5 อันดับแรกของ SaaS applications ที่หน่วยงานกลุ่มตัวอย่างต้องการใช้ มีดังนี้ โดยมีรายละเอียดแสดงในรูปที่ 3

อันดับที่ 1 ระบบ E-mail มีความต้องการใช้ร้อยละ 63.39

อันดับที่ 2 Desktop/Office อาทิเช่น Office 365 มีความต้องการใช้ร้อยละ 56.06

อันดับที่ 3 Storage อาทิเช่น Dropbox มีความต้องการใช้ร้อยละ 46.94

อันดับที่ 4 CRM มีความต้องการใช้ร้อยละ 30.61

อันดับที่ 5 ERP มีความต้องการใช้ร้อยละ 24.49

Screenshot 2014-10-08 07.56.49

รูปที่ 3 ประเภท Software ที่ต้องการใช้บริการ SaaS Public Cloud

ภาพรวมความพึงพอใจ เหตุผลการเลือกใช้ และปัญหาอุปสรรคเกี่ยวกับการใช้บริการ Cloud Computing ในประเทศไทย

เมื่อสอบถามกลุ่มตัวอย่างทั้งหมดถึงระดับความพึงพอใจในการใช้บริการ Cloud Computing ในภาพรวม โดยมีระดับความพึงพอใจตั้งแต่ระดับ 1 ถึง 5 (1 ไม่พึงพอใจที่สุด ถึง 5 พึงพอใจมากที่สุด) พบว่าระดับความพึงพอใจเฉลี่ยในการให้บริการ Cloud Computing ของหน่วยงานใประเทศไทยปัจจุบันอยู่ที่ระดับ 3.72 ซึ่งถือว่าหน่วยงานส่วนใหญ่มีความพึงพอในต่อการใช้บริการ

โดยเมื่อสำรวจถึงปัจจัยในการเลือกใช้บริการ Public Cloud ของหน่วยงานต่างๆ พบว่า เหตุผลหลักในการเลือกใช้บริการ Cloud Computing ที่มีสัดส่วนสูงที่สุด คือ พิจารณาจากข้อมูลด้านเทคนิคของผู้ให้บริการ อาทิเช่น ข้อมูล Data Center และ Bandwidth เป็นต้น ทั้งนี้ราคา รวมถึงรูปแบบราคาที่ยึดหยุ่นสอดคล้องกับขนาดธุรกิจ และ การพิจารณาจาก SLA ของผู้ให้บริการ ถือเป็นเหตุผลสำคัญอันดับที่สองในสัดส่วนที่เท่ากันในการพิจารณาเลือกใช้บริการ Cloud Computing โดยปัจจัยเลือกใช้อันดับที่ 3 คือ พิจารณาจากชื่อเสียงของผู้ให้บริการที่เป็นที่ยอมรับในระดับสากล ทั้งนี้ในส่วนของการพิจารณาเลือกใช้บริการ Cloud Computing จากการมีตัวแทนของผู้ให้บริการในประเทศไทย และจากคำแนะนำของที่ปรึกษาหรือแหล่งอ้างอิงอื่น ถือว่ามีความสำคัญแต่อยู่ในสัดส่วนที่ไม่สูงมากนัก

Screenshot 2014-10-08 07.59.07

รูปที่ 4 เหตุผลของหน่วยงานในการเลือกใช้บริการ Public Cloud

แต่อย่างไรก็ตามการใช้งานหรือใช้บริการ Cloud Computing ในประเทศไทยยังคงต้องก้าวข้ามอุปสรรคที่เผชิญอยู่หลายประการด้วยกัน ซึ่งจากผลการสำรวจความเห็นของกลุ่มตัวอย่างในประเด็นที่เกี่ยวกับอุปสรรคในการใช้ Cloud Computing พบว่า กลุ่มตัวอย่างถึงร้อยละ 70.62 เห็นว่าการใช้งาน Cloud Computing ยังมีความเสี่ยงด้านระบบความปลอดภัยต่างๆ อาทิเช่นเรื่องข้อมูล ร้อยละ 49.15 เห็นว่าการขาดบุคลากรที่มีความรู้ด้าน Cloud Computing ที่ดีพอ ยังเป็นอุปสรรคสำคัญ โดยร้อยละ 45.20 เห็นว่ากฎระเบียบของหน่วยงานและภาครัฐยังไม่เอื้อต่อการใช้งาน Cloud Computing ร้อยละ 33.90 เห็นว่ายังขาดความตระหนักและยังไม่เห็นประโยชน์ที่ชัดเจน ร้อยละ 31.64 ยังไม่มีงบประมาณในด้านดังกล่าว อีกทั้งร้อยละ 23.10 เห็นว่าการใช้งาน Cloud ในประเทศไทยยังขาดมาตรฐานอีกหลายๆด้าน และอีกร้อยละ 19.77 พบว่ายังไม่มีผู้ให้บริการที่สามารถให้บริการสอดคล้องกับความต้องการ

Screenshot 2014-10-08 08.01.47

รูปที่ 5 อุปสรรคของการใช้ Cloud Computing

นั้นคือบทสรุปคร่าวๆของผลสำรวจครั้งนี้ สนใจข้อมูลเพิ่มเติมติดต่อมาได้ที่ contact@imcinstitute.com

Big Data Analytics กับความต้องการ Data Scientist ตำแหน่งงานที่น่าสนใจในปัจจุบัน

ช่วงเดือนที่ผ่านมาผมมีโอกาสได้บรรยายและพูดคุยกับคนไอทีจำนวนมากเรื่อง Big Data  พอพูดถึงปัญหาเรื่องการขาดบุคลากรด้าน Data Scientist ดูเหมือนหลายๆคนไม่เข้าใจว่าตำแหน่งงานนี้ทำอะไร บ้างก็บอกว่าองค์กรมี Business Intelligence (BI) Analyst ที่เชี่ยวชาญอยู่แล้ว บ้างก็บอกว่าองค์กรมีโปรแกรมเมอร์ที่เก่งด้านการพัฒนาโปรแกรมอย่าง MapReduce บน Hadoop  อยู่มาก นั้นละคือ  Data Scientist พอเมื่อวันก่อนได้อ่านบทความของ ดร.อธิป อัศวานันท์ ผู้บริหารของ  True  และ รองประธานกรรมการธุรกิจเทคโนโลยีสารสนเทศและการสื่อสาร หอการค้าไทย เรื่อง “ความเข้าใจที่ผิดๆ เกี่ยวกับ Big Data และ Analytics (1)” ยิ่งทำให้เห็นสอดคล้องกับท่านว่า บ้านเรากำลังเข้าใจเรื่องนี้ผิดกันไปใหญ่

เพื่อความเข้าใจเกี่ยวกับงานทางด้าน Data Scientist  คงจะขอเริ่มจากความหมายของ  Big Data ซึ่งเคยให้ความหมายไปหลายครั้งว่า โลกในปัจจุบันกำลังเผชิญกับข้อมูลขนาดใหญ่ (Volume) หลากหลายรูปแบบ   (Variety)  ที่มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ดังนั้นการจะได้ประโยชน์จากข้อมูลแบบนี้จำเป็นจะต้องหาเครื่องมือใหม่ๆมาใช้งานเช่น  Hadoop, NoSQL หรือ  NewSQL ซึ่งการทำ Big Data ก็มีระดับของ Maturity  Level ดังแสดงในรูปที่ 1 ขึ้นอยู่กับว่าเราจะการนำข้อมูลมาใช้แบบใด โดยระดับต่้นๆก็จะเป็นการทำ  Business Monitor หรือขั้นต่อมาก็อาจเป็นการทำ Business Insight ที่ต้องใช้ BI ไปจนถึงระดับอย่าง Business Optimization  ที่ต้องมีการทำ  Analytics ดังนั้นการทำ  Big Data ในระดับต้นก็อาจไม่มีด้าน Analytic มากนักแต่ก็จะไม่ได้ประโยชน์จากข้อมูลเท่าที่ควร เพราะการคาดการณ์อนาคตได้จากข้อมูลมหาศาลคือความได้เปรียบเหนือคู่แข่ง

Screenshot 2014-10-05 19.36.35

รูปที่  1  Big Data Maturity Level  จากหนังสือ Big Data: Understanding How Data Powers Big Business 

คราวนี้ก็อาจเริ่มมีคำถามว่า Business Insight ที่ใช้ BI Analyst และ Business Optimization ที่ใช้ Data Scientist มีความต่างกันอย่างไร เพื่อความเข้าใจในการวิเคราะห์ทั้งสองส่วนนี้ลองพิจารณาดูรูปที่  2 เราจะเห็นว่าทั้งสองกรณีเป็นการวิเคราะห์ข้อมูล แต่กรณีของ  BI จะเป็นการวิเคราะห์ข้อมูลที่มีอยู่เพื่อมาดูสถานภาพปัจจุบันดูข้อมูลที่ผ่านมา อาจเอานักสถิติมาวิเคราะห์ข้อมูล เขียนกราฟในมิติต่างๆ เพื่อทำให้เราเข้าใจข้อมูลได้ดีขึ้นซึ่งก็จะมีประโยชน์ในระดับหนึ่ง แต่เมื่อพูดถึง  Data Scientist คือการวิเคราะห์ข้อมูลที่เป็นการคาดการณ์สิ่งที่น่าจะเกิดขึ้นจากข้อมูลในอดีตจำนวนมากที่มีอยู่เช่น การคาดการณ์สินค้าที่ผู้ใช้จะซื้อ การคาดการณ์การตลาด การพยากรณ์เหตุการณ์ต่างๆทางวิทยาศาสตร์ สิ่งเหล่านี้คือ Predictive Analytic  ที่ต้องการนักวิจัยทีมีความรู้ด้าน Algorithm อย่างเช่น Machine Learning  เป็นอย่างดี

Screenshot 2014-10-05 19.49.23

รูปที่  2  ความแตกต่างระหว่าง  BI และ Data Scientist จากหนังสือ Big Data: Understanding How Data Powers Big Business 

ผมเองเคยทำวิจัยปริญญาเอกและเขียนบทความเรื่อง Optimal Power Dispatch in Multinode Electricity Market Using Genetic Algorithm ซึ่งเป็นการคาดการณ์การผลิตไฟฟ้าโดยใช้ทฤษฎีอย่าง Genetic Algorithm ซึ่งต้องใช้โมเดลคณิตศาสตร์ในการคาดการณ์อนาคต ที่เป็นเรื่องค่อนข้างยาก แม้วันนี้ผมจะเป็นนักไอทีที่เล่นเครื่องมือ  Big Data หลายตัวไม่ว่าจะเป็น Hadoop  การพัฒนาโปรแกรมอย่าง Map Reduce,  Hive  หรือ Big  แต่ก็ไม่กล้าที่จะเรียกตัวเองว่าเป็น  Data Scientist เพราะแม้จะมีความรู้ด้าน Predictive Algorithm มาบ้างแต่ก็ล้ามือมานานและวันนี้ไม่ใช้คณิตศาสตร์มากแบบเดิมแล้ว

เพื่อให้เข้าใจเรื่องความแตกต่างเดี่ยวกับ  BI และ Data Scientist มากขึ้น ผมขอยกตัวอย่างในกรณีที่มีข้อมูลการขายของร้านบน E-Commerce ของเราอยู่ ถ้าเรามีคำถามอย่างเช่น

  • ยอดขายสินค้าเราในเดือน หรือไตรมาสที่ผ่านมาเป็นอย่างไร
  • ผู้ซื้อสินค้ามีอายุเฉลี่ยเท่าไร เพศอะไร
  • ผู้ที่เข้าเยี่ยมชมเว็บไซต์มีค่าเฉลี่ยการซื้อจริงเท่าไร

การวิเคราะห์ข้อมูลเหล่านี้คือ BI  เราอาจใช้นักสถิติมาวิเคราะห์ มาเขียนกราฟ หรือถ้าข้อมูลเป็นแบบ unstructure  ที่อยู่บน  Hadoop เราก็อาจให้  Programmer  เขียนโปรแกรม MapReduce  มาวิเคราะห์ได้

คราวนี้ถ้าคำถามเราเปลี่ยนไปเป็นแบบการคาดการณ์อนาคต อาทิเช่น

  • ผู้ซื้อคนนี้ควรจะซื้อสินค้าอะไรในอนาคต  (Next Thing to Buy)
  • เราควรสั่งสินค้าอะไรมาขายเพิ่มเติม
  • ยอดขายในไตรมาสหน้าน่าจะประมาณการเท่าไร

คำถามแบบนี้ คนที่เป็น BI หรือ Programmer ทั่วไป คงจะให้คำตอบไม่ได้ เพราะจะต้องถามว่าแล้วฉันจะรู้ได้อย่างไร  การจะหาคำตอบเหล่านี้ได้นี้คนที่จะวิเคราะห์ต้องมีความรู้ด้าน Predictive Analytic  หรือ  Machine Learning  ต้องรู้ว่าจะเอาข้อมูลอะไรมาวิเคราะห์และต้องใช้  Algorithm อะไร ซึ่งคนที่ไม่ได้ศึกษาทางด้านนี้ย่อมไม่เข้าใจและทำไม่ได้โดยง่าย

ปัจจุบันผมกำลังให้คำปรึกษานักศึกษาปริญญาโทคนหนึี่งเรื่องของ  Big Data Analytic  นอกจากให้ศึกษาการติดตั้ง Hadoop  การพัฒนาโปรแกรมอย่าง MapReduce หรือ Hive  แล้ว ผมต้องให้เขาศึกษา Machine Learning  และเครืองมืออย่าง  Apache Mahout  เพื่อที่จะทำ Predictive Analytic ในการคาดการณ์ข้อมูลในอนาคต และพอมาอ่านหนังสืออย่าง Mahout  ที่จะพูดถึงโมเดลทางคณิตศาสตร์ด้าน Classification อย่าง Hidden Markov Models  คนที่ล้างานวิจัยด้านคณิตศาสตร์อย่างผมมานานก็เริ่มงง

หลายๆท่านอาจแปลกใจว่า แล้วบริษัทใหญ่ๆทั่วโลก  เขาหา Data Scientist มาจากไหน ผลสำรวจของ  NewVantage Partner เมื่อปี2013 ก็ระบุว่าตำแหน่งนี้หายากมาก  6%  บอกว่าไม่มีทางที่จะหาได้ 60% บอกว่าหายากมาก และส่วนมากก็จะต้องหาคนที่จบปริญญาเอกด้านคณิตศาสตร์ หรืออาจต้องดึงตัวมาจากบริษัทใหญ่ๆอย่าง Facebook  หรือ Google  ดังนั้นจึงมีการบอกกันว่าตำแหน่งงาน  Data Scientist ในปัจจุบันเป็นงานที่ดีมากให้เงินเดือนสูงๆ และหาคนได้ยากมาก ผมเคยได้ยินว่าบริษัทอย่าง  Singtel ของสิงคโปร์หา  Data Scientist มาโดยการดึงคนจบปริญญาเอกด้านคณิตศาสตร์จากยุโรปตะวันออก

Screenshot 2014-10-05 20.21.57

รูปที่  3  Big Data Talent Survey

สุดท้ายหลายคนก็ตั้งคำถามว่า ถ้าเราไม่มี Data Scientist เราจะทำ Big Data ได้ไหม จริงๆเราก็คงทำได้ละครับในมุมของ Business Insight  แต่ถ้าจะเป็นมุมของ Analytic ที่ต้องการ  Predictive Analytic  ก็คงจะเหนื่อยหน่อยครับอาจต้องหาคนไปศึกษาโมเดลคณิตศาสตร์และ  Algorithm เหล่านี้ แต่ยังไงเราก็ควรต้องเริ่มต้น ผมเองวันนี้ก็เน้นในการจัดอบรมสร้่าง IT Prefessional  ด้าน Big Data โดยเน้นเทคโนโลยีอย่าง Hadoop และหวังว่าในอนาคตจะมี  Data Scientist ที่เก่งๆจำนวนมากขึ้น

ธนชาติ นุ่มนนท์

IMC Institute

ตุลาคม 2557

ความจำเป็นของการมีผู้ให้บริการ Cloud ในประเทศ และงาน Cloud Expo Asia 2014

cloudmgmt

เมื่อพูดถึง Cloud Service Provider คนก็จะนึกถึงผู้ให้บริการในต่างประเทศเจ้าใหญ่ๆอย่าง Amazon Web Services, Microsoft Azure, Google หรือ Dropbox แต่เราก็มักจะได้ยินคำถามบ่อยๆว่าแล้วผู้ให้บริการ Cloud ในประเทศเราละเมื่อไรจะมี บ้างก็ถามหาบริการเฉพาะด้านในประเทศบ้างเช่น Storage as a Service, Big Data as a Service หรือ Platform as a Service

จากคำถามดังกล่าวทำให้น่าสนใจที่จะหาคำตอบว่า แล้วเราจะต้องมีผู้ให้บริการ Cloud ในประเทศหรือไม่ เราลองมาพิจารณาดูตัวอย่างผู้ให้บริการ Cloud หลักๆในต่างประเทศก่อนว่ามีบริการและราคาเป็นอย่างไรบ้าง

  • Amazon Web Services (AWS) แน่นอนเมื่อพูดถึง AWS เราจะนึกถึงภาพของผู้ให้บริการ IaaS รายใหญ่ที่สุด มีจำนวน Servers ถึง 4-5 แสนเครื่อง มีบริการที่หลากหลายตั้งแต่ Server, Storage, Database หรือแม้กระทั่ง Big Data อย่าง Hadoop จากจำนวน Server ที่มีอยู่ทำให้ผู้ใช้สามารถใช้งานในจำนวนที่ไม่จำกัดและราคาค่อนข้างคุ้มค่า นอกจากนี้ก็ยังมีลูกค้าจำนวนมาก บางรายก็ใช้ Infrastructure ของ  AWS เพื่อสร้างบริการ Cloud Services อื่นอย่างเช่น Dropbox  ใช้บริการ  S3 ของ  AWS  โมเดลธุรกิจของ AWS  เริ่มตั้งแต่ให้บริการฟรีแบบ Trial  เป็นเวลาหนึ่งปี ไปจนถึงการเช่า VM ทั้งที่เป็น public หรือ private จำนวนมาก
  • Digital Ocean เป็น Cloud Provider  ที่อยู่ใน New York ที่ให้บริการ IaaS ในราคาที่ถูกซึ่งเราสามารถที่จะจ่ายค่า  Server  ขนาด  2Core, 2GB Memory และ 3GB SSD Disk ด้วยราคาเพียง $20 ต่อเดือน ซึ่งในปัจจุบัน Digital Ocean มี Data Center  หลายๆแห่งทั่วโลกทั้งใน  Amsterdam, London หรือใน Singapore และเป็นบริษัทที่ให้บริการ IaaS ที่โตที่สุดในโลกรายหนึ่ง ล่าสุดทาง Netcraft  ระบุว่าจำนวนผู้ใช้  Web Facing Server ของ  Digital Ocean มีจำนวนสูงถึงอันดับ  5  ในโลกแซงหน้าบริษัทอย่าง Rackspace  ไปแล้ว
  • Dropbox  ถ้าเรานึกถึงผู้ให้บริการ  Storage as a Service  เราจะนึกถึงผู้ให้บริการอย่าง  Dropbox  ซึ่งมีโมเดลการให้บริการแบบฟรีสำหรับผู้ใช่้  2-5 GB และก็เพิ่มค่าใช้จ่ายเมื่อต้องการพื้นที่มากขึ้น แม้ Dropbox จะไม่มี  Infrastructure ของตัวเอง แต่ด้วยโมเดลธุรกิจและซอฟต์แวร์ที่มีผู้ใช้ทั่วโลกในหลากหลาย Platform ก็ทำให้ Dropbox  สามารถสู้กับคู่แข่งยักษ์ใหญ่อย่าง  Google Drive หรือ OneDrive  ของ Microsoft  ได้ ล่าสุดด้วยจำนวนผู้ใช้จำนวนมากและการมีคู่แข่งที่มากขึ้นทำให้ Dropbox  สามารถตัดราคามาเหลือเพียง  $100 ต่อปีสำหรับ เนื้อที่ถึง  1TB
  • Azure, SalesForce, Google, OpenShift ยังมีผู้ให้บริการ Cloud ในต่างประเทศอีกจำนวนมากที่ให้บริการ Cloud ที่หลากหลายในราคาถูก อาทิเช่น  Azure  ที่มีบริการทั้ง  PaaS  อย่าง  SQL as a Service, IaaS หรือบริการเฉพาะด้านอย่าง  Big Data as a Service หรือผู้ให้บริการอย่าง SalesForce.com ที่ให้บริการ SaaS อย่าง Sales CRM หรือ PaaS อย่าง Force.com

จากที่ยกตัวอย่างมาทั้งหมดเราจะเห็นว่าผู้ให้บริการ Cloud  ในต่างประเทศอาจมีจุดแข็งต่างๆดังนี้

  • มี Infrastructure ขนาดใหญ่และมี Data Center หลายๆแห่งทำให้มีระบบที่เสถียร
  • มีจำนวนลูกค้าจำนวนมาก ทำให้มี Economy of Scale สามารถให้บริการได้ถูกกว่าคู่แข่งรายอื่นๆ
  • มีบริการที่หลากหลาย มีระบบ APIs ที่ดีทำให้ลูกค้าสามารถต่อยอดการใช้งานโดยง่าย
  • มีประสบการณ์ในการทำงาน และมีทีมวิศวกรและนักพัฒนาจำนวนมากที่มีความสามารถ

แต่ปัญหาที่เรามักจะเจอกับการใช้บริการของผู้ให้บริการ Cloud ต่างประเทศก็คือ

  • การขาดตัวแทนในประเทศทำให้การสนับสนุนเชิงเทคนิคบางด้านไม่สามารถทำได้ตามความต้องการของลูกค้าได้
  • ขาดความยืดหยุ่น ยากที่จะการ  Customize  ให้ตรงกับความต้องการของลูกค้า
  • การจ่ายค่าบริการบางรายต้องชำระโดยตรงไปยังต่างประเทศ ทำให้ลูกค้าในบ้านเราไม่สามารถนำมาหักเป็นค่าใช้จ่ายในการเสียภาษีได้
  • ผู้ให้บริการต่างประเทศจะให้ความสนใจกับลูกค้าไทยน่้อยเนื่องจากจำนวนการใช้เราไม่มากพอ

เมื่อเจอปัญหาต่างๆเหล่านี้ โดยเฉพาะหน่วยงานใหญ่ๆและภาคราชการที่จะพบว่าการใช้บริการ  Cloud Computing ของต่างประเทศจะมีอุปสรรคที่อาจขัดต่อกฎระเบียบในการทำงาน จึงเริ่มมีการถามหาผู้ให้บริการในประเทศที่อาจสนับสนุนลูกค้าได้ดีกว่า แต่ปัญหาของการเป็นผู้ให้บริการในประเทศจะเจออุปสรรคต่างๆบางประการดังนี้

  • Economy of Scale  มีไม่เพียงพอ ถ้าผู้ให้บริการ Cloud  จะมุ่งให้บริการเพียงในประเทศจำนวนลูกค้าจะมีไม่มากพอ จะทำให้ไม่สามารถแข่งขันเรื่องราคากับต่างประเทศได้ ดังนั้นถ้าจะเปิดบริการในประเทศคงต้องเน้นในตลาดที่กว้างขึ้นอย่างตลาด  ASEAN หรือมุ่งไปทั่วโลก เพราะ Cloud ไม่เน้นเรื่องตำแหน่งที่ตั้งอยู่แล้ว แต่ข้อสำคัญคือการจะเป็น Cloud Provider  ที่จะไปแข่งต่างประเทศได้คงต้องเน้นตลาดเฉพาะทาง ซึ่งอาจไม่ใช่แค่ IaaS หรือ PaaS แบบพื้นฐาน แต่อาจต้องมีจุดเด่นเฉพาะที่ต้องให้บริการต่างกับรายอื่นๆ ที่เราสามารถตั้งราคาที่สูงได้
  • Infrastructure ที่ยังไม่พร้อม ประเทศเรายังเป็นผู้นำเข้า Server  และจำนวนที่นำเข้าในแต่ละ Data Center จะมีไม่มากนัก ดังนั้นการทำ IaaS ในบ้านเราก็คือการนำเข้า  Server ที่ราคาย่อมสูงกว่าผู้ให้บริการรายใหญ่ๆอย่าง AWS  ที่เขาซื้อและผลิต  Server  มาเป็นแสนๆตัว ต้นทุนของเขาก็ย่อมถูกกว่า อีกอย่างโครงสร้างพื้นฐานในบ้านเรายังไม่พร้อมที่ทำ Data Center ขนาดใหญ่ และถ้าจะทำต้นทุนเราจะสูงกว่ามาก ดังนั้นการทำ IaaS ในบ้านเราก็คือการซื้อสินค้าจากต่างประเทศเพื่อมาขายต่อที่ไม่สามารถทำราคาได้ถูกกว่าเขา แม้เราอาจได้  Knowhow เพียงเล็กน้อย แต่ถ้าต้องการทำจริงจังในระยะยาวคงต้องมีการทำ R&D ด้่่่านนี้ที่มากกว่านี้มาก
  • ขาดบุคลากร  การจะเป็นผู้ให้บริการ  Cloud  ที่จะแข่งกับต่างประเทศได้ เราต้องมีบุคลากรที่มีความเชียวชาญเฉพาะ เช่นถ้าเราคิดว่าจะเป็นผู้ให้บริการ  Big Data as a Service  เราต้องมีบุคลากรทางนี้ โดยเราอาจไม่จำเป็นต้องที  Infrastructure ในการให่้บริการ Big Data  เอง เราสามารถที่จะไปพึ่ง IaaS  ของต่างประเทศอย่าง AWS หรือ Google แต่สิ่งสำคัญคือบุคลากรที่มีความเก่งและมีจุดเด่นที่ทำให้เราแข่งขันได้ แล้วเราก็จะสร้างบริการ  Cloud เฉพาะด้านแข่งกับต่างประเทศได้
  • Bandwidth เชื่อมต่อต่างประเทศต่ำ อย่างที่บอกตอนต้นถ้าเราคิดจะเป็นผู้ให้บริการ  Cloud  เราต้องมุ่งตลาดในต่างประเทศ เราถึงจะได้ Economy of Scale แต่อุปสรรคสำคัญคือ Bandwidth  เชื่อมต่อไปยังต่างประเทศเรายังไม่ดีพอ ดังนั้นการที่จะเป็นผู้ให้บริการที่ต้องใช้ Infrastructure ที่ตั้งอยู่ในประเทศอาจเป็นเรื่องยาก
  • ขาดการทราบความต้องการของผู้ใช้ที่ชัดเจน ผู้ให้บริการ Cloud ทีต้องสร้าง Infrastructure ต้องทำหน้าที่เหมือนผู้ผลิตไฟฟ้า ต้องพยากรณ์ความต้องการของผู้ใช้ในระยะเวลา 2-3  ปีข้างหน้าได้อย่างชัดเจน จะได้ลงทุนด้าน Server  และ Infrastructure  ได้อย่างเหมาะสม และเพียงพอต่อความต้องการของผู้ใช้ แต่ปัจจุบันเราขาดข้อมูลทางด้านนี้ และยากที่จะคาดการณ์ของต้องการของผู้ใช้ทั้งในและต่างประเทศ

แต่ที่กล่าวมาทั้งหมดนี้ ไม่ได้หมายความว่า เราไม่ควรมีผู้ให้บริการ  Cloud Computing ในประเทศ แม้เราจะสู้เรื่องราคา โครงสร้างพื้นฐาน และบุคลากรไม่ได้ แต่เรายังมีความจำเป็นที่จะต้่องมีผู้ให้บริการ  IaaS หรือ PaaS ในประเทศด้วยเหตุผลต่างๆดังนี้

  • ความปลอดภัยและความมั่นคง หน่วยงานหลายๆแห่งอาจไม่เหมาะที่ไปใช้บริการของต่างประเทศ เพราะการนำข้อมูลบางอย่างไปไว้ในต่างประเทศอาจขัดกฎระเบียบและมีความเสี่ยงต่อความมั่นคง
  • การให้บริการกับหน่วยงานเฉพาะ เช่นภาคราชการ
  • การให้สนับสนุนทางด้านเทคนิคและการให้บริการลูกค้าที่ดีกว่า
  • การพัฒนาบุคลากรและการสร้างการเรียนรู้ทางด้าน Cloud Computing โดยเฉพาะในด้าน R&D  ระยะยาว
  • การให้บริการที่มีความยืดหยุ่นต้องการ  Customize  ให้กับลูกค้า
  • Bandwidth ที่รวดเร็วกว่าถ้า Infrastructure  อยู่ในประเทศ

แต่ที่กล่าวมาทั้งหมด ยังไม่ได้เน้นเรื่องของ SaaS การเป็นผู้ให้บริการ SaaS  เราสามารถแข่งขันได้อย่างแน่นอน โดยเฉพาะความเป็น  Localization หรือซอฟต์แวร์ที่เราสามารถเปิดให้บริการทั่วโลกได้ ในปัจจุบันบริษัทซอฟต์แวร์ไทยหลายๆรายก็เปิดให้บริการ  SaaS  โดยที่อาจไม่จำเป็นต้องใช้ Infrastructure ที่อยู่ในประเทศ

Cloud Expo Asia 2014

cloudexpo

สุดท้ายนี้ผมขอพูดถึงงาน  Cloud Expo Asia  ซักหน่อยหนึ่งเพราะปีที่แล้วผมไปงานนี้ และพบว่าเป็นงาน Cloud computing  ที่น่าสนใจ และน่าจะเป็นงาน Cloud ที่ใหญ่ที่สุดในเอเซีย ที่เราจะได้พบกับผู้ให้บริการ Cloud จากทั่วโลกทั้งที่เป็น IaaS, PaaS, SaaS รวมถึงผู้ผลิต  Cloud Infrastructure และยังมีหัวข้อในการบรรยายที่น่าสนใจในหลายๆด้าน ทั้งเรื่องของ Infrastructure, Virtualization, Security, PaaS, Cloud Management หรือ Big Data  โดยสามารถที่จะดูโปรแกรมการสัมมนาได้ที่

งาน Cloud Expo Asia ปีนี้จัดขึ้นคู่กับงาน Data Center World  ในวันที่  29-30 ตุลาคมที่  Suntec Exhibition Centre ประเทศ Singapore  ทาง IMC Institute ได้จัดอบรมหลักสูตร Cloud Computing  for Senior Management ในวันที่ 14-16  ตุลาคม และมีการพาไปดูงาน Cloud Expo Asia  ในวันที่ 28-30 ตุลาคม โดยนอกจากไปงานนี้แล้วยังพาไปเยี่ยมชมบริษัททางด้าน  Cloud Computing อย่าง  Amazon Web Services, Oracle, Microsoft และ VMWare  ในกรณีที่มีผู้สนใจต้องการไปดูงานอย่างเดียวก็สามารถทำได้ สำหรับรายละเอียดโปรแกรมหลักสูตรนี้ สามารถดูได้ที่

สำหรับโปรแกรมการดูงานโดยละเอียดมีดังนี้

28  ตุลาคม:

  • 8.00  น. เดินทางไป Singapore สายการบิน  Thai Airways เที่ยวบิน  TG403 (08:00-11:15)
  • 12.30  น. Check-in ที่โรงแรม Ibis Singapore On Bencoolen หรือเทียบเท่า และรับประทานอาหารเที่ยง
  • 14.00 น. เยี่ยมชมบริษัท Amazon Web Services
  • 16.30 น. เยี่ยมชม Oracle Solution Center เพื่อดูเรื่อง Private Cloud/Virtualization
  • 18.00 น. รับประทานอาหารเย็นบริเวณ  Suntec City Mall

29 ตุลาคม:

  • 9.00 – 16.00 น. เข้าชมงานและฟังสัมมนางาน Cloud Asia Expo 2014 ที่ SunTec Exhibition Center
  • 18.00 น. รับประทานอาหารเย็น ถนน Orchard

30 ตุลาคม:

  • 9.00 น. เยี่ยมชม Microsoft Technology Center
  • 13.00 น. ดูงานกับบริษัท VMWare  หรือ บริษัทด้าน Cloud  อื่นๆ
  • 18:15  น.  เดินทางกลับ  สายการบิน  Thai Airways เที่ยวบิน   TG408  (18:15-19:35)

Digital Economy กับการปฎิรูปประเทศไทย

ช่วงอาทิตย์ที่ผ่านมามีผู้ใหญ่บางท่านและเพื่อนในวงการไอทีถามถึงแนวคิดของผมในเรื่องของการปฎิรูปประเทศไทยว่าอยากเห็นการเปลี่ยนแปลงอะไรโดยเฉพาะเรืองของไอที และยิ่งเมื่อต้นสัปดาห์นี้รัฐบาลโดยการแถลงของนายกรัฐมนตรีและรองนายกฯมรว.ปรีดิยาธร เทวกุล ออกมาจุดกระแสเรื่องของ Digital Economy ก็ทำให้กระแสการปฎิรูปด้านไอซีทีที่จะมีผลต่อการผลักดันการปฎิรูปเศรษฐกิจและสังคมของประเทศมีความร้อนแรงยิ่งขึ้น

แม้ยังไม่มีข้อสรุปแน่ชัดว่าแผนงาน  Digtal Economy จะมีอะไรบ้าง แต่ภาพที่เริ่มเห็นคือการปรับโครงสร้างกระทวงไอซีทีและเปลี่ยนชื่อให้เป็นกระทรวงเศรษฐกิจดิจิทัล และก็มีภาพกราฟฟิกของนสพ. Post Today ที่ลงตีิพิมพ์เมื่อวันอังคารที่ผ่านมาระบุโครงการต่างๆดังรูป

DigitalEconomy

รูปที่ 1 ยุทธศาสตร์ Digital Economy [ภาพจากหนังสือพิมพ์ Post Today]

ยุทธศาสตร์  Digital Economy เป็นเรื่องทีดีมาก และถ้ารัฐบาลผลักดัันอย่างจริงจัง ไม่ใช่สร้างมาเป็น Propaganda เหมือนรัฐบาลยุคเลือกตั้งที่ผ่านๆมาซึ่งจะสรรหาคำสวยงามมาประกอบนโยบายเช่น Naional Broadband หรือ  Smart Thailand  แต่ก็ไม่ได้ดำเนินงานและจัดสรรงบประมาณอย่างจริงจัง ยังจำได้ว่าเมื่อมีการปฎิรูประบบราชการครั้งใหญ่รัฐบาลทักษิณได้จัดตั้งกระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร (ไอซีที) แต่เมื่อมีการโยกย้ายหน่วยงานต่างๆและเห็นภาระกิจที่แท้จริงแล้ว การจัดตั้งกระทรวงไอซีทีในตอนนั้นก็เป็นแค่การทำภาระกิจชั่วคราวเพื่อผลประโยชน์ส่วนตัว ความไม่จริงจังในตอนนั้นจึงทำให้กระทรวงไอซีทีในวันนี้ไม่สามารถดำเนินงานต่างๆได้อย่างที่ควรจะเป็นทั้งนี้เพราะขาดบุคลากร อำนาจหน้าที่ และโครงสร้างที่เหมาะสม

ครั้งนี้เป็นโอกาสอันดีเพราะเรากำลังพูดถึงการปฎิรูปประเทศ และรัฐบาลมีอำนาจเบ็ดเสร็จ ผมจำได้ว่าตั้งแต่เด็กมาจนปัจจุบัน เคยเห็นโครงการใหญ่ๆเพียงโครงการเดียวที่ผลักดันจนประสบความสำเร็จคือโครงการ  Eastern Seaboard  ในสมัยพลเอกเปรม ติณสูลานนท์ เป็นนายกรัฐมนตรี ส่วนหนึ่งก็เป็นเพราะว่ายุคนั้นเป็นยุคประชาธิปไตยครึ่งใบ ทำให้ไม่จำเป็นต้องเกรงใจนักการเมืองมากนัก และอีกอย่างผู้นำสมัยนั้นมีความเด็ดขาด

สถานการณ์ในวันนี้คล้ายๆกับยุคนั้นแม้รัฐบาลจะตั้งเป้าที่จะปฎิรูปประเทศในระยะเวลาเพียงหนึ่งปี แต่การปฎิรูปประเทศสู่เศรษฐกิจเชิงดิิจิทัลอาจต้องทำหลายประการดังนี้ ซึ่งบางเรื่องก็น่าจะอยู่ในแผนของทีมงานแล้ว แต่ผมขอนำเสนอความคิดดังนี้

1) การปรับปรุงโครงสร้างพื้นฐานเชิงดิจิทัล

การปฎิรูปอุตสาหกรรมของสหรัฐอเมริกาส่วนหนึ่งเริ่มต้นจากการสร้างถนนและทางคมนาคมครั้งใหญ่ของประเทศเขาเมื่อร้อยกว่าปีก่อน เมื่อพูดถึง  Digital Economy เรากำลังขนส่งข้อมูลจำนวนมากโดยสื่อสารผ่านระบบอินเตอร์เน็ต เราจึงจำเป็นต้องมีโครงข่ายอินเตอร์เน็ตความเร็วสูงที่ดีเชื่อมต่อกันทุกพื้นที่ High Speed Broadband ก็เปรียบเสมือนถนน Highway ที่จำเป็นต้องเข้าถึง ทุกตำบล ทุกหมู่บ้าน ถ้าเราไม่มีถนนแล้วอุปกรณ์คอมพิวเตอร์ต่างๆที่เปรียบเสมือนยานพาหนะจะเคลื่อนที่ด้วยความรวดเร็วได้อย่างไร อีกเรื่องที่สำคัญคือการขยายการเชื่อมต่อข้อมูลผ่านระบบ 4G ที่ควรจะต้องเร่งให้สัมปทานและอาจต้องรีบเตรียมการให้รองรับเทคโนโลยีที่จะเกิดใหม่อย่าง  5G ด้วยความรวดเร็ว ไม่ใช่รอให้ล้าหลังประเทศอื่นๆอย่างการให้สัมปทาน  3G หรือ  4G เหมือนที่ผ่านมา

การตั้งหน่วยงาน  Broadband  แห่งชาติ อาจจะยังไม่สำคัญเท่ากับการวาง  Blueprint ด้านเครือข่าย  Broadband รวมถึงการผลักดันให้เกิดการแข่งขันอย่างเสรีและเป็นธรรมของภาคเอกชนในการให้บริการ  Highspeed Broadband กับภาคประชาชนอย่างทั่วถึง การให้บริการของภาครัฐเพื่อเปิดให้ประชาชนผู้มีรายได้น้อยเข้าถึง Highspeed Broadband  ซึ่งจะช่วยลดช่องว่างเชิงดิจิทัล และการลดความซ้ำซ้อนของการสร้างเครือข่ายของหน่วยภาครัฐและภาคเอกชน ซึ่งจะทำให้เราได้เครื่อข่ายที่มีคุณภาพและประหยัดการลงทุน

2)  การสร้าง  Digital Mindset  ให้กับสังคม

ในปัจจุบันคนไทยจำนวนมากใช้เทคโนโลยีดิจิทัลทั้งการเล่น Facebook, Smartphone  และ Tablet แต่สิ่งที่พบคือส่วนมากใช้เพื่อความบันเทิง ไม่ได้ถูกนำใช้ในด้านการทำงานมากนัก การทำธุรกิจโดยมากยังอยู่บนพื้นฐานแบบเดิม ยังขาดความตระหนักการนำเทคโนโลยีดิจิทัลมาใช้ เรายังพบว่าธุรกิจด้านต่างๆจำนวนมากไม่สามารถแข่งขันบนโลกออกไลน์ได้ คนไทยจำนวนมากยังไม่กล้าที่จะทำธุรกรรมออนไลน์ ยังขาดความสามารถในการติดต่อสื่อสารเชิงดิจิทัล ทักษะการค้นคว้าและกลั่นกรองข้อมูลทางอินเตอร์เน็ตยังไม่ดีพอ ทำให้เราจะแข่งขันเชิงธุรกิจไร้พรมแดนผ่านโลกดิจิทัลลำบาก

ดังนั้นจึงจำเป็นอย่างยิ่งที่จะต้องสร้างความตระหนักการในการใช้เทคโนโลยีดิจิทัล ให้กับภาคส่วนต่างๆทั้งภาคธุรกิจ ราชการ  รวมทังอุตสาหกรรมต่างๆทั้ง เกษตรกรรม การท่องเที่ยว การขนส่ง เพื่อให้ประเทศเข้าสู่ Digital Economy เมืื่อผู้คนในสังคมมีความตระหนักด้านดิจิทัลเราก็จะเห็นการใช้ข้อมูลออนไลน์ต่างๆมากขึ้น สังคมและธรกิจก็จะเข้าสู่การเป็น Digital Economy มากขึ้น และเราอาจจะเห็นเศรษฐกิจก้าวเข้าสู่ Real-Time Economy ซึ่งเป็นคำที่ทันสมัยกว่าและสอดคล้องกับปัจจุบันมากกว่าคำว่า  Digital Economy

3) การพัฒนาบุคลากรและงานวิจัยด้านไอซีที

การพัฒนา Digital Economy ที่ดีจะต้องมีพื้นฐานของงานวิจัยและพัฒนาทางด้านไอซีืีที ที่ผ่านมาเรามีงานวิจัยทางด้านนี้น้อยมาก เรายังต้องพึ่งพาการนำเข้าจากประเทศทั้งทางด้าน Hardware, Communication  และ  Software อยู่มาก ตัวอย่างเช่นเราขาดบุคลากรทางการพัฒนาด้านซอฟต์แวร์ การผลิตบุคลากรก็ไม่ตรงกับการเปลี่ยนแปลงของเทคโนโลยีและความต้องการของภาคอุตสาหกรรม การพัฒนาอุตสาหกรรมซอฟต์แวร์จะต้องอยู่บนพื้นฐานของความเป็นจริง เราคงไม่ต้องไปคาดหวังว่าอุตสาหกรรมทางด้านนี้เราจะไปแข่งในระดับโลก เพราะยังไงเสียก็ตามเราคงแข่งขันในระยะสั้น 5-10 ปีลำบากเพราะเราขาดบุคลากร แต่สิ่งที่เราต้องทำในระยะสั้นคิอต้องพัฒนาให้มีการใช้ซอฟต์แวร์ที่ผลิตภายในประเทศได้บ้างรวมถึงอาจต้องทำให้การนำเข้านักพัฒนาซอฟต์แวร์จากต่างประเทศเป็นไปได้ง่ายขึ้น พยายามผลักดันให้ประเทศไทยเป็นศูนย์กลางของนักพัฒนาซอฟต์แวร์ทั่วโลกที่จะเข้ามาทำงาน และระยะยาวก็คงต้องเร่งพัฒนาบุคลากรทางด้านนี้ โดยเฉพาะเน้นการปฎิรูปการศึกษาให้เยาวชนไทยมีความสามารถทางด้านวิทยาศาสตร์และเทคโนโลยีมากขึ้น

4) การปฎิรูปกฎหมายด้านดิจิทัล

กฎระเบียบหลายๆอย่างของบ้านเรายังไม่เอื้อต่อการเป็น Digtial Economy การติดต่อราชการหลายๆเรื่องเราต้องใช้เอกสารจำนวนมาก ถึงแม้ว่าบ้านเราเป็นประเทศแรกๆในโลกที่ใช้บัตรประชาชนที่เป็น smartcard แต่การทำธุรกรรมในหน่วยงานต่างๆยังต้องมีการทำสำเนาบัตรประชาชน ในแง่การจัดซื้อจัดจ้างหรือการทำนิติกรรมต่างๆยังมีกฎระเบียบที่ค่อนข้างล้าหลังอ้างอิงกับรูปแบบเดิมๆที่ต้องใช้หลักฐานจำนวนมากในรูปแบบที่เป็นกระดาษและสำเนาซึ่งไม่เอื้อต่อการทำธุรกรรมออนไลน์

กฎหมายที่เกี่ยวข้องกับงานด้านดิจิทัลจำนวนมากยังไม่ผ่านสภาฯไม่ว่าจะเป็นกฎหมายด้านลายเซ็นดิจิทัล กฎหมายคุ้มครองสิทธิส่วนบุคคล กฎหมายพาณิชย์อิเล็กทรอนิกส์ที่ทันสมัย กฎหมายคอมพิวเตอร์ต่างๆ ซึ่งในปัจจุบันเรามีกฎหมายเหล่านี้หลายร้อยฉบับที่จะต้องทำการปรับปรุงเปลี่ยนแปลง  นอกจากนี้ถ้าเราต้องการเข้าสู่  Real Time Economy อย่างเต็มรูปแบบเราอาจต้องแก้แม้กระทั่งกฎหมายแรงงานที่ครอบคลุมให้ลูกจ้าง สามารถทำงานแบบออนไลน์ หรือทำงานที่บ้านได้ โดยได้รับความเป็นธรรมจากนายจ้าง

5) การผลักดันให้เกิดกฎหมาย Open Data

อีกประเด็นที่สำคัญคือการผลักดันให้เกิดเรื่อง Open Data ทีเป็นการเปิดข้อมูล (และ Information) ของรัฐบาล องค์กรสาธารณะต่างๆ และหน่วยงานเอกชนที่ไม่ใช่ข้อมูลส่วนบุคคลของประชาขน ในรูปแบบที่เป็นมาตรฐานเปิด (Open Format) ไม่ใช่มาตรฐานเฉพาะ (Proprietary format) เพื่อคนหรือหรือเครื่องคอมพิวเตอร์อ่านได้ แล้วนำไปใช้หรือต่อยอดในการพัฒนาข้อมูลอื่นๆต่อไปได้ การเปิดข้อมูลจะเป็นการลดอุปสรรคในการเข้าถึงข้อมูลของภาคประชาชนและยังช่วยทำให้เกิดการนำไปใช้ในด้านอื่นๆที่มีประโยชน์ต่อไป

การมี Open Data โดยเฉพาะในภาครัฐบาลนอกเหนือจากการสร้างความโปร่งใสและทำให้เกิดธรรมาภิบาลในการบริหารงานภาครัฐ เพราะข้อมูลของภาครัฐในด้านต่างๆเช่น การจัดซื้อจัดจ้าง การใช้จ่ายเงินงบประมาณ ถูกเปิดเผยออกมาแล้ว ยังทำให้เกิดประโยชน์ในด้านอื่นๆอีกเช่นการช่วยทำให้บริการของรัฐดีขึ้นอาทิเช่น การเปิดเผยข้อมูลจราจรทำให้เกิดบริการสาธารณะที่ดีขึ้นรวมถึงทำเกิดธุรกิจต่างๆขึ้นมากมายและเป็นประโยชน์ต่อสังคม ดังนั้นเรื่องสำคัญในการปฎิรูปประเทศให้สู่เศรษฐกิจเชิงดิจิทัลก็คือ การผลักดันกฎหมาย  Open Data โดยการอิงหลัก 8 ประการตามที่ผมเคยเสนอไว้ในบทความ Open Government Data กับการปฎิรูปประเทศไทย

6)  การปฎิรูปหน่วยงานภาครัฐด้านไอซีที

หน่วยงานทางด้านไอซีทีของภาครัฐยังขาดความพร้อมทั้งในแง่ของบุคลากรและอำนาจหน้าที่ที่จะมากำกับหน่วยงานอื่นๆ นอกจากนี้ยังขาดความชัดเจนของบทบาทหน้าที่ และบางหน่วยงานก็มีหน้าที่ซ้ำซ้อนกัน เรามีทั้งองค์กรอิสระที่เป็นผู้ดูแลกำกับโครงสร้างด้านอินเตอร์เน็ตและโทรคมนาคมอย่าง กสทช แต่ขณะเดียวกันกระทรวงไอซีทีก็มีบางภารกิจบางอย่างที่ใกล้เคียงหรือซ้ำซ้อนกัน เรามีหน่วยงานในกำกับที่เป็นองค์กรมหาชนภายใต้กระทรวงไอซีทีหลายหน่วยงานอย่าง สำนักงานส่งเสริมอุตสาหกรรมซอฟต์แวร์แห่งชาติ (SIPA) สำนักงานรัฐบาลอิเล็กทรอนิกส์ (EGA) แต่บางครั้งหน่วยงานเหล่านี้เช่น  EGA กลับไม่มีอำนาจหน้าที่โดยตรงที่เข้าไปกำกับดูแล e-Service ของหน่วยงานรัฐอื่นๆ ทำให้การบริการอิเล็กทรอนิกส์ภาครัฐยังขาดทิศทางที่สอดคล้องกัน หรือบางหน่วยงานอย่าง  SIPA ก็มีปัญหาภายในที่ไม่รู้จบทำให้อุตสาหกรรมไม่สามารถคาดหวังอะไรได้

หน่วยงานด้านไอซีทีก็ย้งอยู่ข้ามกระทรวงต่างๆเช่นกระทรวงวิทยาศาสตร์และเทคโนโลยีก็มีหน่วยงานอย่าง NECTEC ที่น่าจะมีการบูรณาการบางภารกิจมาอยู่ใต้กระทรวงใหม่ หรือแม้แต่หน่วยงานอย่าง Software  Park ซึ่งไม่มีงบประมาณจัดสรรมาดำเนินงานใดๆโดยตรงก็ควรจะมีการทบทวนบทบาทบทบาทและหน้าที่ว่าควรจะจัดสรรงบประมาณให้โดยตรงหรือไม่ หรือควรจะอยู่ในสังกัดใด  ยังไม่รวมถึงหน่วยงานอื่นๆที่จะมีผลต่อการปฎิรูปเศรษฐกิจดิจิทัลทั้ง กรมส่งเสริมอุตสาหกรรม สสว. กระทรวงพาณิชย์ กระทรวงการคลัง กระทรวงเกษตรและสหกรณ์ และหน่วยงานอื่นๆอีกเป็นจำนวนมากที่อาจจะต้องมีการจัดภารกิจใหม่ให้สอดคล้องกัน หรืออาจต้องมีการตั้งหน่วยงานภายใต้กระทรวงที่จะเกิดมาใหม่

บทสรุป

จากที่กล่าวมาทั้งหมดคือแนวคิดบางประเด็นของผมต่อการปฎิรูปประเทศ และเป็นสิ่งที่ควรจะทำได้ภายในหนึ่งปี โอกาสนี้เป็นโอกาสดีของประเทศที่จะทำให้เกิดรูปธรรมที่ชัดเจน แต่สิ่งที่สำคัญยิ่งกว่าคือการดำรงไว้ซึ่งหลักการและแนวคิดของ Digital Economy ถ้ารัฐบาลตั้งเป้่าไว้ว่าจะอยู่เพียงหนึ่งปีคงจะเป็นเรื่องยาก ดังนั้นหลังปฎิรูปเสร็จรัฐบาลควรที่จะรักษาอำนาจและทำงานต่ออีกซักพัก เพื่อให้บรรลุถึงเป้าหมายมิฉะนั้นแล้วการปฎิรูปจะสูญเปล่า เราอาจเห็นแค่การตั้งกระทรวง  Digital Economy  ขึ้นมาแค่นามธรรมแต่สุดท้ายการปฎิบัติก็จะไม่บรรลุตามวัตถุประสงค์

สุดท้ายคำว่า Digital Economy  หรือคำว่า Real-time Economy มันก็คือ  New Economy เรากำลังปฎิรูปเศรษฐกิจใหม่ให้กับคนรุ่นใหม่ สิ่งที่สำคัญที่สุดเราต้องให้คนรุ่นใหม่มีส่วนร่วมมากที่สุดในการปฎิรูปครั้งนี้  เราอย่าลืมนะครับว่าประเทศ สิงคโปร์ที่ปฎิรูปประเทศมาได้ตอนนั้นนายกรัฐมนตรีลีกวนยูมีอายุไม่ถึง 40  ปี ตอนเราปฎิวัติ 2475  ผู้นำในคณะราษฎร์ส่วนใหญ่คือคนอายุต่ำกว่า  40 ปี ถ้าเราจะปฎิรูป  Digtial Economy  แล้วเราจะเอาแต่คนรุ่นเก่ามาปฎิรูปแล้วพยายามจะมาบอกว่าอนาคตของเศรษฐกิจหรือวิถีชีวิตของคนรุ่นใหม่จะเป็นไปได้อย่างไร ยิ่งคนคิดปฎิรูปหลายๆคนอาจมีความเข้าใจเรื่องดิจิทัลน้อยกว่าคนรุ่นใหม่บางทีก็ยิ่งน่าเป็นห่วงมากขึ้นไปอีก อย่าว่าแต่คนอายุมากกว่า 60  ปีเลยครับแม้แต่คนรุ่นอย่างผมบางทีก็อาจอายุมากเกินไปแล้วในการจะมาคิดเรื่องปฎิรูปให้พวกเขาตามลำพัง เราควรต้องมีสัดส่วนของเด็กรุ่นใหม่ๆจำนวนมากในการปฎิรูปสังคมสู่    Digital Economy มันเป็นเรื่องของ New Generation  สู่  New Economy ไม่ใช่แค่กลุ่มของผู้ใหญ่มาคุยกันแล้วจะบอกอนาคตให้คนรุ่นใหม่ที่เขาต้องอยู่กับอนาคตของเขาอีกหลายสิบปี ครับให้เขามีส่วนร่วมในการกำหนดอนาคตของเขาด้วยครับ

ธนชาติ นุ่มนนท์

IMC Institute

Big Data on Cloud ตอนที่ 1: Hadoop as a Service

Hadoop เป็นเทคโนโลยีทางด้าน Big Data ที่น่าสนใจเพราะสามารถที่จะเก็บข้อมูลที่เป็น   Unstructure จำนวนเป็น PetaByte ได้ ซึ่งในทางทฤษฎีการศึกษาการติดตั้งระบบ Hadoop และการนำมา  Hadoop  มาใช้ในการวิเคราะห์ข้อมูลโดยใช้โปรแกรมอย่าง MapReduce  หรือใช้เทคโนโลยีต่างๆอย่าง  Hive, Pig, Scoop หรือ HBase เป็นเรื่องไม่ยากนัก แต่ในทางปฎิบัติปัญหาสำคัญที่องค์กรจะพบในการติดตั้ง Hadoop Big Data  ก็คือการหาเครื่อง Server จำนวนมากมาเพื่อติดตั้งระบบ Hadoop Cluster  จำนวนตั้งแต่  5  เครื่องไปจนเป็นร้อยเป็นพันเครื่อง

HadoopProcess

รูปที่ 1 Hadoop Lifecycle [Source: Rackspace]

การแก้ปัญหาในเรื่องการจัดหา  Server อาจทำได้โดยการใช้ระบบ  Public Cloud  ซึ่งก็จะเป็นการลดค่่าใช้จ่ายขององค์กร ทั้งนี้รูปแบบของการใช้ Hadoop  บน Public Cloud   มีสองแบบคือ

  1. ติดตั้ง Hadoop Cluster โดยใช้ Virtual Server ในระบบ  Public IaaS Cloud อย่าง Amazon Web Services  (AWS) หรือ Microsoft Azure  กรณีนี้จะใช้ในกรณีที่เราจะต้องการนำ Hadoop มาใช้ในการเก็บข้อมูลขนาดใหญ่โดยใช้ HDFS และใช้ในการวิเคราะห์ข้่อมูลโดยใช้เครื่องมืออย่าง  MapReduce, Hive, Pig
  2. การใช้บริการ  Hadoop as a Service ของ  Public Cloud Provider ที่ได้ติดตั้งระบบ Hadoop ไว้แล้ว และเราต้องการใช้ระบบที่มีอยู่เช่น MapReduce, Hive, Pig มาใช้ในการวิเคราะห์ข้อมูล ทั้งนี้ข้อมูลที่จะนำมาวิเคราะห์อาจอยู่ในองค์กรเราหรือเก็บไว้ที่อื่น

การใช้ Public Cloud ในกรณีที่ 1  ถ้ามีข้อมูลขนาดใหญ่มาก  ก็อาจจะมีค่าใช้จ่ายที่สูง ยิ่งถ้ามีจุดประสงค์เพื่อที่จะใช้ในการเก็บข้อมูลแบบ Unstructure  ก็ดูอาจไม่คุ้มค่านัก แต่ก็มีข้อดีที่มีระบบ  Hadoop Cluster ที่ติดตั้งเองและไม่ต้องใช้ร่วมกับคนอื่น ผู้เขียนเองเคยทดลองติดตั้งระบบแบบนี้โดยใช้ Azure HDInsight และทดลองติดตั้ง Hadoop CloudEra Distribution  ลงใน AWS EC2  และล่าสุดทดลองติดตั้ง Apache Hadoop Cluster  4 เครื่องลงบน  AWS EC2

สำหรับกรณีที่ 2  น่าจะเหมาะกับผู้ต้องการวิเคราะห์ข้อมูลขนาดใหญ่เช่น  ข้อมูลที่เป็น Text หรือ ข้อมูลจาก  Social Media โดยใช่้เทคโนโลยี Hadoop โดยไม่ต้องการลงทุนซื้อเครื่อง  Server  และก็ไม่ได้เน้นที่จะใช้ Hadoop Cluster  ในการเก็บข้อมูลอย่างถาวร ในปัจจุบันมีผู้ให้บริการ  Cloud Computing อยู่่หลายรายที่ให้บริการ Hadoop as a Service โดยจะคิดค่าบริการตามระยะเวลาที่ใช้ในการประมวลผล และอาจรวมถึงขนาดของข้อมูล  การใช้  Bandwidth ตัวอย่างของผู้ให้บริการมีดังนี้

  • Amazon Elastic Map Reduce

เป็นบริการ  Hadoop Cluster ของ  AWS ที่ผู้ใช้บริการสามารถที่จะเลือกขนาดของ Cluster หรือภาษาที่จะใช้การวิเคราะห์ข้อมูลเช่น Java  สำหรับ  MapReduce หรือ Python สำหรับ Streaming และ  Hive, Pig  ผู้เขียนเองเคยใช้   AWS EMR ในการวิเคราะห์ข้อมูลดยการ Transfer ข้อมูลผ่าน  Amazon  S3 ก็สะดวกและใช้งานง่าย ทั้งนี้ Hadoop Distribution ที่ลงบน EMR ผู้ใช้สามารถเลือกได้ระหว่าง  Amazon หรือ  MapR Distribution

Screenshot 2014-09-16 15.18.54

รูปที่ 2 ตัวอย่างการใช้  Amazon EMR

  • Rackspace Cloud Big Data Platform

Rackspace   หนึ่งในผู้นำด้าน  Public IaaS Cloud  มีบริการที่เรียกว่า Hadoop as a Service  เพื่อให้ผู้ใช้สามารถที่จะส่งข้อมูลมาประมวลผลได้ โดยได้ร่วมมือกับ  Hortonworks  ในการติดตั้ง Distribution ของ  Hadoop

Screenshot 2014-09-16 15.24.41  รูปที่ 3 Rackspace Big Data

  • Qubole

Qubole  เป็นผู้ให้บริการ Hadoop as a Service  โดยเฉพาะ ซึ่งทางบริษัทนี้ติดตั้ง  Hadoop Cluster  บนเครื่อง Server  ของ  AWS และ Google Compute Engine คิดค่าบริการ  Data Service ในการวิเคราะห์ข้อมูลทั้งแบบเหมาจ่ายรายเดือน  (เริ่มตั้งแต่ $5,900 ต่อเดือน) และตามการใช้งาน ($0.11 ต่อ Computing Hour และ $0.22  ต่อ import/export)

Screenshot 2014-09-16 15.39.21

   รูปที่ 4 Qubole.com

  • Google Cloud Platform

Google มีระบบ  Apache Hadoop  ที่รันอยู่บน Google Cloud ให้ผู้ใช้สามารถประมวลข้อมูลโดยใช้ MapReduce,  Hadoop Streaming, Hive หรือ Pig  ที่เก็บอยู่บน Google Cloud Storage  ได้ โดยคิดค่าใช้จ่ายตามปริมาณการใช้งาน

Screenshot 2014-09-16 16.13.40

 รูปที่ 5 Google Apache Hadoop

  • IBM Bluemix: Analytic on Hadoop

IBM Bluemix ซึ่งเป็น  Public PaaS ก็มีการติดตั้ง  Hadoop Cluster  เพื่อให้ผู้ใช้สามารถประมวลผลข้อมูลขนาดใหญ่โดยใช้ MapReduce, Hive หรือ Pig เช่นเดียวกับ Google  หรือ AWS ทั้งนี้ Hadoop  ที่ติดตั้งบน  Bluemix เป็น Distribution ของ  IBM ที่ชื่อ InfoSphere BigInsights

Screenshot 2014-09-16 21.15.24

รูปที่ 6 IBM Analytics fo Hadoop

จากที่กล่าวมาทั้งหมดนี้จะเห็นได้ว่า ในปัจจุบันองค์กรต่างๆสามารถทำการประมวลผลข้อมูลโดยใช้ เทคโนโลยี Hadoop ได้เลยผ่านบริการ  Public Cloud โดยไม่ต้องจัดหาเครื่อง Server หลายๆองค์กรก็อาจจะห่วงเรื่องความปลอดภัยของข้อมูล ซึ่ีงในกรณีของ Hadoop as a Service เราไม่จำเป็นต้องเก็บข่้อมูลลงใน  Hadoop Cluster  โดยเราสามารถ  Transfer ข้อมูลที่จำเป็นในการประมวลผลไปใช้ได้เป็นครั้งคราวไป ทำให้เราน่าจะเชื่อมั่นในเรื่องข้อมูลได้ดีขึ้น ข้อสำคัญเราจะเห็นว่ามีองค์กรใหญ่ๆจำนวนมากมาใช้บริการแบบนี้ ซึ่งแน่นอนข้อมูลขององค์กรเหล่านั้นก็มีความสำคัญไม่น้อยกว่าของเรา จึงทำให้เห็นได้ว่าองค์กรต่างๆมีความเชื่อมั่นในบริการแบบนี้มากขึ้นเรื่อยๆ

ธนชาติ นุ่มนนท์

IMC Institute

กันยายน 2557

การคาดการณ์แนวโน้มของ Big Data

เมื่อวานนี้ทาง IMC Institute  จัดงานฟรีสัมมนาร่วมกับ Computerlogy ภายใต้หัวข้อ Big Data: From Data to Business Insight โดยมีผู้เข้าร่วมสัมมนาประมาณ 100  คน หัวข้อที่ผมไปบรรยายในงานสัมมนานี้คือ  Forecast of Big Data Trends เพื่อให้ผู้เข้าร่วมสัมมนาทราบถึงแนวโน้มของ Big Data โดยมี Slide ที่ใช้ในการบรรยายดังนี้

ฺBigData-Seminar

การบรรยายเริ่มต้นโดยการบรรยายหลักการของ Big Data ทั้งนี้เพราะหลายๆคนยังเข้าใจผิดคิดว่า Big Data คือการที่มีข้อมูลดิจิตอลขนาดมหาศาล แต่จริงๆแล้วเรามักจะนิยามความหมายของ Big Data ด้วยคำย่อว่า 3V คือ Volume, Velocity และ Variety

  • Volume: คือมืจำนวนข้อมูลมากเกินกว่าระบบฐานข้อมูลแบบเดิมๆจะสามารถที่จะจัดการได้
  • Velocity: คือข้อมูลจะมีการเปลี่ยนแปลงอย่างรวดเร็ว เช่นข้อมูลจาก Social Media ข้อมูลการซื้อขาย ข้อมูล Transaction การเงินหรือการใช้โทรศัพท์  หรือข้อมูลจาก Sensor
  • Variety: คือข้อมูลจะมีหลากหลายรูปแบบทั้ง Structure และ Unstructure ซึ่งอาจจะอยู่ในรูปทั้ง RDBMS, text, XML, JSON หรือ Image

ดังนั้นการจัดการ Big Data จึงจำเป็นต้องใช้ระบบการเก็บข้อมูลหรือการประมวลในรูปแบบอื่นๆที่อาจไม่ใช่เพียงแค่ฐานข้อมูล RDBMS แบบเดิมๆ ซึ่งเทคโนโลยีที่นำมาใช้ในปัจจุบันมีทั้ง Hadoop, NoSQL, NewSQL และ MPP เราจึงเห็นได้ว่า แนวโน้มการลงทุนไอทีขององค์กรต่างๆจึงมีการลงทุนเพื่อปรับปรุง Information Infrastructure มากขึ้น เพื่อให้รองรับกับการใช้งานด้าน Big Data

คราวนี้มาถึงการคาดการณ์แนวโน้มของ Big Data ที่ผมได้รวบรวมมาจากแหล่งต่างๆ ผมได้สรุปมา 10 เรื่องดังนี้

1) Hadoop will gain in stature 

ตลาด  Hadoop  ซึ่งเป็นซอฟต์แวร์ Open Source ที่ใช้ในการเก็บและประมวลผลข้อมูลแบบ  Unstructure  ขนาดใหญ่จะโตขึ้นเรื่อยๆ โดยองค์กรต่างๆจะมีการลงทุนเพื่อใช้งาน  Hadoop  คู่กับฐานข้อมูล  RDBMS แบบเดิม และ  NoSQL โดยทาง IDC ระบุว่าในปี 2012  มีการลงทุนด้านซอฟต์แวร์ Hadoop สูงถึง $209 ล้านเหรียญสหรัฐหรือคิดเป็น  11% ของมูลค่าตลาดด้าน Big Data

2) SQL holds biggest promise for Big Data

องค์กรส่วนใหญ่ยังใช้ภาษา  SQL ในการประมวลผล สังเกตุได้จากการลงทุนทางเทคโนโลยีด้าน  Big Data ร้อยละ 64 ขององค์กรก็ยังเป็นการจัดหาฐานข้อมูล RDBMS แบบเดิม มีเพียง 28%  ที่จัดหา  Hadoop/MapReduce  ส่วนหนึ่งก็เป็นเพราะภาษาที่ใช้ในการประมวลผลข้อมูลของ  Hadoop ยังเป็น MapReduce ซึ่งยากต่อการพัฒนา   จึงทำให้ผู้พัฒนา OpenSource  ของ Hadoop ต้องพัฒนาเครื่องมือใหม่ๆอย่าง  Hive, Impala หรือ  Jaql  เพื่อให้ผู้ใช้สามารถใช้ภาษา  SQL ได้ ทำให้เป็นโอกาสที่ดีสำหรับผู้ที่ต้องการประมวลผล  Big Data  ที่จะสามารถประมวลผลได้ง่ายและรวดเร็วขึ้น

3) Big Data vendor consolidation begins

ในปัจจุบันเรามีผู้ผลิตซอฟต์แวร์ ฮาร์ดแวร์และผู้ให้บริการ  Big Data  อยู่หลายราย โดยเฉพาะผู้ที่ทำด้าน Hadoop มีคนนำ Open Source ตัวนี้มาพัฒนาต่อยอดหลายรายและทำเป็นหลาย  distribution จนเป็นเรื่องยากที่ผู้ใช้จะเลือก distribution ที่เหมาะสม การคาดการณ์เรื่องหนึ่งคือเราอาจเห็นจำนวนผู้ผลิตซอฟต์แวร์เหล่านี้น้อยลง จะเหลือเพียงไม่กี่ราย รายเล็กๆที่น่าสนใจอย่าง  CloudEra  ก็จะต้องมาแข่งกับบริษัทใหญ่ๆอย่าง  Microsoft หรือ  IBM

4) Internet of things grow

การเข้ามาของอุปกรณ์ที่เป็น  Internet of Things  เช่น  Wearable Devices, Smart TV จะทำให้ข้อมูลโตขึ้นเรื่อยๆ โดยมีการคาดการณ์ว่าภายในปี  2017  จำนวน  Internet of Things  จะแซงหน้าจำนวนรวมของ  PC, Smartphone  และ  Tablet

5) More data warehouses will deploy enterprise data hubs

Data warehouses  จะมีการติดตั้ง  Enterprise Data Hubs  โดยเป็นการรวบรวมข้อมูลจากแหล่งต่างๆทั้งภายในและภายนอกองค์กร โดยจะมีรูปแบบข้อมูลที่หลากหลายทั้งเป็น  Structure และ  Unstructure โดยจะมีการใช้เทคโนโลยี  Hadoop ที่ประหยัดค่าใช้จ่ายกว่าเทคโนโลยีอื่นมาทำหน้าที่เป็น  Data Hub และช่วยทำหน้าที่ OffLoad ETL ข้อมูลที่ไม่สำคัญมากใน Data Warehouse

 6) Business intelligence (BI) will be embedded on smart systems

การคาดการณ์อีกเรื่องหนึ่งคือแนวโน้มที่เราจะเห็นอุปกรณ์หรือระบบต่างๆมีระบบ    Business Intelligence  (BI) ฝั่งอยู่ในระบบ เช่นระบบการขายต่อไปเซลล์ขายสินค้าอาจสามารถที่จะดูข้อมูลและวิเคราะห์ลูกค้าผ่านอุปกรณมือถือได้เลยโดยเลยโปรแกรม BI ผ่าน  Cloud Services

7) Less relational SQL, more NoSQL

เนื่องจากข้อมูลจะมีความหลากหลายมากขึ้น ดังนั้นการวิเคราะห์ข้อมูลที่เป็นโครงสร้างแบบเดิมโดยใช้ภาษา  SQL  จึงอาจไม่เพียงพอ ทำให้เทคโนโลยีที่เป็น  NoSQL หรือที่เรียกว่า   Not Only SQL จะเข้ามาใช้ร่วมกับฐานข้อมูล RDBMS แบบเดิม โดยเราจะเริ่มเห็นซอฟต์แวร์ใหม่ๆเหล่านี้อาทิเช่น MongoDB  ถูกนำมาใช้มากขึ้น

8) Hadoop will shift to real-time processing

Hadoop เวอร์ชั่น 1.x จะมีข้อจำกัดในเรื่อง  Namenode ทำให้ขยายขนาดเกิน 4,000 เครื่องไม่ได้ และมีข้อจำกัดในเรื่องการประมวลผลข้อมูลบน HDFS ที่เป็น MapReduce ที่ต้องรันแบบ Batch ไม่ใช่ Realtime  แต่ใน Hadoop  เวอร์ชั่น 2.x  ได้มีการปรับปรุงนำ  Data Operating System อย่าง  YARN  เข้ามาทำให้รูปแบบประมวลมีมากกว่า MapReduce  โดยสามารถใช้ NoSQL หรือ  Stream อย่าง  Python  ที่เป็น  Realtime ได้

9) Big Data as a Service (BDaaS)

ประเด็นสำคัญหนึ่งในการประมวลผลข้อมูล Big Data คือการลงทุนจัดหาเครื่องคอมพิวเตอร์ Server จำนวนมากเข้าใช้งาน ซึ่งต้องลงทุนสูงและอาจไม่คุ้มค่า จึงเริ่มมีการให้บริการการประมวลผลบน  Cloud Service มากขึ้น ตัวอย่างเช่นการใช้ Hadoop บน  Cloud ที่ในปัจจุบันมีผู้ให้บริการรายหลายอาทิเช่น Amazon EMR, Microsoft Azure HDInsight, IBM Bluemix และ  Qubole

BDaaS

10) External data is as important as internal data

ในปัจจุบันองค์กรจะมีข้อมูลที่ต้องนำมาพิจารณามากขึ้น โดยจำเป็นจะต้องให้ความสำคัญกับข้อมูลจากภายนอกองค์กร อาทิเช่นข้อมูลจาก Social Media พอๆกับการให้ความสำคัญกับข้อมูลในองค์กร เพื่อนำข้อมูลต่างๆเหล่านี้มาวิเคราะห์เชิงธุรกิจ

สุดท้ายคงต้องจบที่ว่าทาง IMC Institute และ  Computerlog ยังมีหลักสูตรอบรมเรื่อง Big Data  ใหกับผู้บริหารในวันที่ 1-2  ตุลาคมนี้เรื่อง  Big Data in Action for Senior Management ซึงผู้สนใจสามารถเข้าไปดูรายละเอียดได้ที่ www.imcinstitute.com/bigdatamgmt

ธนชาติ นุ่มนนท์

IMC Institute

กันยายน 2557

ปัจจัยในการเลือกใช้ Cloud Computing สำหรับองค์กร

11709430_522234144590597_5709026408869460786_n

กระแสชของ Cloud Computing ในบ้านเราแรงขึ้นมาเรื่อยๆ ทุกคนพูดถึง  Cloud  พอถามว่าใครใช้ Cloud  บ้าง? ทุกคนจะบอกเสียงเดียวกว่าองค์กรตัวเองก็ติดตั้งระบบ Cloud  แล้ว แต่ที่ผมแปลกใจคือเวลาผมบรรยายตามที่ต่างๆให้กับคนไอทีที่เป็นผู้ดูแลระบบไอทีในองค์กร เมื่อเวลาถามว่าใครเคยใช้เคยเล่น  Public IaaS อย่าง  Amazon Web Services แล้วกลับพบว่าแทบจะมีจำนวนน้อยมากหรือเกือบไม่มีเลย จำนวนมากไม่เคยเห็นหน้าจอ Admin Console ของระบบ Amazon ไม่ทราบว่ามีบริการ IaaS อะไรอยู่ จึงอาจสรุปสั้นๆว่าโดยแท้จริงหน่วยงานส่วนใหญ่ในบ้านเรายังไม่เป็น  Cloud  เพราะแม้แต่ผู้ดูแลระบบยังไม่เข้าใจความหมาย Cloud  ที่แท้จริง ผู้ใช้จะมาใช้  Cloud ได้อย่างไร

ซึ่งเวลาองค์กรในบ้านเราเวลาพูดถึง Cloud จริงๆแล้วเรากำลังพูดถึง  Virtualization มากกว่า  Cloud Computing  เพราะระบบที่ทำอยู้ไม้ได้มีคุณสมบัติของ  Cloud ที่สำคัญ 5 อย่างคือ

  • On demand self service
  • Broad network access
  • Resource pooling
  • Rapid elasticity
  • Measured Service

อีกตัวอย่างหนึ่งที่อยากกล่าวถึง วันก่อนผมมีโอกาสได้ให้คำปรึกษากับหน่วยงานไอทีภาคเอกชนรายหนึ่ง ที่จะจัดหาซื้อเครื่อง Server  ราคาเป็นแสนแล้วต้องไปเช่า Data Center  เพื่อทำ  Co-Location เดือนละหลายพัน เพื่อทำระบบอีเมล์และ  Application  เล็กๆน้อย พอถามว่าทำไมไม่ใช้ Cloud  พร้อมทั้งแสดงหน้าจอราคาของ Cloud Provider  ต่างประเทศอย่าง  www.digitalocean.com หรือของในประเทศอย่าง True IDC ซึ่งดูเรื่องราคาจะคุ้มค่ากว่า คำตอบที่ผมได้รับกลับเป็นในเรื่องการอ้างความปลอดภัยบ้าง การจะขยาย Server  อนาคตบ้าง และพยายามนึกถึงข้อจำกัดต่างๆซึ่งบางครั้งขาดหลักการของ  Cloud จึงทำให้ผมเห็นชัดเจนว่า วัฒนธรรมผู้ดูแลระบบไอทีบ้านเรายังยึดติดกับความเป็นเจ้าของ อยากเห็นตัวเครื่อง และยังขาดความเข้าใจเรื่อง  Cloud ที่ถูกต้อง

digitalocean

รูปที่ 1 ราคาการใช้บริการ  Cloud ของ DigitalOcean

trueidc

รูปที่  2 True IDC  หนึ่งในผู้ให้บริการ IaaS Public Cloud  ในประเทศ

ระบบใดควรขึ้น Cloud Computing

คำถามแรกที่คนมักจะถามคือผมควรใช้ Public Cloud ดีไหม  Cloud มีความปลอดภัยไหม

ในแง่ของระบบความปลอดภัย ผมว่าก่อนที่เราจะถามว่า Cloud ปลอดภัยแค่ไหน เราจะต้องแยกแยะชั้นความลับข้อมูลและระบบเราก่อน กล่าวคือทำ Classification  ผมเชื่อว่าข้อมูลบางอย่างของเราเป็นความลับแต่บางอย่างก็ไม่เป็นความลับ ดังนั้นบางอย่างเราสามารถนำไปเก็บที่สาธารณะได้บางอย่างอาจต้องเก็บไว้ในองค์กร ผมอยากคิดเสมือนว่าถ้าเรามีตู้เซฟไว้ในบ้าน เราคงไม่เอาของทุกอย่างในบ้านเป็นเก็บไว้ในตู้เซฟและบางอย่างเราสามารถเอามาวางไว้นอกตัวบ้านด้วยซ้ำโดยไม่ต้องกังวลว่าจะสูญหายมากนัก

องค์กรต้องดูก่อนว่าองค์กรของตัวเองเป็นรูปแบบใด ถ้าองค์กรเป็น SME การใช้  Cloud  อาจมีความเหมาะสมข้อมูลส่วนใหญ่มักจะไม่เป็นความลับ และ  Cloud Provider  รายใหญ่ๆก็มักจะมีมาตรฐานความปลอดภัยที่ดี การใช้บริการ  Public Cloud  เผลอๆการรักษาความลับข้อมูลในองค์กรอาจปลอดภัยกว่าการให้พนักงานในองค์กรมาจัดการเสียอีก เพราะโดยมากการรั่วไหลของข้อมูลมักจะมาจากองค์กรภายใน

องค์กรใหญ่ๆก็สามารถนำระบบบางระบบที่ต้องออกอินเตอร์เน็ตอยู่แล้ว และไม่มีความลับมากขึ้น Public Cloud ได้เช่น  ระบบอีเมล์ที่มีหลายองค์กรหันไปใช้อีเมล์ของ  Google Apps  หรือ  Office 365 ซึ่งในปัจจุบันทราบว่ามีธนาคารหลายแห่ง รวมทั้งสถาบันการศึกษามาใช้กัน นอกจากนี้อาจรวมถึงระบบอื่นๆที่ไม่ได้มีผลกระทบต่อกฎระเบียบหรือมาตรฐานขององค์กรเช่นระบบ  Salesforce   ที่ทางธนาคารในประเทศไทยบางแห้งนำเข้ามาใช้ แต่อย่างไรก็ตามองค์กรที่เกี่ยวข้องกับความปลอดภัย ความมั่นคง บางครั้งการใช้่ Public Cloud อาจไม่เหมาะสมนัก เช่น หน่วยงานด้านความมั่นคง หรือด้านสาธารณสุข ด้านภาษี

สำหรับการใช้ Server  ที่เป็น Public Cloud  ถ้าองค์กรห่วงเรื่องความปลอดภัย เราก็สามารถที่จะเลือกใช้ผู้ให้บริการที่สามารถทำ  Virtual Private Cloud ที่จะแยกระบบของเรา ออกจากบริการของ  Public Cloud ทั่วไปทำให้สามารถใช้บริการใน  Virtual Network  ที่มีความปลอดภัยยิ่งขึ้น ตัวอย่างของการให้บริการแบบนี้คือ Amazon Virtual Private Cloud  ของ  AWS และมีตัวอย่างของผู้ให้บริการในประเทศอย่าง WhiteSpace-Cloud

whitespace

รูปที่ 3 WhiteSpace  ผู้ให้บริการ Virtual Private Cloud ในประเทศไทย

การใช้ Server  ที่เป็น Public IaaS Cloud จะมีประโยชน์ในแง่ของการพัฒนาระบบ Application ใหม่ หรือย้ายระบบ Application เดิมที่อยู่ใน Server Hosting  ในองค์กรไปสู่ Public Cloud เพื่อลดค่าใช้จ่ายการที่จะต้องบำรุงรักษาและดูแล Data Center  ในองค์กรของตัวเอง ซึ่ง Application  ส่วนใหญ่ที่ไม่ได้ติดปัญหาเรื่องกฎระเบียบ เรื่องความปลอดภัยของข้อมูล โดยมากมักจะย้ายขึ้นมาบน Public Cloud ได้ แต่ก็มีบางระบบเช่น Legacy Application หรือ Mission Critical Application  ที่ไม่ควรรันหรือย้ายไปบน  Public Cloud เพราะอาจไม่สามารถย้ายได้ด้วยปัญหาทางเทคนิคและมีความเสี่ยง

อีกประเด็นหนึ่งที่น่าสนใจในการใช้ Public Cloud คือการใช้เป็นระบบสำรองหรือ DR Site  ซึ่งทำให้เราลดรายจ่ายในการที่จะต้องจัดหา Backup Server นอกจากนี้ระบบ  Software  หลายๆอย่างสามารถที่จะใช้  public SaaS  ได้อาทิเช่น ระบบ  Desktop Software, ระบบ  CRM, ระบบ  Workflow  หรือระบบ HR  ซึ่งจะช่วยลดค่าใช้จ่ายในการพัฒนา Application ไปด้วย

ระบบ Cloud Computing เสถียรพอหรือไม่

ประเด็นต่อมาที่มักจะได้ยินบ่อยคือกลัวระบบ Cloud Computing  จะล่ม เพราะแม้แต่ผู้ให้บริการรายใหญ่อย่าง  Amazon Web Services  ก็เคยล่ม

ผมคิดว่าประเด็นนี้เกิดจากเรามั่นใจในผู้ดูแลระบบของเรามากเกินไปว่าเก่งกว่าคนของผู้ให้บริการ  Cloud  ทั้งๆที่ผู้ให้บริการ  Cloud โดยมากจะมีผู้ดูแลระบบที่ดี มี Server อยู่เป็นจำนวนมากอาทิเช่น Amazon มี Server หลายแสนตัว จะมีระบบ  DR Site และผ่านมาตรฐานต่างๆที่ดี ผู้ดูแลระบบมักจะมีความเชี่ยวชาญด้าน Data Center โดยตรงดีกว่าองค์กรขนาดเล็ก

การที่เรามี Server เองก็เสมือนเราซื้อรถมาใช้เอง ต้องดูแลเอง บำรุงรักษาเอง ค่าใช้จ่ายค่อนข้างสูง แต่การใช้บริการ Cloud  เปรียบเสมือนบริการเช่าหรือใช้รถสาธารณะซึ่งก็มีบริการหลายแบบ ตั้งแต่รถสองแถว รถเมล์ รถไฟฟ้า รถ Limousine ก็ขึ้นอยู่กับบริการที่เราเลือก ถ้าเราเรียกบริการทีดีก็อาจมีราคาสูงขึ้น แต่มีความปลอดภัย และมีความเสถียรขึ้น การที่  Cloud Server ใหญ่ๆอย่าง Amazon ล่ม ก็ย่อมเป็นข่าวใหญ่ เพราะเปรียบเสมือนเครื่องบินตกที่นานๆจะเกิดขึ้นที แต่ Server ในองค์กรทั่วๆไปบ่อยครั้งที่ล่ม และอาจมากกว่าของ  Amazon  แต่ไม่เป็นข่าวหรอกครับ เพราะมันเหมือนกับข่าวรถชนกันที่เกิดขึ้นประจำทุกๆวัน

ระบบ Cloud Computing ไม่รู้ว่าอยู่ใดเก็บข้อมูลเราตรงไหน

อีกประเด็นหนึ่งที่ผู้ใช้เป็นห่วงคือไม่ทราบตำแหน่งของเครื่อง Server หรือ ที่เก็บข้อมูล

คำว่า Cloud Computing ก็บอกอยู่แล้วว่าเป็นระบบประมวลผลบนก้อนเมฆ เราไม่ทราบว่าระบบหรือ Server  อยู่ที่ใด  คำถามที่ผมอยากถามกลับคือว่าแล้วจะทราบไปทำไมละ ทุกวันนี้เราใช้ไฟฟ้าเราทราบไหมว่าผลิตมาจากที่ใด เราใช้ Facebook ใช้ Line เราสนใจไหมว่าระบบรันมาจากที่ไหน ตราบใดที่ตอบโจทย์เราได้ ระบบทำงานอย่างต่อเนื่องไม่ล่ม เราก็พอใจและยินดีที่ใช้บริการอย่างต่อเนื่อง

การมี  Server  ของตัวเองบ่อยครั้งเราก็จะจัดหา  Server  มาแล้วก็เห็นเครื่องเพียงแค่ไม่กี่ครั้ง ก่อนที่จะย้ายไปอยู่ใน  Data Center  แล้วเราก็็แทบจะไม่เคยเห็นเครื่องอีกเลยยกเว้นว่าจะมีปัญหาเราถึงจะเข้าไปดูว่าเกิดอะไรขึ้น ลองจินตนาการว่าถ้าเราใช้ Cloud แล้วระบบไม่เคยล่ม เราก็คงไม่มีเหตุที่จะต้องเข้าไปดู หรือถ้ามีปัญหาแล้วเราสามารถติดต่อผู้ให้บริการมาแก้ปัญหาให้เราได้ เราก็ไม่ต้องไปกังวลอะไร

ส่วนเรื่อง  Data  อาจมีประเด็นที่จะต้องพิจารณาเพราะ  ข้อมูลเราย้ายไปอยู่บน Cloud  ถึงแม้ผู้ให้บริการจะไม่มายุ่งเกี่ยวกับข้อมูลของเรา แต่การสำรองข้อมูลสำหรับเก็บไว้ใช้เองในอนาคตอาจเป็นหน้าที่ของเราเอง เพราะเมื่อเราเลิกใช้บริการ Cloud หรือจะย้ายผู้ให้บริการเป็นเจ้าอื่นก็เป็นหน้าที่ของเราต้องจัดการเรื่องข้อมูลเอง

เราควรเลือกผู้ให้บริการ   Cloud อย่างไร

ปัจจุบันเรามีผู้ให้บริการ Data Center หรือ  Software  จำนวนมากที่พยายามบอกว่าตัวเองเป็นผู้ให้บริการ  IaaS หรือ  SaaS  ผู้ให้บรืการ  Data Cenetr บางรายก็อาจทำแค่  Virtualization ผู้ให้บริการ  Software  บางรายก็อาจเป็นแค่  Web Application ที่โฮสต์อยู่บน  Server ตัวเองไม่สามารถขยายได้โดยง่ายและไม่เสถียร

การจะเลือกผู้ให้บริการ Cloud จึงจำเป็นต้องศึกษาข้อมูลต่างๆให้ดีโดยอาจต้องดูข้อมูลต่างๆเช่น

  • ข้อมูลด้าน  Data Center  จำนวน  Server ที่ใช้
  • Technology  ด้่าน Cloud Computing  ที่ใช้
  • ลูกค้่าที่ใช้อยู่ในปัจจุบัน
  • การรับประกันเรื่อง  Reliability/Uptime
  • มาตรฐานด้านความปลอดภัยและด้านอื่นๆของผู้ให้บริการ
  • ข้อตกลงการใช้บริการ
  • ความน่าเชื่อถือและมั่นคงของผู้ให้บริการ

ประเด็นสำคัญในการเลือกใช้บริการ  Cloud  จึงอยู่ที่มีข้อตกลงการใช้บริการ  (SLA: Service Level Agreement)  ทีดี ประเด็นนี้เราต้องรอบคอบและควรศึกษาให้ละเอียด เพื่อจะได้ดูว่าผู้บริการรับรองการบริการเพียงใด หากมีข้อเสียหายจะรับผิดชอบเพียงใด

ประเด็นหนึ่งเรื่องผู้ให้บริการ  IaaS Public Cloud หลายคนจะเห็นว่าราคาของผู้บริการต่างประเทศจะราคาถูกกว่าของผู้ให้บริการในประเทศ ข้อนี้จริงอยู่เพราะระบบของผู้ให้บริการต่างประเทศมีขนาดใหญ่ มีความสมบูรณ์และบริการที่หลากหลายกว่า มีลูกค้าจำนวนมากกว่า แต่ก็จะติดเรื่องของการ  Support และการบริการที่ถ้าเราใช้บริการจากผู้ให้บริการในประเทศ เราอาจได้บริการที่เข้าถึงได้ง่ายกว่า

บทสรุปเราจะใช้บริการรายใดก็ขึ้นอยู่กับการพิจารณาของเราเองอยู่ที่ความพร้อมด้านบุคลากรของเรา งบประมาณ และประเภทของการบริการ

ดร.ธนชาติ นุ่มนนท์

ผอ.  IMC Institute