การใช้ IaaS/PaaS Cloud Computing เพื่อสร้างศักยภาพการแข่งขันให้กับองค์กร

25182135_982595078554499_4976486232400632025_o (1)

เวลาพูดถึงเรื่อง Cloud Computing โดยเฉพาะบริการด้าน IaaS (Infrastructure as a Service) หรือ PaaS (Platform as a Service) หลายคนก็ยังเข้าใจเน้นไปที่การจัดหา Virtual Server มาแทนที่ระบบ on-Premise ในปัจจุบัน แล้วก็ไปเปรียบเทียบกับการที่จะต้องบำรุงรักษาระบบเอง และก็เข้าใจไปว่าระบบ IaaS Cloud Computing เน้นที่บริการ Compute Engine ที่บริการ OS อย่าง Linux หรือ  Windows ก็เลยเป็นที่มาทำให้บางคนไปคิดว่า IaaS คือการจัดหา Server โดยให้ Cloud Service Provider เป็นผู้ดูแล แล้วคิดค่าใช้จ่ายแบบการเช่ารายวันรายเดือน นอกจากนี้หลายๆคนก็ไม่เข้าใจบริการอย่าง PaaS ที่จะเป็นประโยชน์กับองค์กรมากมายกว่าการหา Virtual Server ที่มีแต่ OS เปล่าๆแล้วให้ผู้ใช้บริการมาติดตั้งระบบ Middleware แล้วสร้าง Application อื่นๆกันเอง

คุณค่าของการใช้บริการ Cloud Computing ไม่ได้อยู่ที่การลดค่าใช้จ่าย ประโยชน์ที่จะได้จากการใช้บริการ Cloud Computing มากที่สุดคือเรื่องของ ความคล่องตัว  นวัตกรรม และ Time to market บริการ Cloud computing ทำให้องค์กรสามารถพัฒนาระบบไอทีในองค์กรให้แข่งขันได้อย่างเร็วโดยการเลือกบริการที่เหมาะสมโดยเฉพาะในกลุ่ม IaaS/PaaS ของ Cloud Service Provider มาใช้ ในปัจจุบัน Cloud Service Providers ใหญ่ๆทุกรายในต่างประเทศที่เราสามารถเรียกใช้บริการจากในประเทศได้จะมีบริการดีๆมากกว่าการให้บริการเช่า Virtual Server โดยเราอาจแบ่งกลุ่มของบริการต่างได้ดังนี้

  • Compute  อาทิเช่น Virtual Server, App Development/ Deployment,  Container Registration Service
  • Storage อาทิเช่น Object storage, Relational database, NoSQL, Data warehouse
  • Migration Services อาทิเช่น Large scale data transfer, Database Migration Services
  • Big Data & Advanced Analytics อาทิเช่น Big Data Query as a Service, Hadoop as a Service, Business Intelligence & Data Visualization
  • Artificial Intelligence อาทิเช่น Machine Learning, Language Processing AI, Image Recognition AI
  • Mobile Services อาทิเช่น Mobile App Development Services,  Mobile App Analytics
  • Application Services อาทิเช่น  API Management Service, Email Services
  • Internet of Things อาทิเช่น IoT Platform, IoT Development Solutions
  • Software MarketPlace
  • Developer Tools 
  • Game Development 
  • Development & Testing
  • Networking & Content Delivery
  • Management Tools
  • Security & Identity, Compliance Identity & Access

สิ่งที่สำคัญคือหน่วยงานจะต้องมีบุคลากรไอทีที่มีความเข้าใจบริการต่างๆเหล่านี้ มี Cloud Architect ที่จะรู้จักเลือกใช้ Cloud services ต่างๆ สามารถเปรียบเทียบและรู้จักบริการต่างๆเหล่านี้ของผู้ให้บริการ Cloud ต่างๆ [ผู้ที่สนใจจะรู้จักบริการ Cloud ของผู้บริการรายใหญ่อย่าง Amazon Web Services, Microsoft Azure, Google Cloud Platform, IBM Cloud, Oracle Cloud และ Alibaba Cloud สามารถดูรายละเอียดเพิ่มเติมได้ที่ https://ilyas-it83.github.io/CloudComparer/#]

Screenshot 2017-11-27 08.39.56

เพื่อให้เห็นประโยชน์ของการใช้บริการ  Cloud Computing เหล่านี้ ผมขอยกตัวอย่างการใช้งานที่สำคัญมาสามเรื่องจากประสบการณ์ที่ทางทีมงาน IMC Institute ได้ทำมา ซึ่งเป็นอะไรที่มากกว่าการใช้ Virtual Server และได้ประโยชน์อย่างมาก

กรณีที่ 1) การพัฒนา Application โดยใช้บริการ App Development/ Deployment

การพัฒนา Web/Enterprise Application โดยการใช้ Server มักจะประสบปัญหาเรื่องของการติดตั้ง Middleware เรื่องของ Scaling เมื่อมีผู้ใช้จำนวนมาก และอาจเจอปัญหาเรื่อง Dev/Op การจัดหา Virtual Server มาแล้วต้องมาลง Middleware ต่างๆเองไม่ตอบโจทย์ต่างๆเหล่านั้น แต่ Cloud Provider จะมีบริการอย่าง AWS BeansTalk  หรือ Google App Engine ที่นักพัฒนาซอฟต์แวร์สามารถที่จะมุ่งเน้นแค่การเขียนโปรแกรมอย่าง Java, Python, PHP หรือ C#.Net แล้วสามารถเอา code เหล่านั้นไป Deploy ใช้งาน Server ได้เลย โดยไม่ต้องเสียเวลาติดตั้ง Middleware ใดๆ และสามารถเลือกโหมดที่เป็น auto-scaling ได้ โดยไม่ต้องทำการติดตั้ง server เพิ่มเติม การเลือกใช้บริการเหล่านี้ทำให้ทีมงานสามารถพัฒนา Application ได้อย่างรวดเร็ว

กรณีที่ 2) การทำ Big Data โดยใช้  Object storage, Hadoop as a service  และ Big Query

ผมเคยเขียนบทความเรื่อง Big Data as a Serviceไปแล้วว่าทำให้เราสามารถทำโครงการ Big Data ได้อย่างรวดเร็ว ทุกวันนี้ทีมงานของ IMC Institute ได้ไปทำโครงการและให้คำปรึกษาองค์กรหลายๆแห่งให้ใช้  Cloud Computing ในการทำ Big Data เพราะนอกจากจะลดค่าใช้จ่ายเมื่อเทียบกับการติดตั้งระบบ Big Data Platform เองแล้ว ยังทำให้เราสามารถเริ่มต้นโครงการได้อย่างรวดเร็ว หลักการก็คือการใช้บริการ Object storage อย่าง  AWS S3 หรือ  Google Cloud storage มาเก็บข้อมูล Archieve ขององค์กรที่เป็น Warm/Cold data  แทนที่การใช้ Hadoop HDFS แบบ On-premise แล้วใช้บริการ Hadoop as a Service อย่าง Google Dataproc หรือ Data Warehouse Tool อย่าง Google Big Query ในการทำการวิเคราะห์ข้อมูลทั้งในรูปของการทำ BI หรือ Data Science

[ดูรายละเอียดเพิ่มเติมได้จากบทความ Big Data as a Service แนวทางการทำโครงการ Big Data ที่ไม่ต้องลงทุนโครงสร้างพื้นฐาน และ การทำโครงการ Big Data อย่างรวดเร็ว ควรเริ่มอย่างไร]

กรณีที่ 3) การใช้บริการ Artificial Intelligence as a Service

หลายๆองค์กรต้องการทำเรื่องของปัญญาประดิษฐ์เช่นการแปลภาษา การวิเคราะห์ภาพหรือเสียง การทำ Machine Learning หรือการใช้ Deep Learning แต่พบว่าการจะเริ่มต้นโดยการจัดหาเครื่องขนาดใหญ่จำนวนมากมาทำ Machine Learning หรือสร้าง  Model อาจไม่ใช่เรื่องง่ายและมีค่าใช้จ่ายจำนวนมาก ทีมงานของ IMC Institute ได้พัฒนาระบบพวกนี้ผ่าน AI as a Service ของ Google Cloud โดยใช้ Translation API และ Language API รวมถึงการทำ  Deep Learning  โดยใช้  Machine Learning as a Service ของ Google ทำให้สามารถพัฒนาระบบได้อย่างรวดเร็ว

จากที่กล่าวมาทั้งหมดนี้ ต้องการให้ผู้อ่านเข้าใจประโยชน์ของ Cloud Computing ในแง่ของการสร้างนวัตกรรมและสร้างศักยภาพการแข่งขันให้กับองค์กร ถึงเวลาที่เราคงต้องพัฒนาบุคลากรในองค์กรให้เข้าใจเรื่องต่างๆเหล่านี้ เพื่อที่จะใช้บริการ Cloud Computing ให้เราสามารถแข่งขันได้

ธนชาติ นุ่มนนท์

IMC Institute

 

เซินเจิ้น Silicon Valley ด้าน Hardware

Screenshot 2018-01-31 09.46.44

ช่วงวันที่ 16-18 พฤศจิกายนที่ผ่านมา ทางสถาบันไอเอ็มซีได้จัดทริปไปดูงาน China Hi-Tech Fair 2017 ที่เมืองเซินเจิ้น  (Shenzhen)  ประเทศจีน ตอนจะจัดไปครั้งแรกมีบางคนถามว่า Hi Tech Fair ที่เซินเจิ้นจะมีนวัตกรรมอะไรหรือ เพราะภาพของเซินเจิ้นคือเมืองที่เป็นแหล่งก๊อบปี้สินค้าแบรนด์เนมต่างๆ และเป็นศูนย์กลางการผลิตที่เป็น Tech copycat แต่เมื่อไปถึงงานจริงๆทุกคนพบว่า งานจัดใหญ่โตมากจำนวนบูธที่ออกมามีมากมาย ตั้งแต่สินค้าไอทีเล็กๆ เทคโนโลยีโทรคมนาคม ไปจนถึงอุปกรณ์นวัตกรรมในโรงงาน ตลอดไปจนถึงรถยนต์ไร้คนขับและการแสดงสินค้าอย่างรถไฟฟ้า

DSC08612

ผู้ประกอบการ ICT (supply side) ของจีนไม่มีภาพของการเป็นนักก๊อปอีกต่อไป เห็นได้จากผลิตภัณฑ์ที่นำมาแสดง เต็มไปด้วยนวัตกรรมใหม่ๆจำนวนมาก บริษัทต่างๆมีนวัตกรรมทั้งหุ่นยนต์ ระบบอัจฉริยะต่างๆจำนวนมาก จนพวกเราที่เดินชมนิทรรศการบางคนถึงกับออกปากมาว่า นวัตกรรมอะไรก็ตามที่คนไทยกำลังเริ่มต้นคิดอยู่ของจีนเขาทำมาเป็นสินค้าพร้อมที่จะขายแล้ว แม้แต่สินค้าอย่าง Drone ที่ดูเหมือนกันทุกบูธ แต่สิ่งที่พบก็คือมี “Application” ที่แตกต่างกันและนำไปใช้งานคนละประเภท หรือระบบ Face Recognition ที่มีถึง 3 บูธ แต่ก็ทำ Data Analytic ไม่เหมือนกัน มีนวัตกรรมที่แตกต่างกัน

งานที่จัดดูอลังการมากสมกับเป็น Fair ระดับนานาชาติและมีหลาย Hall มาก แต่ละ Hall ก็จะเน้นกลุ่มอุตสาหกรรมที่ไม่เหมือนกัน ตั้งแต่ 5G, Smart City, Smart Healthcare, Hi-Tech Industry, New electronic technology หรือ Aerospace และก็มี Brand ใหญ่ๆของจีนมาแสดงนวัตกรรมมากมาย นับว่าเป็นงานที่น่าสนใจมาก และดูแตกต่างจากงานอย่าง CommunicAsia ที่จัดประจำทุกปีที่สิงคโปร์ซึ่งจะเน้นเฉพาะด้าน Telecom โดยเป็นสินค้าที่มาจากทั่วโลกมากกว่าผู้ผลิตในเอเซีย แต่งาน Hi Tech Fair นี้เป็นผลิดภัณฑ์ของผู้ประกอบการจีนโดยตรงและมีนวัตกรรมที่หลากหลายในทุกด้านที่ดูเหมือนมากกว่างาน CommunicAsia ด้วยซ้ำไป

หากย้อนหลังไปเมื่อ 40 ปีก่อนเมืองเซินเจิ้นมีประชากรน้อยกว่า 300,000 คน และเมืองที่ทำการประมง แต่เมื่ออดีตประธานาธิบดีเติ้งเสี่ยวผิงได้ประกาศให้เมืองนี้เป็นเขตเศรษฐกิจพิเศษในปี 1980 โดยกำหนดมาตรการต่างๆในการจูงใจนักลงทุนทั้งด้านภาษีและกฎระเบียบการค้าต่างๆ ทำให้เซินเจิ้นเจริญเติบโตขึ้นมาอย่างรวดเร็ว จากที่มีมูลค่า GDP น้อยกว่า 1,000 ล้านบาทในปี 1979 กลายเป็น  1.25 ล้านล้านบาทในปี 2016  และทำให้มีประชากรเพิ่มขึ้นเป็น 11.37 ล้านคนในปี 2016

สิ่งที่น่าสนใจอีกประการหนึ่ง คือเมืองเซินเจิ้นได้เปลี่ยนจากแหล่งอุตสาหกรรมที่เป็น Tech copy ให้กลายเป็นศูนย์กลางของนวัตกรรม จนอาจกล่าวได้ว่าเมืองเซินเจิ้นคือ The Silicon Valley of Hardware นอกจากนี้ก็ยังเป็นศูนย์กลางของ Hardware Startup ที่มีนวัตกรรมใหม่ๆมากมายทั้ง หุ่นยนต์ Drone อุปกรณ์ Wearable, Internet of Things และอุปกรณ์ Hi Tech Electronic ต่างๆ

เมืองเซินเจิ้นเป็นสังคมที่ใช้เงินสดน้อยมาก ทุกอย่างสามารถจ่ายผ่าน Mobile Payment ของ Alipay หรือ Wechat ซึ่งมีตั้งแต่การเช่าจักรยาน การซื้อของตามร้านค้า ร้านขายของข้างทาง อาหารข้างถนน หรือแม้แต่ นักดนตรีที่มาเล่นขอเงิน ก็ยังต้องจ่ายเงินให้ผ่าน QR Payment และหากเราต้องใช้เงินสดในร้านเล็กๆเขาก็จะปฎิเสธการรับเงินเพราะเขาไม่มีเงินสดมาทอน จนเราอาจกล่าวได้ว่า เซินเจิ้นเข้าสู่สังคมไร้เงินสดเกือบ 100%

เมืองเซินเจิ้นดูมีความเป็นตะวันตกกว่าเมืองจีนทั่วๆไป มีความสะอาด และมีค่าครองชีพที่ค่อนข้างสูง คนชั้นกลางมีฐานะที่ดีสามารถส่งลูกไปเรียนในโรงเรียนดังๆในจีนและต่างประเทศ เมืองเซินเจิ้นมีท่าเรือที่มีความหนาแน่นอันดับที่ห้าของโลก มีตึกสูงและโรงแรมดีๆจำนวนมาก และหากพิจารณาถึงจำนวนตึกสูงกว่า 200 เมตรที่สร้างขึ้นทั่วโลกในปั 2016 จะพบว่ามีถึง 11 ที่สร้างขึ้นใหม่ในเซินเจิ้นมากกว่าที่ใดๆในโลก แต่อย่างไรก็ตามเมืองเซินเจิ้นก็ยังมีปัญหาเรื่องของการสื่อสารที่ผู้คนส่วนใหญ่ยังใช้ภาษาจีน ทำให้อาจยากต่อการติดต่อสื่อสารและเดินทาง และก็ยังมีการบล็อกอินเตอร์เน็ตในหลายๆเว็บเซ็ต์อาทิเช่น Google และ Line

แต่หากพิจารณาภาพรวมแล้วเมืองเซินเจิ้นก็ยังเป็นเมืองที่เราควรทำธุรกิจด้วย เป็นแหล่งนวัตกรรมที่เราควรเข้าไปศึกษาและร่วมทำงาน สุดท้ายคงถึงเวลาที่บ้านเราจะต้องให้ความสำคัญกับเมืองนี้ และประเทศจีนมากขึ้นในด้านไอทีและเทคโนโลยี ด้วยความที่ระยะทางไม่อยู่ไกลจากบ้านเรานักและก็มีความเป็นวัฒนธรรมเอเซียอยู่มาก ข้อสำคัญสุดเซินเจิ้นกำลังมีภาพลักษณ์ที่กำลังกลายเป็น The factory of the world

ธนชาติ นุ่มนนท์

IMC Institute

[แหล่งข้อมูลจาก http://www.bbc.com/capital ]

การทำโครงการ Big Data อย่างรวดเร็ว ควรเริ่มอย่างไร

 

ช่วงนี้เวลาผมอ่านข่าวจากสื่อต่างๆก็จะเห็นผู้คนในทุกวงการออกมาพูดเรื่องการทำ Big Data เป็นจำนวนมาก มีการเขียนบทความ มีการออกข่าวต่างๆ กำหนดนโยบาย บ้างก็เข้าใจหลักการ บ้างก็พูดกันตามกระแส จนเหมือนกับว่า Big Data เป็นเครื่องมือวิเศษที่จะมาปรับเปลี่ยนองค์กรให้เข้าสู่การเปลี่ยนแปลงเชิงดิจิทัลได้โดยง่าย ทั้งๆที่การวิเคราะห์ข้อมูล Big Data มันซับซ้อนกว่านั้นและต้องมีการปรับเปลี่ยนโครงสร้างพื้นฐานด้านเทคโนโลยีสารสนเทศในองค์กรพอสมควร

ผมเองค่อนข้างจะโชคดีที่ยังเป็นคนลงมือปฎิบัติ ทำ Big Data Project เอง ศึกษาเอง มาเปิดและติดตั้งระบบอย่าง Hadoop  มาใช้  Cloud Services ต่างๆในการทำ Big Data Analytics ได้ลงมือทำ Machine Learning ตลอดจนศึกษาทฤษฎีทั้งในมุมมองของผู้บริหารและนักไอที เห็น Use Cases ในที่ต่างๆ และก็ได้เจอผู้คนมากมายในองค์กรต่างๆ พร้อมทั้งมีโอกาสได้ไปบรรยายและสอนเรื่องนี้ในหลายๆที่ ทั้งระดับบริหารและสอนคนลงมือปฎิบัติจริงจัง จึงพอที่จะบอกได้คร่าวๆบ้างว่า เราควรจะเริ่มต้นทำ  Big Data ได้อย่างไร ผมอยากจะสรุปประเด็นการเริ่มต้นทำโครงการ Big Data ที่สำคัญสามเรื่องดังนี้

1. การทำ Big Data  ควรเริ่มต้นทำกับข้อมูลประเภทใด

Big Data คือข้อมูลขนาดใหญ่มากๆทั้งที่เป็น  Structure และ unstructure ซึ่งผมมักจะได้ยินว่าเราควรเอา Big Data มาเพื่อวิเคราะห์พฤติกรรมลูกค้่า บ้างก็บอกว่าไปเอาข้อมูลใน Social Media มาเพื่อเข้าใจลูกค้าหรือแบรนด์เราเองมากขึ้น แต่จริงๆแล้วถ้าเราแบ่งข้อมูลที่จะนำมาใช้ เราอาจแบ่งได้เป็นสี่ประเภท

  • ข้อมูลที่มีอยู่แล้ว และได้ทำการวิเคราะห์แล้ว
  • ข้อมูลที่มีอยู่แล้ว แต่ไม่เคยนำมาวิเคราะห์ใดๆ
  • ข้อมูลที่ยังไม่เคยเก็บ แต่น่าจะมีประโยชน์
  • ข้อมูลจากคู่ค้าหรือแหล่งอื่นๆ

การเริ่มต้นทำ Big Data ที่ง่ายๆอาจพิจารณาที่ “ข้อมูลที่มีอยู่แล้ว แต่ไม่เคยนำมาวิเคราะห์ใดๆ” ก่อน เช่นข้อมูล Transaction การทำธุรกรรมต่างๆของลูกค้าที่จะเป็นข้อมูลรายละเอียด แต่เราไม่เคยนำมาวิเคราะห์ หรือรายการขายสินค้าในแต่ละรายการ เพราะโดยมากข้อมูลที่เราเคยวิเคราะห์แล้ว มักจะเป็นข้อมูลสรุปตัวเลข ยอดสินค้า ยอดขาย จำนวนลูกค้า แต่รายละเอียดย่อยๆเหล่านี้ จะเป็นข้อมูลขนาดใหญ่และอาจไม่เคยนำมาวิเคราะห์

2.การทำ Big Data  ต้องลงทุนโครงสร้างพื้นฐานมากน้อยเพียงใด

การวิเคราะห์ข้อมูลของ Big Data ที่ดีต้องมีการลงทุนโครงสร้างพื้นฐานที่แตกต่างจากการจัดทำฐานข้อมูลแบบเดิมๆหรือการทำโครงการ Data warehouse ซึ่งจะเป็นการลงทุนด้าน Data Lake ที่จะมาใช้ในการเก็บข้อมูลขนาดใหญ่ ดังแสดงรูปที่ 1 ซึ่งหลายๆองค์กรจะลงทุนไปกับเทคโนโลยีอย่าง Hadoop เพราะจะมีค่าใช้จ่ายในการเก็บ Storage ที่ค่อนข้างถูกกว่าเทคโนโลยีอื่นๆ ดังแสดงในรูปที่ 2  ที่อาจถูกกว่า Database เกือบ 20 เท่า แต่อย่างไรก็ตามการที่จะทำ Hadoop cluster ที่เป็นแบบ on-Promise ก็ยังมีค่าใช้จ่ายที่สูง อาทิเช่นการติดตั้ง Hadoop Servers  18 ตัวอาจมีค่าใช้จ่ายสูงถึง 30 ล้าน ดังแสดงในรูปที่  3

Screenshot 2017-11-24 13.23.02

รูปที่  1 การทำโครงการ Big Data Analytics โดยการทำ  Data Lake

Screenshot 2017-11-24 13.51.52

รูปที่  2 เปรียบเทียบค่าใช้จ่ายการทำ  Big Data Platform

ดังนั้นจึงไม่แปลกใจที่หน่วยงานจำนวนมากไม่สามารถที่จะลงทุนโครงสร้างพื้นฐานเรื่องของ  Big Data Platform ได้ เนื่องด้วยค่าใช้จ่ายที่สูง และอาจคำนวณหาผลตอบแทนในการลงทุนลำบาก รวมถึงอาจหา  Business case ค่อนข้างยาก ข้อสำคัญการลงทุน Hadoop อาจพบว่าส่วนใหญ่ก็คือการรวบรวมข้อมูลมาใส่ลงใน Data Lake  มากกว่าการใช้ CPU ในการประมวลผลผ่าน Processing Tools อย่าง  Hive, Spark, Impala เพราะนานๆครั้งจะทำการประมวลผลที่ และบางครั้งหากต้องการประมวลผลก็จะพบว่าความเร็วหรือจำนวน CPU ไม่พอ จึงอาจเกิดคำถามขึ้นมาว่าเราต้องลงทุนโครงสร้างพื้นฐานจำนวนหลายสิบล้านบาทเพียงเพียงเพื่อใช้ในการเก็บช้อมูลที่เป็น archieve จะคุ้มค่าหรือไม่

 

Screenshot 2017-11-24 13.52.01

รูปที่  3 ค่าใช้จ่ายการทำ  Hadoop Cluster จำนวน  18 เครื่อง [ข้อมูลจาก https://blogs.oracle.com%5D

แนวทางที่ดีสำหรับการลงทุนโครงการ Big Data คือการใช้บริการ Public Cloud ดังที่ผมเคยเขียนไว้ในบทความ “Big Data as a Service แนวทางการทำโครงการ Big Data ที่ไม่ต้องลงทุนโครงสร้างพื้นฐาน”  ทั้งนี้เราจะแยกส่วนการเก็บข้อมูลขนาดใหญ่ที่เป็น Data Lake ไว้ใน Cloud Storage อาทิเช่นการใช้ Google Cloud Storage, AWS S3 หรือ Microsoft Azure Blob มาแทนที่การใช้ Hadoop HDFS ซึ่งจะเป็นการประหยัดค่าใช้จ่ายกว่าการลงทุน Hadoop Cluster มากและก็มีความเสถียรของระบบที่ดีกว่า นอกจากองค์กรก็ยังลดค่าใช้จ่ายในการบริหารจัดการและดูแลระบบ ซึ่งจะถูกกว่าการลงทุน Hadoop Cluster หลายสิบเท่า โดยอาจมีค่าใช้จ่ายเพียงการเก็บข้อมูลเดือนหนึ่งหลักเพียงหมื่นบาทในการเก็บข้อมูลเป็น Terabyte ทั้งนี้ข้อมูลที่นำมาเก็บบน  Cloud storage ก็เป็นข้อมูลเช่นเดียวกับ Hadoop HDFS ที่เน้นข้อมูลที่เป็น  Archeive ซึ่งอาจเป็น Warm data หรือ Cold data และหากองค์กรกังวลเรื่องความปลอดภัยก็สามารถเข้ารหัสก่อนนำข้อมูลเหล่านี้ไปเก็บไว้บน Cloud

Screenshot 2017-11-24 13.22.42

รูปที่  4 เปรียบเทียบค่าใช้จ่ายการใช้ Cloud Storageกับ Hadoop HDFS

ในด้านการประมวลผล เราก็สามารถที่จะใช้จำนวน CPU ไม่จำกัดเพราะเราสามารถที่จะใช้บริการ Hadoop as a Services ที่มีค่าใช้จ่ายตามการใช้งานเช่นการใช้ Amazon EMR. Google DataProc หรือ  Microsoft HDInsight ซึ่งจะเสียค่าใช้จ่ายน้อยมากตามจำนวน CPU ที่ใช้ในการประมวลผล ซึ่งจากประสบการณ์ของผมที่ทำโครงการ Big Data Analytics ที่ทาง IMC Institute รับทำให้กับลูกค้านั้น บางครั้งเราเปิด Server ขนาด 4  vCPU  ถึงสามสิบเครื่อง เสียค่าใช้จ่ายเพียงหลักร้อยบาท ดังนั้นจะเห็นได้ว่าการลงทุนโครงการ Big Data โดยใช้ Cloud Computing ก็จะลงทุนเพียงเล็กน้อยและสามารถเริ่มทำงานได้ทันที

3.การทำ Big Data  ต้องจะพัฒนาคนเพียงใด

การวิเคราะห์ข้อมูล Big Data จะแตกต่างกับการทำโครงการ Data warehouse  ที่อาจเน้นการทำ Data Cleansing ซึ่งจะเน้นการใช้  SQL แต่การทำ Big Data จะต้องการ  Developer ที่สามารถพัฒนาโปรแกรมอย่างภาษา Python หรือ SQL ได้ ตลอกจนอาจต้องการ Data Sciencetist ที่มีความรู้ด้าน Machine Learning Algorithm ต่างๆ หากต้องการเห็นการทำ Big Data Analytics อย่างจริงจัง องค์กรจำเป็นต้องพัฒนาบุคลากรขึ้นมาเพื่อให้ใช้ Processing Tools ต่างๆอย่าง Apache Spark และควรมีความเข้าใจด้าน Machine Learning ซึ่งระยะต้นที่เป็นโจทย์วิเคราะห์ข้อที่หนึ่งหรือสอง เราอาจเรียนรู้โดยการว่าจ้าง Outsource มาทำแล้วทำงานร่วมกัน เพื่อเป็นการพัฒนาบุคลากรเพื่อแก้โจทย์ Big Data Analytics อื่นๆในอนาคต

ธนชาติ นุ่มนนท์

IMC Institute

พฤศจิกายน 2560

Screenshot 2017-10-02 08.23.18