การเก็บข้อมูลประชาชนของรัฐบาลจีนในการทำ Big Data Analytics

ผมไปเซินเจิ้นเมื่อต้นเดือนเมษายนที่ผ่านมาและได้สังเกตการเก้บข้อมูลของหน่วยงานในประเทศจีนที่ทำให้ไปแปลกใจว่าทำไมเขาถึงสามารถทำ Social credit scoring หรือทำการตรวจสอบความเคลื่อนไหวของประชาชนของเขาได้ตลอด ประสบการณ์ที่พบตั้งแต่เขาประเทศจีนครั้งแรกเขาก็สแกนลายนิ้วมือผมเก็บไว้ที่ด่านตรวจคนเข้าเมือง และหลังจากนั้นทุกครั้งที่่เข้าประเทศจีนผมก็ไม่ต้องทำการสแกนแล้วเพราะเขาได้เก็บประวัติผมไว้แล้ว และเมื่อขึ้นแท็กซี่จากสนามบินเข้ามาโรงแรมก็สังเกตเห็นรถที่เป็นรถยนต์ไฟฟ้าที่นอกจากมีระบบติดตามรถตลอดแล้วยังมีกล้องที่จับภาพทั้งคนขับและผู้โดยสารตลอดเวลา

ตอนผมเข้าไปพักที่โรงแรมงวดนี้ก็ค่อนข้างที่แปลกใจที่ทางเขาขอถ่ายรูปผมเก็บไว้ทั้งๆที่ก่อนหน้านั้นไม่เจอแบบนี้ รูปที่เขาถ่ายไปก็ไม่ได้นำไปใช้ในการอำนวยความสะดวกในการเข้าพัก แต่ใช้ในการระบุตัวตนคู่กับ  Passport ที่ผมคิดว่าเขาสามารถทำระบบจดจำใบหน้า (FacialRecognition) ได้เป็นอย่างดี ทำให้นึกถึงระบบตรวจสอบคนทำผิดกฎหมายอาทิเช่นการไม่ข้ามทางม้าลายด้วยการทำ Realtime facial recognition จากกล้อง CCTV ที่อยู่ในที่สาธารณะทั่วเมืองเมืองเซินเจิ้น หรือแม้แต่อินเตอร์เน็ตในประเทศจีนก็บล็อก Social media และ Search engine ของต่างชาติอย่าง Facebook หรือ Google คนจีนต้องใช้ระบบในประเทศอย่าง Baidu หรือ Weibo จึงไม่แปลกใจที่รัฐบาลเขาสามารถที่จะเก็บข้อมูลการใช้อินเตอร์เน็ต การใช้ Social Media และการสืบค้นข้อมูลของประชากรได้

นอกจากนี้การใช้ E-commerce และ Mobile payment ของระบบในจีนอย่าง Taobao, Tmall, Alipay หรือ WeChat ทำให้เขาสามารถติดตามพฤติกรรมของประชาชนได้ว่ามีพฤติกรรมการใช้จ่ายอย่างไร เดินทางไปไหน หรือการซื้อบัตรโดยสารหรือการแสดงต่างๆอย่างไร แม้แต่คนต่างชาติอย่างผมจะซื้อตั๋วโดยสารรถไฟ ผมก็ต้องแสดง Passport และเมื่อซื้อครั้งแรกเขาก็จะเก็บข้อมูลต่างๆของผมไปหมด การขึ้นรถไฟก็ต้องใช้ Passport สแกนผ่านประตูเข้าออกแทนที่จะใช้บัตรโดยสาร แสดงให้เห็นว่าเขาใช้วิธีการเก็บข้อมูลโดยตรงผ่าน Identity ที่อาจเป็นบัตรประชาชน, Passport, WeChat หรือ Alipay

ctm-0424-china-surveillance-cameras-social-credit-score

อย่างที่ผมเคยกล่าวไว้ว่าหลักการของ Big data ที่สำคัญคือการจะต้องมี Velocity ของข้อมูลแต่ละคนที่จะต้องเข้ามาอย่างต่อเนื่อง (ดูบทความเพิ่มเติมได้ในหัวข้อ:  Data is the new oil: มาวิเคราะห์กันว่าอุตสาหกรรมใดมีข้อมูลขนาดใหญ่) และข้อมูลลักษณะนี้อาจจำแนกได้เป็นสี่ประเภทคือ Social media, Mobile, IoT และ Transaction ซึ่งหน่วยงานที่จะสามารถวิเคราะห์ข้อมูลได้ดีจะต้องมี Big data ในลักษณะนี้ ไม่ใช่แค่ข้อมูลสรุปขนาดใหญ่ ดังนั้นจึงจะเห็นได้ว่าประเทศจีนมีการยุทธศาสตร์อย่างเป็นระบบเพื่อให้ได้ข้อมูลเหล่านี้มาเพื่อมาใช้ในการทำ Big data analytics ในเรื่องต่างๆ ซึ่งนอกเหนือจากการวางกลยุทธ์ในการเก็บข้อมูลที่ทางรัฐบาลอาจต้องใช้กฎหมายมาบังคับแล้ว รัฐบาลเองก็ต้องลงทุนโครงสร้างพื้นฐานขนาดใหญ่ที่อาจมี Server นับล้านเครื่องในการเก็บและวิเคราะห์ข้อมูลขนาดใหญ่เหล่านี้

การเก็บข้อมูลประชาชนของรัฐบาลจีน มีอยู่ในหลายๆมิติอาทิเช่น

  • การติดตั้งกล้อง CCTV ที่สามารถใช้ระบบ Facial recognition ตรวจสอบพฤติกรรมประชาชนทั่วประเทศจีนจำนวน 176 ล้านตัวและจะขยายเป็น 450 ล้านตัวในปี 2020
  • การติดตามข้อมูลการซื้อสินค้าออนไลน์และการใช้จ่ายเงินผ่าน  Mobile payment อย่าง Alipay หรือ WeChat ที่เอาทำ Social credit scoring อย่าง Zhima (Sesame) Credit
  • การบังคับให้รถยนต์ไฟฟ้าทุกยี่ห้อทั้งในและต่างประเทศตั้งแต่ Tesla, Volkswagen, BMW, Ford, General Motors, Nissan, BYD ต้องส่งข้อมูลตำแหน่งรถยนต์กลับมายังรัฐบาลตลอดเวลา
  • การดึงข้อมูลจาก Mobile App ต่างๆเข้ามา และมีการบังคับให้คนบางกลุ่มเช่นชาวอุยกูร์ต้องติดตั้ง Mobile App ที่ชื่อ Jingwang เพื่อตรวจสอบรูปภาพ ไฟล์ หรือเอกสารต่างๆที่อยู่ในมือถือ

จากตัวอย่างของข้อมูลที่เก็บมาจึงไม่แปลกใจที่เขาจะสามารถตรวจสอบความเคลื่อนไหวของประชาชนได้ตลอด ถ้ามองในแง่ของความสะดวกสบายและความปลอดภัยก็อาจเป็นเรื่องดี แต่ถ้ามองในแง่ของเสรีภาพและสิทธิส่วนบุคคลก็เริ่มเป็นข้อสงสัยที่ทุกถาม ดังนั้นถ้ามองในแง่ของเทคโนโลยีก็ไม่ต้องแปลกใจว่าทำไม Big data analytics ของประเทศจีนมีความก้าวหน้าไปอย่างมากแต่ก็แลกมาด้วยข้อมูลส่วนบุคคลที่อาจถูกละเมิด

ธนชาติ นุ่มนนท์

IMC Institute

ทริปดูงานเมืองเซินเจิ้นเดือนเมษายน 2019

Screenshot 2019-04-12 11.00.11

สองสัปดาห์นี้ผมได้เดินทางไปประเทศจีนสองครั้ง สัปดาห์ก่อนผมไปเมืองเซินเจิ้นและฮ่องกงกับทีมงานของสภามหาวิทยาลัยขอนแก่น และสัปดาห์นี้ก็ไปเมืองกวางโจวและเซินเจิ้นกับผู้เข้าอบรมของสถาบันไอเอ็มซี ทั้งสองทริปที่เดินทางไปก็เกี่ยวข้องกับเรื่องของเทคโนโลยีไอทีและการไปดูงานนิทรรศการและบริษัทด้านไอทีในเมืองเซินเจิ้น สองปีที่ผ่านมาผมเดินทางมาเมืองเซินเจิ้น 5 ครั้งและมีโอกาสได้ไปดูงานนิทรรศการไอทีเขาแทบทุกครั้ง อย่างสัปดาห์นี้ผมก็ไปดูงาน China Informatiion Technology Expo ซึ่งเขาจัดเป็นครั้งที่ 7 ทุกครั้งที่ไปดูงานของเขาก็จะเห็นความก้าวหน้าของบริษัทของเขาที่มาออกบูธเป็นพันๆบริษัทเพิ่มขึ้นไปเรื่อยๆ งานครั้งนี้เขาก็จัดทั้งหมด 9 Hall และที่มาออกงานเกือบ 100% เป็นบริษัทในจีนที่ส่วนมากมาจากเมืองเซินเจิ้น งานนี้เราจะเห็นแทบทุกค่ายเอาเรื่องของ Smart devices,Robot,  IoT และ AI มาแสดง เห็นสินค้าของเขาแล้วไม่แปลกใจที่จะบอกได้เต็มที่ว่าเขา Hardware Silicon Valley ได้อย่างแท้จริง คนที่นี่เขาบอกผมว่าถ้าต้องการจัดซื้อส่วนประกอบอุปกรณ์ Smartphone จากผู้ผลิตรายต่างๆ 400 ชิ้นในเมืองเซินเจิ้นอาจใช้เวลาเพียงแค่ 3 วันในการหาเทียบกับเวลา 60 วันในการหาที่ Silicon Valley ในอเมริกา และถ้าเราต้องการผลิต Smartphone เพื่อทำเป็นสินค้าซักยี่ห้อหนึ่งก็จะใช้เวลาเพียง 90 วันเมื่อเทียบกับ 240 วันใน Silicon Valley

รูปที่  1 งาน CITE 2019

อีกสิ่งหนึ่งที่สังเกตได้คือคนทำงานรวมถึงคนที่มาเดินดูนิทรรศการส่วนใหญ่จะเป็นคนหนุ่มสาว ผมเข้าไปดูงานบางบริษัทรู้สึกเลยได้ว่าเราเองอายุมากกว่าพวกเขามาก เมืองเซินเจิ้นมีความเจริญมากและเมืองที่มี GDP สูงสุดเมืองหนึ่งของจีน โดยมีรายได้หลักมาจากด้านไอที ซึ่งก็มีบริษัทใหญ่ๆที่อยู่ในเมืองนี้มากมายอย่าง Huawei, ZTE, Tencent, DJI หรือ BYD เขามีความร่วมมือกับมหาวิทยาลัยต่างๆในจีนทำให้มีบุคลากรรุ่นใหม่ที่เข้ามาทำงานจำนวนมาก ประกอบกับนโยบายทำให้เมืองเซินเจิ้นเป็นเขตเศรษฐกิจพิเศษก็เลยยิ่งทำให้เขาเจริญเติบโตมากยิ่งขึ้นไปเรื่อย ทุกครั้งที่เดินทางไปก็จะให้ตึกใหม่ๆเกิดขึ้นมากมายและสร้างขึ้นด้วยความรวดเร็ว ที่น่าสนใจเขาเองก็ Industrial park จำนวนมากที่ได้รับการสนับสนุนจากรัฐบาลอาทิเช่น Shenzhen Hi-Tech Industrial Park (SHIP) ที่มีคนวัยหนุ่มสาวมาทำงาน คนที่นี่บอกผมว่าคนไอทีของเขาทำงานแบบ 996 คือเริ่มงาน 9 โมงเช้า เลิก 9 โมงเย็น และทำงานอาทิตย์ละ 6 วัน ซึ่งนอกจากเห็นความขยันขันแข็งของคนทำงานแล้ว อีกสิ่งหนึ่งที่เห็นก็คือการใส่ใจในเรื่องการศึกษาการส่งเสริมให้บุคลากรเขาได้เรียนรู้เทคโนโลยีใหม่อย่างด้าน AI อย่างจริงจัง

รูปที่  2 การดูงานที่บริษัท Royole

รูปที่  3 การดูงานบริษัท UBTech

ทั้งสองทริปนี้ผมมีโอกาสได้ไปดูบริษัทที่เป็น Top 10 Unicorn ของจีนสองบริษัท บริษัทแรกคือ Royole ซึ่งเป็นผู้ผลิตจอพับได้ให้กับบริษัทมือถือต่างๆ และบริษัท UBTech ที่ทำทางด้านหุ่นยนต์และ AI ทั้งสองบริษัทมีนวัตกรรมจำนวนมากที่จดเป็นสิทธิบัตรนับพันรายการ และยังมีพนักงานเป็นหมื่นคน มีการทำ R&D อยู่ในหลายประเทศและมีการขายสินค้าออกไปทั่วโลกรวมทั้งประเทศไทย ซึ่งไม่น่าเชื่อว่าบริษัทที่เพิ่งก่อตั้งมาเพียงแค่สิบปีจะเติบโตได้รวดเร็วขนาดนี้ ส่วนหนึ่งนอกจากการมีนวัตกรรมที่ดีมีคนที่มีความสามารถจำนวน ก็ต้องยอมรับว่าเขาได้รับการสนับสนุนที่ดีจากภาครัฐด้วย นอกจากนี้ผมยังมีโอกาสได้เยี่ยมชม F518 ซึ่งเป็น industrial park ด้าน Creative Design และไอที ซึ่งรัฐบาลเขาได้จัดตั้งขึ้นโดยการแปลงโรงงานเก่าๆให้เป็นที่ตั้งของบริษัท ซึ่งก็สามารถบริษัททางด้าน Industrial Design และไอทีออกไปได้หลายร้อยบริษัท

รูปที่ 4  การดูงาน F518

ทริปหลังนี้ผมยังมีโอกาสแวะไปกวางโจวไปเห็นตลาดค้าส่งไอทีของเขา เขามีร้านค้าจำนวนมากเป็นหลายพันร้านที่นำสินค้าไอทีที่ผลิดในจีนมาขายส่งออกไปต่างประเทศ ผู้ซื้อมาจากหลายประเทศและสามารถที่จะซื้อสินค้าหลาหลายชนิดที่มีนวัตกรรมกรรมใหม่ๆมากมายและมีราคาถูกกลับไปขายที่ประเทศตัวเองได้ เห็นสินค้าที่มาแสดงแล้วตั้งแต่คอมพิวเตอร์ มือถือ IOT หุ่นยนต์ อุปกรณ์ accessory ต่างๆอุปกรณ์ไอทีจำนวนมากแล้ว ไม่แปลกใจว่าทำไมชาติตะวันตกถึงกลัวจีน วันนี้จีนได้กลายเป็นชาติที่เน้นการทำนวัตกรรม ไม่ใช่แหล่งสินค้าก็อปปี้แบบเดิม และหลายๆอย่างที่เขาคิด ไปไกลมากๆจนบางครั้งเราก็งงว่าเขาคิดได้อย่างไร เพราะเราคาดไม่ถึงในนวัตกรรมของเขา

รูปที่ 5 ตลาดค้าส่งไอทีในเมืองกวางโจว

ทุกทริปที่มาจีนเห็นการเปลี่ยนแปลงตลอดและต้องยอมรับกันเลยว่า ความสำเร็จของเขาไม่ได้มาได้เพียงไม่กี่ปีอันสั้น แต่เป็นเพราะเขาพัฒนาคนอย่างต่อเนื่อง และมีการสนับสนุนอย่างเป็นระบบจึงมาถึงจุดนี้ได้ ผมว่าสิ่งสำคัญที่สุดในการพัฒนาประเทศคือคุณภาพของคนไม่ว่าจะปกครองด้วยระบบอะไรก็ตาม

ดูบทความอื่นๆที่เกี่ยวข้อง

 

ธนชาติ นุ่มนนท์

IMC Institute

กลยุทธ์เปลี่ยนแปลงบริษัทสู่ยุค AI

edm_sep

ช่วงสัปดาห์ที่ผ่านมาผมได้เรียนหลักสูตรออนไลน์ของ Andrew Ng เรื่อง AI for Everyoneใน Coursera และได้อ่านหนังสือ AI Transformation Playbook ของเขา ผมว่าเขากล่าวได้ดีในเรื่องที่น่าสนใจเกี่ยวกับการเปลี่ยนแปลงบริษัทใดๆให้เป็นบริษัทปัญญาประดิษฐ์ (AI Company) โดยกล่าวว่าทุกบริษัทสามารถที่จะปรับเปลี่ยนได้ในยุคของ  AI โดยควรคำนึงถึงด้านต่างๆดังนี้

  • ต้องมีกลยุทธ์ในการเก็บข้อมูลจำนวนมากเข้ามากโดยอาจผ่านสินค้าหรือบริการที่บางอย่างอาจไม่ได้สร้างรายได้ให้กับบริษัทโดยตรงเช่น Google ได้พัฒนา Gmail หรือ Fitbit ได้พัฒนา Wearable Device
  • ต้องมีการพัฒนา Data Warehouse ที่เป็นศูนย์กลางหนึ่งเดียวในการเก็บข้อมูลของทั้งบริษัทจากแหล่งต่างๆ หรืออาจสร้าง Data Lake ในการเก็บข้อมูลดิบ
  • ให้ความสำคัญและมองเห็นโอกาสในการทำระบบ automation ในบริษัท
  • มีแผนกและตำแหน่งใหม่ๆในบริษัทเช่น วิศวกรด้าน Machine Learning, นักวิทยาศาสตร์ข้อมูล หรือแผนก AI

ซึ่งทาง Andrew Ng ก็ได้ระบุขั้นตอนในการเปลี่ยนแปลงบริษัทในยุค AI ไว้ 5 ขั้นตอน โดยเขาได้บอกว่าเราไม่จำเป็นต้องทำตามลำดับนี้ทุกขั้นตอน แต่ก็ควรที่จะเริ่มต้นจากการทำขั้นตอนแรก (ทำ AI Pilot Project) เสมอ โดยมีขั้นตอนดังนี้

  • ขั้นตอนที่ 1 ทดลองทำ AI pilot project เพื่อสร้างแรงกระตุ้นให้กับบริษัท โดยเน้นให้เลือกโปรเจ็คที่น่าจะทำสำเร็จมากกว่าโปรเจ็คที่อาจสร้างผลกำไรให้กับบริษัทโดยตรง โดยโปรเจ็คอาจมีระยะเวลา 6-12 เดือน ซึ่งอาจเป็นการพัฒนาโดยทีมภายในหรือจ้างข้างนอกทำ ทั้งนี้เพื่อที่จะให้บริษัทเห็นผลสัมฤทธิ์ของการทำ AI และมีแรงกระตุ้นและความเข้าใจในการพัฒนาโปรเจ็ค AI อื่นๆต่อไป
  • ขั้นตอนที่ 2 สร้างทีมงาน In-house AI โดยเป็นทีมงานกลางที่จะช่วยสนับสนุนการทำ AI ให้กับแผนกต่างๆของบริษัท ทั้งนี้บริษัทอาจจะมี AI Platform ที่ทุกแผนกสามารถใช้งานได้และทีมงานนี้จะมาช่วยในการพัฒนา โดยทีมงานอาจอยู่ภายใต้  CEO, Chief Information Officer,  Chief Technology Officer หรือ Chief Data Officer ก็ได้ดังรูปที่ 1

Screenshot 2019-04-06 15.35.14

รูปที่  1 โครงสร้างทีมงาน In-house AI [จาก AI Transformation Playbook]

  • ขั้นตอนที่ 3 ทำการอบรม  AI ให้กับบุคลากรทุกฝ่ายในบริษัท โดย Andrew Ng ได้สรุปให้เห็นว่าในแต่ละตำแหน่งควรจะอบรมด้านใด ดังตารางนี้

56433434_366038604252091_2339677683534790656_n

ตารางที่  1 การอบรม  AI [จาก เอกสารอบรม AI for Everyone ของ Andrew Ng]

  • ขั้นตอนที่ 4 การกำหนดกลยุทธ์ด้าน AI ทั้งนี้ Andrew Ng ได้แนะนำว่าเราไม่ควรกำหนดกลยุทธ์ไว้ขั้นตอนแรก เพราะเราควรจะมีการทำ Pilot Project ก่อนเพื่อทำความเข้าใจด้าน AI และเน้นการกำหนดกลยุทธ์ที่จะทำให้บริษัทมีข้อได้เปรียบเหนือคู่แข่งในอุตสาหกรรม และกลยุทธ์ควรสอดคล้องกับสิ่งที่เรียกว่า Virtuous cycle of AI  ดังรูปที่ 2 กล่าวคือถ้าบริษัทมีข้อมูลมากขึ้นก็จะสามารถทำ AI ได้ดีขึ้นก็สร้าง Product ที่ดีขึ้นและมีลูกค้ามากขึ้นตามลำดับ (ดังที่ผมเคยเขียนไว้เรื่องวัฎจักรของข้อมูล AI และรายได้ในบทความ Data is the new oil: มาวิเคราะห์กันว่าอุตสาหกรรมใดมีข้อมูลขนาดใหญ่)

Screenshot 2019-04-06 15.56.21

รูปที่  2 Virtuous cycle of AI  [จาก AI Transformation Playbook]

นอกจากนี้บริษัทควรจะมีกลยุทธ์ด้านข้อมูล (Data Strategy) โดยเฉพาะเรื่องของการเก็บและดึงข้อมูล, การพัฒนา Data Lake และ การเข้าใจถึงคุณค่าของข้อมูลต่างๆ

  • ขั้นตอนที่ 5 ทำการสื่อสารทั้งภายในและภายนอกบริษัท เพื่อให้ทราบว่าบริษัทกำลังพัฒนาด้าน AI ทำการสื่อสารกับนักลงทุน ทำการสื่อสารกับหน่วยงานภาครัฐที่ AI อาจไปกระทบกับกฎระเบียบต่างๆ ทำการสื่อสารกับลูกค้าและผู้ใช่ถ้ามีการนำ AI เข้ามาใช้งาน และทำการสื่อสารกับบุคลากรภายในเพื่อให้เข้าใจการเปลี่ยนแปลง

ธนชาติ นุ่มนนท์

IMC Institute

การเปรียบเทียบ Big Data Solution ต่างๆทั้ง On-Premise และ Public Cloud

Screenshot 2019-03-24 10.21.51.png

วันก่อนเขียนเรื่องการทำ Big Data Platform บน Hybrid/Multi Cloud หลายๆท่านก็อาจสนใจต่อว่า แล้วเราควรเลือกโซลูชั่นของรายไหน จริงๆผมเองก็ไม่มีคำตอบที่ชัดเจน แต่หากเราแบ่งกลุ่มกันก็จะเห็นว่า มีรายที่ทำ On-Premise คือ  Oracle, IBM, SAP, Cloudera, Hortonworks, MapR, Huawei เป็นหลัก แต่กลุ่มเหล่านี้ก็มุ่งที่จะพัฒนาโซลูชั่น On-Cloud เสริมมา เพื่อสร้างเป็น Hybrid/Multi Cloud  ส่วนรายที่เป็นระบบ On-Cloud อย่าง AWS, Google, Azure หรือ Alibaba ก็พยายามทำให้โซลูชั่นของตัวเองทำงานร่วมกับระบบ On-Premise หรือ Cloud Provider รายอื่นได้

Screenshot 2019-03-24 10.40.44

รูปที่ 1 Magic Quadrant for Data Management Solutions for Analytics ของ Gartner

หากจะเปรียบเทียบ Big Data Solution ต่างๆ ผมแนะนำให้ไปดูรายงาน Gartner เรื่อง Magic Quadrant for Data Management Solutions for Analytics ที่ออกมาเมื่อเดือนมกราคม 2519 ซึ่งได้ทำการเปรียบเทียบโซลูชั่นต่างๆจำนวนมาก และสรุปเป็น Magic Quadrant ดังรูปที่ 1 ทั้งนี้ผมได้ทำตารางสรุปข้อมูลที่ Gartner รายงานไว้ว่าแต่ละรายมีโซลูชั่นใดบ้าง และมีจุดแข็งและข้อพึงระวังอย่างไร ดังตารางข้างล่างนี้

ธนชาติ นุ่มนนท์

IMC Institute

Screenshot 2019-03-24 10.43.09Screenshot 2019-03-24 10.42.52Screenshot 2019-03-24 10.42.26

Big Data Platform บน Hybrid/Multi Cloud แนวทางในการวางระบบ Big Data ขององค์กร

Screenshot 2019-03-14 09.57.10

วันก่อนไปบรรยายมีคนถามผมว่าจะติดตั้งระบบ Big Data ในองค์กร ใช้โซลูชั่นของใครดี จะทำเป็นระบบ On-Premise หรือควรใช้ Public Cloud

คงต้องอธิบายว่าระบบ  Big Data จะประกอบไปด้วยเทคโนโลยีอยู่ 4 ด้านคือ  Data Ingestion/Collection, Data Storage, Data Processing และ Data Visualisation และหลักการทำ  Big Data คือเน้นการสร้าง Data Lake ที่เราจะต้องนำข้อมูลดิบที่มีปริมาณมหาศาลมาเก็บไว้ในระยะยาว ซึ่งอาจเป็นข้อมูลธุรกรรมต่างๆ ข้อมูล IoT ซึ่งข้อมูลเหล่านี้มีปริมาณเห็นหลายสิบล้าน หรือจำนวนหลาย TeraByte ทั้งนี้ขึ้นอยู่กับประเภทธุรกิจ บางธุรกิจเช่น Telecom อาจมีบริมาณเป็นหลาย TB ต่อวัน หรือธนาคารก็อาจเป็นจำนวนพันล้านเรคอร์ดต่อปี

การที่ต้องเก็บข้อมูลจำนวนมากและการเก็บข้อมูลต้องพร้อมที่จะประมวลผลในเวลารวดเร็ว จึงเป็นความท้าทายที่ต้องหา Storage ขนาดใหญ่ ซึ่งต้องขยายได้อย่างรวดเร็ว มีราคาถูก และมีความเสถียร ก็เลยเป็นไปได้ยากที่เราจะพัฒนาระบบ Hadoop แบบ On-Premise แล้วในอนาคตต้องขยายระบบไปเรื่อยๆเพื่อจะเก็บข้อมูลทั้งหมด ดังนั้นแนวทางที่ดีคือการเก็บข้อมูลขนาดใหญ่ไว้บน  Public Cloud Storage ที่จะตอบโจทย์เหลือราคาความเสถียรและขนาดการเก็บได้ดีกว่า เช่นการใช้ Amazon S3, Azure Data Lake Storage (ADLS) และ Google Cloud Storage เป็นต้น  แล้วก็นำข้อมูลที่จะเป็นที่อาจมีความสำคัญอย่างมากที่ไม่อยากนำไปเก็บออกนอกองค์กรมาใส่ไว้ใน Storage ของ Hadoop HDFS ที่เราอาจติดตั้งระบบ Cluster ขนาดเหมาะสมไว้ในองค์กร (On-Premise) แต่ไม่จำเป็นต้องเป็นระบบที่ใหญ่มากนัก

ในแง่ของการประมวลผลข้อมูล (Data Processing) เราสามารถที่จะใช้ Hadoop On-Premise มาทำการประมวลโดยผ่านเทคโนโลยีอย่าง Spark, Hive หรือเครื่องมืออื่นๆ แต่ความท้าทายก็อาจจะอยู่ที่เมื่อต้องการประมวลผลข้อมูลที่ใหญ่มากๆเช่น การทำ Machine Learning กับข้อมูลเป็นสิบหรือร้อยล้านเรคอร์ด กรณีนี้เราจำเป็นต้องการระบบ Cluster ที่มี CPU จำนวนมากซึ่งระบบ On-Premise ไม่สามารถจะรองรับได้ จึงอาจต้องใช้ Services ของ Public Cloud เช่น  AWS EMR, Google DataProc, Azure HDinsight ที่เราสามารถกำหนด CPU จำนวนมากได้ หรือบางครั้งก็อาจใช้บริการประมวลผลอื่นๆที่มีอยู่บน Public cloud ซึ่งสามารถช่วยในการประมวลผลอย่างรวดเร็วได้อย่างเช่น Google BigQuery, Azure ML, AWS Athena ก็จะยิ่งทำให้ได้ประสิทธิภาพดีขึ้น ข้อสำคัญการประมวลผลแบบนี้ราคาขึ้นอยู่กับการเวลาในการใช้งานซึ่งถูกกว่าติดตั้งระบบ On-Premise ขนาดใหญ่มากๆ

ในด้านการดึงข้อมูลเข้า Storage  (Data Ingestion) ก็คงจะต้องพิจารณาว่าต้นทางของข้อมูลอยู่ที่ใดและ Storage อยู่ที่ใด ถ้าข้อมูลที่จะดึงเข้าจำนวนมากอยู่ในองค์กรก็ควรที่จะตั้งระบบแบบ On-Premise หรือ ถ้าอยู่ภายนอกก็อาจใช้ Public cloud service ส่วนการเลือกใช้เครื่องมือด้าน Visualisation ที่อาจต้องมีทั้งสองระบบ โดยระบบ On-Premise ใช้กับการแสดงข้อมูลภายในองค์กรผ่าน Desktop ส่วนกรณีแสดงผลผ่านเว็บหรืออินเตอร์เน็ตอาจพิจารณาใช้ Public cloud โดยรูปที่ 1 ได้สรุปแนวทางการทำ Big Data Platform โดยทาง Hybrid/Multi Cloud ตามที่อธิบายไว้ข้างต้น

Screenshot 2019-03-23 13.25.45

รูปที่ 1 ตัวอย่างระบบ Big Data  บน Hybrid/Multi Cloud

แนวทางการติดตั้งระบบ  Big Data ที่ดีควรเริ่มจากการทำบน Public Cloud เพื่อความรวดเร็วในการดำเนินงานและลดค่าใช้จ่าย เมื่อเริ่มเห็นผลก็อาจมีการติดตั้งระบบ On-Premise ที่มีขนาดเหมาะสม แล้วมีการ Transfer ข้อมูลไปมากันทั้งสองระบบ โดยเน้นให้ Public cloud เก็บข้อมูลขนาดใหญ่และประมวลผลขนาดใหญ่ ส่วน Hadoop On-Premise เน้นข้อมูลที่สำคัญและต้องการประมวลผลในองค์กร ซึ่งแนวโน้มของผู้ผลิตในระบบ On-Premise ต่างๆเช่น Cloudera หรือ Hortonworks ก็เน้นไปสู่ Hybrid/Multi Cloud ดังแสดงตัวอย่างดังรูปที่ 2

Screenshot 2019-03-23 13.26.19

รูปที่ 2 ตัวอย่างโซลูชั่นของ Hortonworks ทีเน้น Multi-Cloud

สุดท้ายผมได้ทำตารางข้างล่างมาเปรียบเทียบระหว่างระบบ On-Premise กับ Public Cloud Service ต่างๆมาให้เพื่อพิจารณาเลือกใช้บริการต่อไป

ธนชาติ นุ่มนนท์

IMC Institute

Screenshot 2019-03-23 13.26.37Screenshot 2019-03-23 13.26.49

 

ผลการสำรวจการใช้ Cloud Computing ทั่วโลกปี 2019

Screenshot 2019-03-14 09.57.10

ผมตามผลการสำรวจ Cloud Computing ของบริษัท RightScale ทุกปี เพื่อจะได้ทราบแนวโน้มการใช้ Cloud Computing ในด้านต่างๆของผู้ใช้ในองค์กรรูปแบบต่างๆทั่วโลก สำหรับในปีนี้ทาง RightScale ได้ออกรายงาน State of the cloud 2019 from Flexera™ มาเมื่อปลายเดือนกุมภาพันธ์ โดยมีการสำรวจข้อมูลจากกลุ่มตัวอย่าง 786 ราย โดยเป็นองค์กรขนาดใหญ่ 456 รายและ SME 330 ราย โดย 59% มาจากทวีปอเมริกาเหนือ ยุโรป 16% และเป็นเอเซียแปซิฟิก 19% โดยกลุ่มตัวอย่างมาจากอุตสาหกรรมต่างๆดังรูปที่ 1

Screenshot 2019-03-14 10.04.45

รูปที่ 1 กลุ่มตัวอย่างแบ่งตามประเภทอุตสาหกรรม

ผลการสำรวจมีข้อมูลที่น่าสนใจหลายๆด้านที่ผมอยากสรุปมาสั้นๆดังนี้

  • 94% ของผู้ตอบแบบสอบถาม กำลังใช้ Cloud โดย 69% ใช้  Hybrid Cloud, 22% ใช้ Public cloud อย่างเดียว และ 3% ใช้ Private cloud อย่างเดียว
  • 84% ใช้ Cloud อยู่หลายราย  (Multi-cloud)
  • ค่าใช้จ่าย Public Cloud ขององค์กรต่างๆขนาดใหญ่จะสูงกว่า 2.4 ล้านเหรียญสหรัฐต่อปี หรือประมาณเดือนละ 200,000 เหรียญ แต่ถ้าเป็น SME มากกว่า 50% จะมีรายจ่ายต่ำกว่า 120,000 ล้านเหรียญสหรัฐต่อปี หรือประมาณเดือนละ 10,000 เหรียญ ดังแสดงในรูปที่ 2
  • การใช้ Public cloud  โตขึ้นอย่างมากถึง 24%  ขนาดที่ Private cloud โตเพียง 8%
  • ความท้าทายของการ Cloud ที่องค์กรให้ความสำคัญสามเรื่องคือ Governance, ขาดความเชี่ยวชาญและ การควบคุมค่าใช้จ่าย ทั้งนี้ขึ้นอยู่กับประสบการณ์การใช้ ดังแสดงในรูปที่ 3
  • AWS ยังเป็น Public cloud ที่มีผู้ใช้มากที่สุด และ Azure มีการเติบโตขึ้นอย่างมาก (โดยปีที่แล้วมีผู้ใช้ 45% แต่โตขึ้นเป็น 52% ส่วน AWS ลดลงจาก 64% เหลือ 61%) ดังแสดงในรูปที่ 4
  • ผู้ใช้บริการ PaaS ส่วนใหญ่จะเลือกใช้ Relational Database as a Service และ Push notification ขนาดที่การใช้บริการ Serverless , Stream processing และ Machine learning  เติบโตขึ้นมากกว่า 45% ดังแสดงในรูปที่ 5
  • VMware sphere ยังเป็น Private Cloud ที่นิยมมากที่สุดตามด้วย OpenStack ดังแสดงในรูปที่ 6
  • Docker ยังเป็น Container ที่คนใช้มากที่สุด แต่ Kubernate โตขึ้นอย่างมาก ดังแสดงในรูปที่ 7

ผู้สนใจสามารถอ่านรายงานฉบับเต็มได้ที่เว็บไซต์ของ RightScale >> https://www.rightscale.com/blog/cloud-industry-insights/cloud-computing-trends-2019-state-cloud-survey

ธนชาติ นุ่มนนท์

IMC Institute

 

Screenshot 2019-03-14 10.16.42

รูปที่ 2 ค่าใช้จ่าย Public Cloud ต่อปีขององค์กรต่างๆ

Screenshot 2019-03-14 10.22.11

รูปที่ 3 ความท้าทายของการใช้ Cloud แบ่งแยกตามระดับประสบการณ์การใช้

Screenshot 2019-03-14 10.27.33

รูปที่ 4 ส้ดส่วนการใช้ Public Cloud ของผู้ให้บริการต่างๆ

Screenshot 2019-03-14 10.30.58

รูปที่ 5  PaaS Public Cloud แบ่งตามประเภทการให้บริการ

Screenshot 2019-03-14 10.36.41

รูปที่ 6 สัดส่วนการใช้ Private Cloud

Screenshot 2019-03-14 10.39.29

รูปที่ 7 สัดส่วนการใช้ Container

 

กลยุทธ์สู่ความสำเร็จด้าน Digital Transformation จาก Framework ของ BCG

Screenshot 2019-08-07 18.47.17

พลวัตแห่งการเปลี่ยนแปลงของเทคโนโลยีดิจิทัล ซึ่งเป็นสิ่งใหม่ เช่น ไอโอที , บิ๊กดาต้า, เอไอ, และคลาวด์ คอมพิวติ้ง ที่เกิดขึ้นอย่างรวดเร็วทำให้อุตสาหกรรมต่างๆ เรียกปรากฎการณ์นี้ว่าดิจิทัล ดิสรัปชั่น (Digital Disruption) ส่งผลให้องค์กรเกิดแนวคิดที่จะทำเรื่องดิจิทัล ทรานส์ฟอร์เมชั่น (Digital Transformation) แต่ปัญหาหลักคือ เมื่อลงทุนไปแล้วกลับพบว่า ไม่ทำให้ธุรกิจดีขึ้น ซ้ำร้ายบางองค์กร พบว่า เทคโนโลยีไอทีที่ลงทุนไปไม่ได้ใช้งานให้คุ้มค่า

ความไม่สำเร็จของดิจิทัล ทรานส์ฟอร์เมชั่น มาจากผู้บริหารเข้าใจผิดคิดว่า เป็นเรื่องของเทคโนโลยี จึงมอบภารกิจให้แผนกไอที ทั้งที่แท้จริงแล้วเป็นเรื่องเปลี่ยนแปลง (Transformation) ดังนั้น จึงควรให้ความสำคัญต่อกลยุทธ์องค์กรให้เกิดการเปลี่ยนแปลง คำนึงถึงเทคโนโลยีดิจิทัลมากกว่า มุ่งนำเทคโนโลยีดิจิทัลต่างๆ มาติดตั้งในองค์กร

องค์กรต้องเข้าใจความแตกต่างระหว่าง Digitization และ Digitalization ซึ่งเป็นการลงทุนระบบเทคโนโลยีดิจิทัล เช่น การจัดหาระบบคอมพิวเตอร์, การจัดทำอีอาร์พี, ซีอาร์เอ็ม, การเก็บข้อมูลขึ้นระบบคลาวด์ หรือการแปลงข้อมูลต่างๆ ในองค์กรให้อยู่ในรูปดิจิทัล เหล่านี้เป็นเพียงขั้นตอนการทำ Digitization แต่สำหรับ Digitalization คือ การนำเทคโนโลยีดิจิทัลใหม่ๆ เข้ามาแล้วทำให้กระบวนการทำงานเปลี่ยนไป ทำงานมีประสิทธิภาพขึ้น ข้อสำคัญคือ เปลี่ยนประสบการณ์ผู้บริโภค (Customer Experience) ทำให้การตัดสินใจซื้อ (Customer Journey) เปลี่ยนโดยใช้เทคโนโลยีดิจิทัล ซึ่งดิจิทัล ทรานส์ฟอร์เมชั่น คือ ผลลัพธ์ที่ได้จากการทำ Digitalization นั่นเอง

ตัวอย่างของการมอง Customer journey อาจยกตัวอย่างเช่น ธนาคารอาจมีขั้นตอนสำหรับลูกค้าในการเปิดบัญชี,การตรวจสอบวงเงิน หรือ การชำระค่าบริการ ที่ในรูปแบบเดิมๆอาจมีล่าช้าและซับซ้อน ซึ่งเราสามารถที่จะใช้เทคโนโลยีดิจิทัลทำให้ประสบประการณ์ของลูกค้าเปลี่ยนไปในทางที่ดีขึ้น โดยใช้   Mobile banking, Face Recognition, Mobile payment หรือ IoT เป็นต้น

คำถามที่น่าสนใจคือแล้วเราจะมีขั้นตอนในการทำ  Digital transformation ได้อย่างไร วันก่อนผมได้เรียนหลักสูตรนี้ของ coursera ที่สอนโดย Boston Consulting Group (BCG) แล้วพูดถึง Framework ในการทำ Digital Transformation ที่แบ่งเป็นองค์ประกอบอยู่ 4 ด้านดังรูปที่ 1 จึงอยากจะมาสรุปให้สั้นๆดังนี้

Screenshot 2019-02-19 13.03.56

รูปที่ 1   Digital transformation framework ของ  BCG

องค์ประกอบที่ 1 Business strategy driven by digital: การวางแผนกลยุทธ์ธุรกิจขององค์กรวันนี้ต้องเป็นหนึ่งเดียวกันกับกลยุทธ์ด้านดิจิทัล โดยจะต้องมองแนวโน้มด้านดิจิทัลที่จะมีผลต่อธุรกิจอาทิเช่น พิจารณาว่าข้อมูล (Information) จะสามารถเปลี่ยนแปลงการที่จะเราเชื่อมโยงกับลูกค้าได้อย่างไร ระบบออโตเมชั่นจะเข้าเปลี่ยนแปลงองค์กรด้านต่างๆได้อย่างไร หรือเราจะสามารถพัฒนาผลิตภัณฑ์หรือบริการที่เป็นรูปแบบดิจิทัลได้อย่างไร (ต้องไม่แยกกลยุทธ์ดิจิทัลออกไปให้เป็นหน้าที่ของฝ่ายไอที)

องค์ประกอบที่ 2 Digitize the core: คือการนำระบบดิจิทัลเข้ามาใช้ในองค์กรเพื่อให้การทำงานมีประสิทธิภาพมากขึ้น เช่นการวางระบบ CRM, ERP หรือระบบ Automation ต่างๆ ขณะเดียวกันก็ต้องนำระบบดิจิทัลเข้าปรับในด้านของ Customer journey เพื่อเปลี่ยนประสบประการณ์ของลูกค้า

องค์ประกอบที่ 3 Seeking digital growth: คือการที่องค์กรจะต้องเปลี่ยนแปลงตัวเอง หาแนวทางการเติบโตในรูปแบบใหม่ที่ผ่านสินค้าหรือบริการที่เกิดจากนวัตกรรมด้านเทคโนโลยีดิจิทัลมากขึ้น ซึ่งบางครั้งก็อาจต้องกระทบต่อการลงทุนธุรกิจในรูปแบบเดิมๆที่อีก 3-5 ปีข้างหน้าอาจเปลี่ยนแปลงไป ซึ่งการลงทุนในด้านนี้ก็อาจต้องสร้างหน่วยธุรกิจใหม่ๆ (Growth hacker) หรือผ่านพันธมิตรใน Ecosystem ของเรา

องค์ประกอบที่ 4 Enablers: คือองค์ประกอบย่อยที่จะช่วยผลักดันให้เกิดผลสัมฤทธิ์ ดังนี้

4.1 People/Organisation: กล่าวคือจะต้องมีบุคลากรที่มีความรู้และทักษะด้านเทคโนโลยี องค์กรต้องมีความคล่องตัว  (Agile) และต้องสร้างวัฒนธรรมดิจิทัล (Digital culture) ในองค์กร

4.2 Data/analytics: กล่าวคือต้องมีการรวบรวมข้อมูลจากแหล่งต่างๆ และนำข้อมูลมาใช้ในการวิเคราะห์เพื่อสร้างความได้เปรียบเชิงธุรกิจ และมีเป้าหมายการใช้ข้อมูลที่ชัดเจน

4.3 Technology: กล่าวคือต้องมีเทคโนโลยีในองค์กรที่จะสามารถทำงานได้แบบทันทีทันใดอย่างมีประสิทธิภาพ ตลอดจนอาจต้องใช้เทคโนโลยีใหม่ๆอย่าง Data lake หรือ IoT ที่สอดคล้องกับความจำเป็นที่จะต้องเปลี่ยนแปลงองค์กรให้สามารถสร้างประสบการณ์ใหม่ให้กับลูกค้าได้ดีขึ้น

4.4 Ecosystem:  องค์กรที่ประสบความสำเร็จในการทำ  Digital transformation ส่วนมากจะไม่ได้ทำงานตามลำพัง แต่อาจอาศัยพันธมิตร และมีการสร้าง  Business platform ที่ให้หลายๆฝ่ายมีส่วนร่วมและได้รับประโยชน์

ทั้งนี้แนวทางการทำ Digital transform จาก Framework นี้อาจเริ่มต้นในลักษณะ Top-down ทีมีการกลยุทธ์มาจากผู้บริหารสูงสุด หรืออาจเป็น  Bottom-up ที่เริ่มจากหน่วยธุรกิจใดธุรกิจหนึ่ง หรือบางครั้งก็อาจเริ่มต้นด้วยการวิเคราะห์จาก Customer journey ต่างๆขององค์กร แล้วมาพิจารณาว่าเทคโนโลยีดิจิทัลจะช่วยทำใหเกิดการเปลี่ยนแปลงได้อย่างไร

ธนชาติ นุ่มนนท์

IMC institute