จะทำ Big Data ต้องเริ่มต้นที่ทำ Data Lake

Screenshot 2018-03-24 14.05.42

ช่วงนี้เห็นหน่วยงานต่างๆออกมาพูดเรื่อง Big Data กันอย่างมาก บางคนก็บอกว่าหน่วยงานใช้ Big Data ในการบริหารและตัดสินใจ บ้างก็บอกว่าใช้ในการวิเคราะห์พฤติกรรมประชาชนหรือลูกค้า เราพูดเหมือนกับว่าตอนนี้บ้านเราเรื่องนี้ก้าวหน้าไปมาก เสมือนว่าเรามีข้อมูลใหญ่มหาศาลที่เก็บและนำมาใช้แล้ว เสมือนว่าเรามีโครงสร้างพื้นฐานด้านข้อมูลที่ดีพอ และเสมือนว่าเรามีนักวิเคราะห์ข้อมูลจำนวนมาก

แต่พอหันกลับไปถามว่า แล้ว Big Data ที่ว่าข้อมูลใหญ่แค่ไหน บางคนพูดแค่หลักล้านต้นๆ ไม่มี Transaction Data พอพูดถึงข้อมูลที่เปิดออกมา (Open data) ก็กลายเป็นแค่ Summary data บ้างก็เปิดมาในรูป PDF  ไม่ใช่ข้อมูลในฟอร์แมทดิจิทัลที่พร้อมใช้งาน (อย่าง CSV) ทั้งที่การทำ Big Data ต้องเน้นที่การมี Transactional Data  หรือ Detail Data ที่เก็บรายละเอียดให้มากที่สุด ซึ่งผมเคยเขียนบทความเรื่อง “Big data ต้องเริ่มต้นจากการวิเคราะห์ Transactional data ไม่ใช่เล่นกับ summary data” แต่ก็แปลกใจที่หลายๆหน่วยงานบอกว่าทำ Big Data แต่แทบไม่มีการนำ Transactional Data มาวิเคราะห์แต่อย่างใด

อีกประเด็นที่สำคัญคือโครงสร้างพื้นฐาน ที่เคยเน้นบ่อยๆว่า เราต้องปรับโครงสร้างพื้นฐานด้านข้อมูล (Information infrastructure) โดยเน้นที่การทำ Data Lake แล้วใช้ Data Science ไม่ใช่การทำ Data Warehouse แล้วใช้ Business Intelligence ในรูปแบบเดิมๆ ซึ่งผมเคยเขียนเรื่องนี้ในบทความ “การทำโครงการ Big Data อย่างรวดเร็ว ควรเริ่มอย่างไร” แต่ในปัจจุบันหลายๆหน่วยงานก็ยังไม่เข้าใจกับการทำ Data Lake แล้วก็ยังเน้นไปที่ Data Warehouse อย่างเดิมทั้งๆที่ Data Warehouse จะไม่สามารถรองรับข้อมูลขนาดใหญ่ (Volume) หรือข้อมูลหลากหลายประเภท (Variety) ซึ่งเป็นนิยามสำคัญของ Big Data ได้

Data Lake คืออะไร

Tamara Dull จาก SAS ให้คำนิยามของ Data Lake ไว้ว่า

Dark lake is a storage repository that holds a vast amount of raw data in its native format, including structured, unstructured and semi-structured data. The data structure and requirements are not defined until the data is needed.

จะเห็นได้ว่า Data Lake คือคลังข้อมูลขนาดใหญ่มหาศาล ซึ่งเราจะใช้เก็บข้อมูลที่เป็น Raw data ในหลากหลายรูปแบบทั้ง  Structure, unstructure หรือ semi-structure โดยข้อมูลที่เก็บจะยังไม่ต้องคำนึงถึงโครงสร้างหรือนิยามการใช้งานในตอนต้น

Screenshot 2018-03-27 09.52.29

รูปที่ 1 องค์ประกอบต่างๆของ  Data Lake

เทคโนโลยีที่ใช้เป็น Data Lake โดยมากคือ Hadoop เพราะมีราคาถูกกว่าเทคโนโลยีอื่นๆและมีเครื่องมือในการประมวลผลได้ ในขณะที่ Database หรือ No SQL จะมีข้อจำกัดที่ขนาดของข้อมูลหรือรูปแบบข้อมูลที่จะนำมาเก็บซึ่งอาจได้เฉพาะ  Structure data หรือ semi-structure data บางประเภท นอกจาก Hadoop ก็อาจมีเทคโนโลยีอื่นที่เหมาะในการทำเป็น Data lake ก็คือ Cloud storage หรือ Object storage ที่ราคาถูกกว่า ซึ่งขึ้นอยู่กับหน่วยงานว่าจะเลือกเทคโนโลยีใดมาเป็น Data Lake

ข้อมูลที่เก็บใน Data Lake  จะเป็น Raw Data ที่ไม่สามารถแก้ไขได้ แต่จะทำให้ผู้ใช้สามารถตรวจสอบและดูรายละเอียดของข้อมูลได้มากที่สุด และอาจดูข้อมูลย้อนหลังได้ แต่จุดด้อยของข้อมูลใน Data Lake คือยังเป็นข้อมูลดิบที่อาจไม่สมบูรณ์และขาดความถูกต้อง (Poor quality of data) ซึ่งผู้ใช้งานเช่น Data developer หรือ Data science จะต้องทำการ Cleansing ข้อมูลก่อนให้ Data analyst หรือ Business user นำไปใช้งาน นอกจากก็อาจมีเรื่องของความปลอดภัยของข้อมูล ดังนั้นการใช้งาน Data lake จำเป็นต้องมีการทำ Data Governance ที่ดี

 การจัด Zone สำหรับ Data Lake 

เนื่องจาก Data Lake เป็นที่เก็บข้อมูลขนาดใหญ่ซึ่งมาจากหลายแหล่ง รวมถึงข้อมูลที่ผ่านการประมวลผลแล้ว ดังนั้นการติดตั้ง Data Lake จะต้องทำการแบ่งออกเป็นโซนต่างๆ ทั้งหมด 4 ส่วน ดังนี้

Screenshot 2018-03-27 10.07.21

รูปที่  2 แสดงโซนต่างๆ ของ Data Lake (จาก Data Lake Governance Best Practices, Parth Patel and Adam Diaz)

  1. Transient Zone ข้อมูลที่เข้าสู่ Data Lake จะถูกนำมาพักไว้ใน Zone นี้ก่อนบันทึกลง Storage  
  2. Raw Zone เป็นข้อมูลดิบที่ยังไม่ผ่านการทำความสะอาดหรือปรับรูปแบบใดๆ ซึ่งโดยส่วนใหญ่แล้วนักพัฒนาข้อมูล หรือนักวิทยาศาสตร์ข้อมูลมักจะใช้ข้อมูลใน Raw Zone นี้
  3. Trusted Zone เป็นข้อมูลที่มาจาก Raw Zone ซึ่งผ่านกระบวนการทำความสะอาดข้อมูลตามมาตรฐานและกฎเกณฑ์ที่กำหนดแล้วเพื่อคุณภาพข้อมูล ข้อมูลใน Zone นี้เป็นแหล่งข้อมูลหลักที่จะถูกใช้โดยนักวิเคราะห์ข้อมูลและผู้ใช้โดยทั่วไป เพื่อให้สามารถใช้ข้อมูลได้ง่าย
  4. Refined Zone เป็นข้อมูลที่ผ่านกระบวนการประมวลผลแล้ว

การจัดทำ Data Catalog

การแบ่งโฟลเดอร์ต่างๆ ใน Data Lake อาจช่วยทำให้ผู้ใช้สามารถเข้าใจโครงสร้างข้อมูลต่างๆ ที่อยู่ใน Hadoop Cluster ได้ดีขึ้น แต่ยังจำเป็นต้องหาเครื่องมือมาทำ Data Catalog เพื่อ

  • เพิ่มประสิทธิภาพของการค้นหาข้อมูล ทำให้ค้นหาข้อมูลได้เร็วและสะดวกขึ้น
  • จัดการสิทธิการเข้าถึงข้อมูลได้ดีขึ้น โดยเฉพาะข้อมูลที่อาจละเมิดสิทธิส่วนบุคคล
  • สามารถลดค่าใช้จ่ายในการเก็บข้อมูลซ้อนหรือกักตุนข้อมูล
  • สนับสนุนการติดตามข้อมูลตลอดทั้งวงจรชีวิต ของข้อมูลทำให้การทำ Data Governance สะดวกและปลอดภัยขึ้น โดยเฉพาะข้อมูลที่เกี่ยวข้องทางด้านกฎหมาย

ควรจะต้องเป็นเครื่องมือที่สามารถทำ Catalog ได้โดยอัตโนมัติและสามารถใช้งานได้โดยง่าย ซึ่งในปัจจุบันมีผู้ผลิตหลายราย เช่น Teradata Loom, Waterline Data Invertory, Cloudera Navigator, Informatica Governed หรือ Apache Atlas เป็นต้น

การใช้งาน Data Lake

เราสามารถสรุปตัวอย่างการทำงานต่างๆของ Data Lake ได้ในรูปที่ 3 ซึ่งจะเห็นขั้นตอนต่างๆในการใช้งาน Data Lake  (ในรูปคือ Hadoop ที่อาจใช้ Distribution ต่างๆอาทิเช่น Cloudera, Hortonworks หรือ  MapR) ดังนี้

Screenshot 2018-03-27 10.10.16

รูปที่  3 Data Lake ​Workflow (จาก Enterprise Data Lake: Architecture Using Big Data Technologies – Bhushan Satpute)

  1. มีการดึงมูลจากแหล่งต่างๆอาทิเช่น Transaction, OLTP, Document, IoT หรือ Social Media เข้ามาเก็บใน Data Lake
  2. ข้อมูลที่ดึงเข้ามาอาจเป็น Real-time streaming data ในบางกรณี
  3. กรณีข้อมูลที่เก็บใน Data lake เป็นข้อมูลที่มีความอ่อนไหว (sensitive data) เราอาจต้องทำการเข้ารหัสข้อมูล
  4. Data developer สามารถใช้เครื่องมือในการประมวลข้อมูลที่มากับ Data Lake เช่น Apache spark หรือ Hive เพื่อปรับปรุงข้อมูลให้มีคุณภาพมากขึ้น และอาจเก็บใน Trusted zone
  5. ทำการเคลื่อนย้ายข้อมูลที่มีคุณภาพมากขึ้นเข้าสู่ Data warehouse เพื่อให้นักวิเคราะห์ข้อมูล (Data Analyst) หรือผู้ใช้ทั่วไป (Business user) ใช้งานต่อ
  6. มีการสร้าง Schema หรือ meta-data ของข้อมูล รวมถึงการทำ Governance
  7. นักวิเคราะห์ข้อมูลหรือผู้ใช้ทั่วไป สามารถใช้เครื่องมืออย่าง Data visualization เพื่อวิเคราะห์ข้อมูลจาก  Data warehouse ได้
  8. Data scientist หรือ Data developer  ก็สามารถที่จะเข้าถึงข้อมูลของ Data Lake แล้วนำข้อมูลมาทำ Big data analytics ได้

ที่เขียนมาทั้งหมดนี้ก็เพื่อสร้างความเข้าใจให้เห็นภาพว่า หัวใจสำคัญของการทำ Big data เรื่องหนึ่งคือการพัฒนา Data Lake ในองค์กร

ธนชาติ นุ่มนนท์

IMC Institute

มีนาคม 2561

 

 

 

 

 

กฎระเบียบ EU เรื่อง GDPR (General Data Protection Regulation) กับความล่าช้าของหน่วยงานในไทย หรือเราจะเจอซ้ำรอย IUU Fishing

Screenshot 2018-03-24 14.05.42

ตอนสหภาพยุโรป (EU) ได้ให้ “ใบเหลือง” กับไทยจากปัญหา Illegal, Unreported and Unregulated (IUU) Fishing เมื่อเดือนเมษายน 2558 ระบุว่าเป็นประเทศที่ไม่ให้ความร่วมมือในการต่อต้านการทำประมงที่ผิดกฎหมาย หลังจากที่ก่อนหน้านั้นไทยถูกปรับลดอันดับไปอยู่ใน Tier 3 จากรายงานสถานการณ์การค้ามนุษย์ของสหรัฐฯ เมื่อเดือนมิถุนายน 2557 ตอนแรกผมเองก็งงว่าเกิดอะไรขึ้น แต่เมื่อพยายามทำความเข้าใจจึงทราบว่า กฎระเบียบ IUU ของ EU ถูกร่างขึ้นเพื่อช่วยขจัดปัญหาการทำประมงผิดกฎหมาย, ไร้การรายงาน และไร้การควบคุม (IUU Fishing) โดยเฉพาะ โดยเพิ่มมาตรการคว่ำบาตรการนำเข้าอาหารทะเลจากประเทศที่เพิกเฉยต่อการแก้ไขปัญหา IUU fishing เข้าไป

เรื่องดังกล่าวทำให้ เห็นแนวโน้มวิกฤติครั้งใหญ่ของอุตสาหกรรมประมงของไทย เพราะหากประเทศไทยไม่สามารถแก้ไขปัญหาการประเมิน IUU Fishing ได้ ผลกระทบที่เกิดจากการห้ามสินค้าในอุตสาหกรรมประมงที่ส่งเข้าไปขายในยุโรป โดยต่อภาพรวมจะทำให้รัฐสูญเสียตัวเลขการส่งออกว่า 1 แสนล้านบาท ทำให้ภาครัฐต้องลงมาแก้ปัญหาต่างๆอย่างจริงจัง ทั้งต้องแก้ไขกฎหมายและการตรวจสอบย้อนหลังโดยตั้งเป้าให้เราพ้นใบเหลืองได้ในปีนี้ ปัญหาส่วนหนึ่งที่เราล่าช้าจากการแก้ปัญหานี้ก็เป็นเพราะความเพิกเฉยของรัฐบาลไทยต่อกฎระเบียบ IUU ในอดีต

มาวันนี้เรากำลังจะเจอกฎระเบียบด้านข้อมูลอันใหม่ของ EU เรื่อง General Data Protection Regulation (GDPR) ที่จะมีผลใช้บังคับในวันที่ 25 พฤษภาคม 2561 ดูผ่านตาอาจคิดว่า GDPR ไม่น่าจะเกี่ยวข้องกับธุรกิจหรือหน่วยงานในไทย ซึ่งผมก็แทบจะไม่เห็นหน่วยงานของรัฐใดๆให้ความจริงจังกับกฎระเบียบนี้มากนัก แต่ก็อาจเห็นหน่วยงานอย่างการบินไทยที่สนใจเรื่องนี้เป็นพิเศษเพราะมีสาขาและเส้นทางการบินไปสู่ประเทศในกลุ่ม EU และผมเคยมีโอกาสได้บรรยายและแลกเปลี่ยนความคิด เลยทราบว่าการบินไทยให้ความสำคัญกับเรื่องนี้มากๆ (ดู  Slide การบรรยายได้ที่  >> General Data  Protection Regulation (GDPR) Compliance )

GDPR เป็นกฎระเบียบของ EU ที่ออกมาเพื่อป้องกันสิทธิส่วนบุคคลของประชาชนในกลุ่มประเทศ EU โดยระบุไว้ว่า หน่วยงานใดที่เก็บข้อมูลขอประชาชน EU ที่ไม่ปฎิบัติตามจะถูกปรับเป็นจำนวนเงินถึง 20 ล้านยูโร หรือ 2-4% ของรายได้ทั่วโลก ขึ้นอยู่กับว่าวงเงินใดมากกว่า กฎระเบียบมีผลใช้บังคับกับหน่วยงานที่อยู่ใน EU และรวมไปถึงหน่วยงานนอก EU  (ซึ่งก็อาจรวมถึงบริษัทและหน่วยงานต่างๆในประเทศไทย) ที่เก็บข้อมูลประชาชน EU หรือนำข้อมูลจากหน่วยงานอื่นไปประมวลผล

ข้อมูลส่วนบุคคลในความหมายของ GDPR ได้ครอบคลุมข้อมูลต่างๆมากมายอาทิเช่น

  • ชื่อ, วันเดือนปีเกิด, สัญชาติ, ศาสนา, เชื้อชาติ, อีเมล
  • ข้อมูลออนไลน์อาทิเช่น cookies, IP address, ข้อมูลพิกัด GPS 
  • ข้อมูล Biometric เช่นรายนิ้วมือ, รูปถ่าย
  • ข้อมูลสุขภาพ, ข้อมูลด้านการเงิน

ซึ่งหน่วยงานที่เก็บข้อมูลประชาชน EU เหล่านี้ จะต้องมีระบบที่ทราบว่าได้เก็บข้อมูลอะไรไว้ เพราะอะไร เป็นเวลานานแค่ไหน ข้อมูลเหล่านี้ได้มาจากที่ใด และนำไปแชร์หรือให้ใครประมวลข้อมูล เมื่อไร ที่ไหน

โดย GDPR จะมีหลักสำคัญอยู่ 7 ประการคือ

  • Consent: การขอความยินยอมจากเจ้าของข้อมูลต้องเข้าใจง่าย และต้องระบุอย่างชัดเจนว่าจะนำข้อมูลไปใช้ทำอะไร เพื่อวัตถุประสงค์ใด 
  • Breach notification:  หากพบว่าข้อมูลรั่วไหล จะต้องแจ้งให้ประชาชนและเจ้าของข้อมูลทราบภายใน 72 ชั่วโมงถึงผลกระทบที่อาจเกิดขึ้น
  • Right to access: เจ้าของข้อมูลมีสิทธิที่จะร้องขอเข้าถึงข้อมูล และหน่วยงานที่เก็บข้อมูลจะต้องส่งข้อมูลให้ในรูปแบบอิเล็กทรอนิกส์ที่สามารถนำมาใช้ต่อได้
  • Right to be forgotten: เจ้าของข้อมูลสามารถขอให้หน่วยงานที่เก็บข้อมูลลบข้อมูลของตัวเองออกได้
  • Data portability: เจ้าของข้อมูลสามารถขอให้หน่วยงานที่เก็บข้อมูลส่งข้อมูลของตัวเองไปให้หน่วยงานอื่นๆได้ รวมทั้งธุรกิจคู่แข่งของหน่วยงานที่เก็บข้อมูล
  • Privacy by design: การออกแบบระบบจะต้องคำนึงถึงการป้องกันเรื่องข้อมูลส่วนบุคคล
  • Data Protection Officers (DPO):ต้องมีเจ้าหน้าที่คุ้มครองข้อมูล ที่มีหน้าที่ติดตามกิจกรรมประมวลผลข้อมูลขนาดใหญ่ และข้อมูลที่สำคัญ

ทั้งนี้ GDPR ได้จัดกลุ่มของหน่วยงานที่เกี่ยวข้องกับข้อมูลเป็นสองกลุ่มคือ

  • หน่วยงานควบคุมข้อมูล (data controller) ที่ได้รับความยินยอมจากเจ้าของข้อมูล (data subject) ในการจัดเก็บข้อมูล
  • หน่วยงานที่ประมวลผลข้อมูล (data processer) ที่แม้อยู่นอกประเทศสมาชิก EU ก็ต้องทำตามกฎ GDPR

Screenshot 2018-03-24 21.29.45

รูปที่ 1 Data protection model under GDPR (source: Preparing for EU GDPR, IT Governance Ltd)

บริษัทและหน่วยงานในประเทศเราน่าจะมีผลกระทบจากกฎระเบียบ GDPR ของ EU นี้จำนวนมาก คงไม่ใช่แค่สายการบินที่ให้บริการประชาชน EU แต่คงต้องรวมถึงทุกหน่วยงานที่จะทำหน้าที่ Data Controller ในการเก็บข้อมูล หรือเป็น Data Processor อาทิเช่น

  • โรงแรมที่จะเก็บข้อมูลนักท่องเที่ยวจากประเทศกลุ่ม EU
  • สถาบันการเงินที่อาจมีลูกค้า EU ในการฝากเงิน การทำธุรกรรมการเงินเช่นการแลกเปลี่ยนเงินตรา การใช้บัตรเครดิต หรือการใช้  Mobile Payment
  • บริษัทโทรคมนาคมที่นักท่องเที่ยวเข้ามาใช้งานในบ้านเราที่จะมีข้อมูลการใช้งาน พิกัดของผู้ใช้งาน
  • E-commerce website จะเก็บข้อมูลของผู้เข้ามาใช้งาน หรือซื้อสินค้าต่างๆที่อาจมาจากกลุ่มประเทศ EU

การที่จะให้หน่วยงานสามารถตามกฎระเบียบ GDPR ไม่ใช่แค่การหาเครื่องมือใดเครื่องมือหนึ่งมาดูเรื่องความปลอดภัยของข้อมูล หรือการป้องกันข้อมูลรั่วไหล จริงๆแล้วมันอาจหมายถึงการปรับระเบียบการเก็บข้อมูลในองค์กร การมีธรรมาภิบาลในการใช้ข้อมูล มีระบบความปลอดภัยที่ดี มีการขออนุญาตการใช้ข้อมูลอย่างถูกต้อง ทราบว่าข้อมูลต่างๆเก็บไว้ที่ใด รวมถึงการออกแบบระบบที่ต้องคำนึงถึงการป้องกันข้อมูลตั้งแต่แรก

คำถามง่ายๆบางครั้งหน่วยงานยังไม่ทราบเลยว่า ข้อมูลลูกค้าอยู่ที่ฐานข้อมูลใดบ้าง เก็บข้อมูลอะไรไว้บ้าง ใครเอาข้อมูลไปประมวลผลบ้าง ถูกใช้งานอย่างเหมาะสมหรือไม่  หรือส่งต่อไปให้ใคร ดังนั้นกรณีแบบนี้ก็จะปฎิบัติตาม GDPR ได้ยากกรณีลูกค้าร้องข้อมูล หรือสั่งให้ลบข้อมูลออก ที่หน่วยงานก็อาจจะไม่ทราบด้วยซ้ำไปว่าข้อมูลอยู่ที่ใด

บางครั้งเราอาจจะเคยได้ยินว่ากฎระเบียบ GDPR อาจไม่สามารถมาใช้บังคับกับหน่วยงานในบ้านเราได้ แต่ประเด็นที่น่าเป็นห่วงคือบริษัทและหน่วยงานต่างๆในประเทศไทยจำนวนมากจะต้องทำธุรกรรมกับบริษัทใน EU ที่เราอาจต้องนำข้อมูลมาประมวลผล เช่นการค้าขายที่อาจต้องใช้ข้อมูลจากประชาชนหรือบริษัทใน EU  ซึ่งแม้บริษัทในบ้านเราจะไม่ได้เป็น Data Controller แต่บริษัทใน EU ที่เป็น Data controller ส่งข้อมูลมาให้เราประมวลผลและเราก็กำลังเป็น Data processor  ซึ่งหากบริษัทของเราไม่สามารถปฎิบัติตาม GDPR บริษัท EU ที่เป็น Data controller นั้นก็อาจจะถูกปรับ และสุดท้ายก็จะไม่สามารถทำธุรกรรมกับบริษัทในบ้านเราได้

ดังนั้น GDPR  กำลังจะกลายเป็นเรื่องใหญ่ของประเทศอีกเรื่องหนึ่ง หากเรายังเพิกเฉยไม่จริงจังกับเรื่องนี้ ในอนาคตเราอาจจะเจอกรณีเดียวกับ IUU Fishing ก็ได้ แต่ความเสียหายงวดนี้คงไม่ได้เจอแค่อุตสาหกรรมเดียวเช่นประมงที่กำลังเกิดขึ้นตอนนี้ และอาจมีความเสียหายในวงกว้างกว่ามาก ฉะนั้นคงถึงเวลาที่ทุกภาคส่วนอาจให้ความสำคัญเรื่องนี้มากกว่านี้

ธนชาติ นุ่มนนท์

IMC Institute

 

 

 

 

 

 

 

Digital Transformation คือการพัฒนา Platform มิใช่แค่การสร้าง Product หรือ Service (ตอนที่ 1)

Screenshot 2018-08-05 11.29.12

เรามักจะได้ยินคำว่า Platform และคำกล่าวที่ว่าในยุคปัจจุบันธุรกิจจะต้องปรับตัวเองมาสร้าง Platform ไม่ใช่ Product หรือ Service และมักยกตัวอย่างของ Alibaba, Uber, Google, Facebook หรือ AirBnb บางท่านก็เข้าใจความหมายของคำว่า Platform แต่บางท่านก็อาจเข้าใจไปว่าการสร้าง Platform คือการนำสินค้าหรือบริการของเราเข้าสู่ระบบดิจิทัล ไปทำ Online marketing บ้าง, พัฒนา Digital Product บ้างเช่นการทำ Online courseware หรือบ้างก็ไปพัฒนา e-Commerce website ด้วยความเข้าใจว่านั้นคือการปรับธุรกิจเข้าสู่ Platform

อะไรคือความหมายของคำว่า Platform?  

ผมได้อ่านหนังสือเรื่อง The Digital Transformation Playbook ของ David L. Rogers แล้วสรุปความหมายของคำว่า Business Platform ไว้อย่างน่าสนใจว่า “A platform is a business that create value by facilitating direct interaction between two or more distinct type of customers.” จะเห็นได้ว่าการที่ธุรกิจจะเป็น Platform นั้นจะมีนัยสำคัญอยู่สามอย่างคือ

  • Distinct types of customers คือจะต้องมีประเภทของลูกค้ามากกว่าหนึ่งประเภทเช่น AirBnb อาจมีเจ้าของห้องพักที่เป็นลูกค้าของ Plaform และก็มีผู้ที่ต้องการหาที่พักซึ่งก็เป็นลูกค้าของ Platform อีกประเภทหนึ่ง
  • Direct interaction คือจะต้องให้ลูกค้าเหล่านี้สามารถติดต่อสื่อสารหรือทำธุรกรรมได้โดยตรง 
  • Facilitating เจ้าของ Platform จะเป็นผู้ทำหน้าที่อำนวยความสะดวกให้กับลูกค้าที่มาใช้บริการ Platform โดยไม่ได้เข้าจัดการเรื่องต่างๆโดยมากเกินไป

จากความหมายที่ระบุมาจะเห็นว่า Business Platform ไม่ใช่เรื่องใหม่ อย่างเช่นเราอาจเห็นห้างสรรพสินค้าอย่าง มาบุญครอง ก็เป็น Platform ด้านค้าปลีกก่อนยุคดิจิทัลเสียอีก เพราะห้างสรรพสินค้าเหล่านั้นก็เป็น Platform ที่ทำให้ผู้เช่ามาตั้งร้านขายสินค้าโดยตรงให้กับผู้เข้ามาเดินห้างได้ ตัวอย่างของห้างสรรพสินค้าเราก็อาจจะเห็นลูกค้าของ Platform มีหลายประเภทอาทิเช่น

  • ร้านค้า คือผู้ที่จ่ายรายได้โดยตรงให้กับห้างสรรพสินค้า
  • คนเดินห้าง คือลูกค้าที่ไม่ได้จ่ายรายได้ตรงให้กับห้างสรรพสินค้า แต่เป็นผู้ที่มีบทบาทสำคัญสุด เพราะถ้ามีลูกค้าเยอะ ร้านค้าก็จะโต
  • ผู้โฆษณาหรือสื่อต่างๆ ก็อาจเป็นลูกค้าของห้างสรรพสินค้าอีกประเภท ที่สามารถจ่ายเงินให้กับห้างสรรพสินค้าโดยการติดป้ายโฆษณา

หรือถ้ายกตัวอย่างของ Business Platform ในยุคดิจิทัล เราอาจนึกถึง Amazon Marketplace ที่จะมีลูกค้าคล้ายๆกับห้างสรรพสินค้า คือ ผู้ขาย, ผู้ซื้อ และ ผู้โฆษณา โดยทาง Amazon ก็เป็นผู้ช่วยสร้าง Platform และหาเครื่องมือต่างๆให้กับลูกค้าประเภทต่างๆที่มาใช้ Platform เช่น ระบบการชำระเงิน, การแนะนำสินค้า (Recommendation engine) หรือเครื่องมือในการโฆษณาสินค้าให้ตรงกับกลุ่มเป้าหมาย

beyond-uber-how-the-platform-business-model-connects-the-world-4-638

ในยุคดิจิทัลเราจะเห็นตัวอย่าง Platform หลายๆประเภทที่เพิ่มมามากขึ้นเพราะสามารถพัฒนา Business Platformได้ง่ายขึ้น อาทิเช่น

  • ค้าปลีก: eBay, Alibaba, Amazon marketplace
  • สื่อ: YouTube, Forbes.com
  • การเงิน: PayPal, Kickstarter, Alipay
  • Mobile computing: iOs, Android
  • ซอฟต์แวร์: Salesforce
  • การท่องเที่ยว: Airbnb, Tripadvisor
  • บริการรถสาธารณะ: Uber, Grab
  • การศึกษา: Coursera, Udemy

ดังนั้นถ้าเราพิจารณาจากคำนิยามของ Business Platform  จะเห็นได้ว่า การทำ e-commerce website ขายของออนไลน์โดยตรงก็ไม่ใช่ Business Platform เพราะเราเป็นเจ้าของ Platform ที่มีลูกค้าประเภทเดียวแล้วเราขายตรงไปยังลูกค้า แม้แต่ธุรกิจอย่าง Netflix ก็อาจไม่ใช่ Business Platform เพราะมีลูกค้าประเภทเดียวคือผู้ชม และ Netflix เป็นผู้กำหนดราคาและติดต่อกับลูกค้าเอง แต่ Netflix หรือ e-commerce webiste อาจเป็นตังอย่างของ Digital Platform

ประเภทของ Business Platform

เราอาจแบ่ง Platform ได้เป็น 4 ประเภทดังนี้

  • Exchange Platform
    • Pre-digital: Real estate brokers, shopping mall
    • Digital: Product marketplaces (eBay, Alibaba), Service marketplaces (Airbnb, Uber)
  • Transaction system
    • Pre-digital: Credit card, Debit card
    • Digital: Digital payment systems (PayPal), Digital currencies (Bitcoin)
  • Ad-support media
    • Pre-digital: Newspaper, TV
    • Digital: Website with ads, social media with ads
  • Hardware/Software standard
    • Pre-digital: Color TVs (RCA vs CBS), Motor fuels
    • Digital: Videogame consoles (Xbox, Playstation), Mobile OS (iOS, Android)

ทำไม Business Platform ในยุคดิจิทัลถึงมีความน่าสนใจ?

Business Platform จะมีความสำคัญและมีประโยชน์มากๆถ้ามีผู้ใช้เป็นจำนวนมาก (Network effect) เช่นถ้าห้างมีคนเข้ามาเดินจำนวนมากก็จะให้รายได้ของร้านค้าในห้างโตตาม หรือถ้าบัตรเครดิตมีร้านค้าที่รับบัตรจำนวนมากก็จะมีผู้ถือบัตรมากขึ้น มีธนาคารเข้ามาร่วมเป็นพันธมิตรมากขึ้น

ในยุคก่อนดิจิทัล Platform  จะถูกจำกัดการเจริญเติบโตด้วยปัจจัยหลายอย่างอาทิเช่น ขนาดของพื้นที่ การเข้าถึงของลูกค้าที่อาจจะต้องเดินทางมาที่ห้าง การโฆษณาที่จำกัดเพียงบางช่องทาง แต่ Business Platform ในยุคดิจิทัลจะสามารถสร้าง Network Effect ได้ดีกว่าทั้งนี้จากหลายๆปัจจัยอาทิเช่น

  • ลูกค้าสามารถเข้ามาใช้ Platform ได้โดยง่ายผ่าน Web APIs หรือ เครื่องมือ SDK ในการเชื่อมต่อกับ Platform เช่น Amazon Marketplace ได้สร้าง APIs ให้ร้านค้าสามารถนำสินค้ามาขายได้โดยง่าย
  • ระบบสามารถขยายได้อย่างมหาศาลรองรับผู้ใช้จำนวนมาก โดยใช้โครงสร้างพื้นฐานบน Cloud Computing
  • ลูกค้าสามารถเข้าถึง Platform ได้ผ่านอุปกรณ์ที่หลากหลาย จากทุกที่ ทุกเวลา เช่นการใช้บริการผ่านมือถือ
  • โลกดิจิทัลได้สร้างระบบตรวจสอบตัวตน ผ่านระบบ Verification ต่างๆหลายวิธีทั้งในอีเมล หรือ Social media

จากที่กล่าวมาทั้งหมดนี้ จะเห็นได้ว่า Business Platform  มีความน่าสนใจ และเจ้าของ Platform สามารถสร้างรายได้จำนวนมากได้ ถ้า Platform นั้นมีผู้ใช้จำนวนมาก มีเครื่องมือในการอำนวยสะดวกให้กับลูกค้า มีมาตรฐานที่ลูกค้าทุกคนเข้าถึงได้ ซึ่งเทคโนโลยีดิจิทัลทำให้เกิดสิ่งต่างๆเหล่านั้น เจ้าของ Platform จึงทำหน้าที่เป็นคนกลางไม่ต้องลงทุนสินทรัพย์จำนวนมาก และสามารถโตได้อย่างรวดเร็ว

ขอจบตอนที่หนึ่งไว้เท่านี้ ครั้งหน้าจะมาเขียนเรื่อง การทำ The Platform Business Model Map ซึ่งเป็นเครื่องมือเพื่อวิเคราะห์ Platform ต่างๆ

ธนชาติ นุ่มนนท์

IMC Institute

มีนาคม 2561