Digital Economy กับการปฎิรูปประเทศไทย

ช่วงอาทิตย์ที่ผ่านมามีผู้ใหญ่บางท่านและเพื่อนในวงการไอทีถามถึงแนวคิดของผมในเรื่องของการปฎิรูปประเทศไทยว่าอยากเห็นการเปลี่ยนแปลงอะไรโดยเฉพาะเรืองของไอที และยิ่งเมื่อต้นสัปดาห์นี้รัฐบาลโดยการแถลงของนายกรัฐมนตรีและรองนายกฯมรว.ปรีดิยาธร เทวกุล ออกมาจุดกระแสเรื่องของ Digital Economy ก็ทำให้กระแสการปฎิรูปด้านไอซีทีที่จะมีผลต่อการผลักดันการปฎิรูปเศรษฐกิจและสังคมของประเทศมีความร้อนแรงยิ่งขึ้น

แม้ยังไม่มีข้อสรุปแน่ชัดว่าแผนงาน  Digtal Economy จะมีอะไรบ้าง แต่ภาพที่เริ่มเห็นคือการปรับโครงสร้างกระทวงไอซีทีและเปลี่ยนชื่อให้เป็นกระทรวงเศรษฐกิจดิจิทัล และก็มีภาพกราฟฟิกของนสพ. Post Today ที่ลงตีิพิมพ์เมื่อวันอังคารที่ผ่านมาระบุโครงการต่างๆดังรูป

DigitalEconomy

รูปที่ 1 ยุทธศาสตร์ Digital Economy [ภาพจากหนังสือพิมพ์ Post Today]

ยุทธศาสตร์  Digital Economy เป็นเรื่องทีดีมาก และถ้ารัฐบาลผลักดัันอย่างจริงจัง ไม่ใช่สร้างมาเป็น Propaganda เหมือนรัฐบาลยุคเลือกตั้งที่ผ่านๆมาซึ่งจะสรรหาคำสวยงามมาประกอบนโยบายเช่น Naional Broadband หรือ  Smart Thailand  แต่ก็ไม่ได้ดำเนินงานและจัดสรรงบประมาณอย่างจริงจัง ยังจำได้ว่าเมื่อมีการปฎิรูประบบราชการครั้งใหญ่รัฐบาลทักษิณได้จัดตั้งกระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร (ไอซีที) แต่เมื่อมีการโยกย้ายหน่วยงานต่างๆและเห็นภาระกิจที่แท้จริงแล้ว การจัดตั้งกระทรวงไอซีทีในตอนนั้นก็เป็นแค่การทำภาระกิจชั่วคราวเพื่อผลประโยชน์ส่วนตัว ความไม่จริงจังในตอนนั้นจึงทำให้กระทรวงไอซีทีในวันนี้ไม่สามารถดำเนินงานต่างๆได้อย่างที่ควรจะเป็นทั้งนี้เพราะขาดบุคลากร อำนาจหน้าที่ และโครงสร้างที่เหมาะสม

ครั้งนี้เป็นโอกาสอันดีเพราะเรากำลังพูดถึงการปฎิรูปประเทศ และรัฐบาลมีอำนาจเบ็ดเสร็จ ผมจำได้ว่าตั้งแต่เด็กมาจนปัจจุบัน เคยเห็นโครงการใหญ่ๆเพียงโครงการเดียวที่ผลักดันจนประสบความสำเร็จคือโครงการ  Eastern Seaboard  ในสมัยพลเอกเปรม ติณสูลานนท์ เป็นนายกรัฐมนตรี ส่วนหนึ่งก็เป็นเพราะว่ายุคนั้นเป็นยุคประชาธิปไตยครึ่งใบ ทำให้ไม่จำเป็นต้องเกรงใจนักการเมืองมากนัก และอีกอย่างผู้นำสมัยนั้นมีความเด็ดขาด

สถานการณ์ในวันนี้คล้ายๆกับยุคนั้นแม้รัฐบาลจะตั้งเป้าที่จะปฎิรูปประเทศในระยะเวลาเพียงหนึ่งปี แต่การปฎิรูปประเทศสู่เศรษฐกิจเชิงดิิจิทัลอาจต้องทำหลายประการดังนี้ ซึ่งบางเรื่องก็น่าจะอยู่ในแผนของทีมงานแล้ว แต่ผมขอนำเสนอความคิดดังนี้

1) การปรับปรุงโครงสร้างพื้นฐานเชิงดิจิทัล

การปฎิรูปอุตสาหกรรมของสหรัฐอเมริกาส่วนหนึ่งเริ่มต้นจากการสร้างถนนและทางคมนาคมครั้งใหญ่ของประเทศเขาเมื่อร้อยกว่าปีก่อน เมื่อพูดถึง  Digital Economy เรากำลังขนส่งข้อมูลจำนวนมากโดยสื่อสารผ่านระบบอินเตอร์เน็ต เราจึงจำเป็นต้องมีโครงข่ายอินเตอร์เน็ตความเร็วสูงที่ดีเชื่อมต่อกันทุกพื้นที่ High Speed Broadband ก็เปรียบเสมือนถนน Highway ที่จำเป็นต้องเข้าถึง ทุกตำบล ทุกหมู่บ้าน ถ้าเราไม่มีถนนแล้วอุปกรณ์คอมพิวเตอร์ต่างๆที่เปรียบเสมือนยานพาหนะจะเคลื่อนที่ด้วยความรวดเร็วได้อย่างไร อีกเรื่องที่สำคัญคือการขยายการเชื่อมต่อข้อมูลผ่านระบบ 4G ที่ควรจะต้องเร่งให้สัมปทานและอาจต้องรีบเตรียมการให้รองรับเทคโนโลยีที่จะเกิดใหม่อย่าง  5G ด้วยความรวดเร็ว ไม่ใช่รอให้ล้าหลังประเทศอื่นๆอย่างการให้สัมปทาน  3G หรือ  4G เหมือนที่ผ่านมา

การตั้งหน่วยงาน  Broadband  แห่งชาติ อาจจะยังไม่สำคัญเท่ากับการวาง  Blueprint ด้านเครือข่าย  Broadband รวมถึงการผลักดันให้เกิดการแข่งขันอย่างเสรีและเป็นธรรมของภาคเอกชนในการให้บริการ  Highspeed Broadband กับภาคประชาชนอย่างทั่วถึง การให้บริการของภาครัฐเพื่อเปิดให้ประชาชนผู้มีรายได้น้อยเข้าถึง Highspeed Broadband  ซึ่งจะช่วยลดช่องว่างเชิงดิจิทัล และการลดความซ้ำซ้อนของการสร้างเครือข่ายของหน่วยภาครัฐและภาคเอกชน ซึ่งจะทำให้เราได้เครื่อข่ายที่มีคุณภาพและประหยัดการลงทุน

2)  การสร้าง  Digital Mindset  ให้กับสังคม

ในปัจจุบันคนไทยจำนวนมากใช้เทคโนโลยีดิจิทัลทั้งการเล่น Facebook, Smartphone  และ Tablet แต่สิ่งที่พบคือส่วนมากใช้เพื่อความบันเทิง ไม่ได้ถูกนำใช้ในด้านการทำงานมากนัก การทำธุรกิจโดยมากยังอยู่บนพื้นฐานแบบเดิม ยังขาดความตระหนักการนำเทคโนโลยีดิจิทัลมาใช้ เรายังพบว่าธุรกิจด้านต่างๆจำนวนมากไม่สามารถแข่งขันบนโลกออกไลน์ได้ คนไทยจำนวนมากยังไม่กล้าที่จะทำธุรกรรมออนไลน์ ยังขาดความสามารถในการติดต่อสื่อสารเชิงดิจิทัล ทักษะการค้นคว้าและกลั่นกรองข้อมูลทางอินเตอร์เน็ตยังไม่ดีพอ ทำให้เราจะแข่งขันเชิงธุรกิจไร้พรมแดนผ่านโลกดิจิทัลลำบาก

ดังนั้นจึงจำเป็นอย่างยิ่งที่จะต้องสร้างความตระหนักการในการใช้เทคโนโลยีดิจิทัล ให้กับภาคส่วนต่างๆทั้งภาคธุรกิจ ราชการ  รวมทังอุตสาหกรรมต่างๆทั้ง เกษตรกรรม การท่องเที่ยว การขนส่ง เพื่อให้ประเทศเข้าสู่ Digital Economy เมืื่อผู้คนในสังคมมีความตระหนักด้านดิจิทัลเราก็จะเห็นการใช้ข้อมูลออนไลน์ต่างๆมากขึ้น สังคมและธรกิจก็จะเข้าสู่การเป็น Digital Economy มากขึ้น และเราอาจจะเห็นเศรษฐกิจก้าวเข้าสู่ Real-Time Economy ซึ่งเป็นคำที่ทันสมัยกว่าและสอดคล้องกับปัจจุบันมากกว่าคำว่า  Digital Economy

3) การพัฒนาบุคลากรและงานวิจัยด้านไอซีที

การพัฒนา Digital Economy ที่ดีจะต้องมีพื้นฐานของงานวิจัยและพัฒนาทางด้านไอซีืีที ที่ผ่านมาเรามีงานวิจัยทางด้านนี้น้อยมาก เรายังต้องพึ่งพาการนำเข้าจากประเทศทั้งทางด้าน Hardware, Communication  และ  Software อยู่มาก ตัวอย่างเช่นเราขาดบุคลากรทางการพัฒนาด้านซอฟต์แวร์ การผลิตบุคลากรก็ไม่ตรงกับการเปลี่ยนแปลงของเทคโนโลยีและความต้องการของภาคอุตสาหกรรม การพัฒนาอุตสาหกรรมซอฟต์แวร์จะต้องอยู่บนพื้นฐานของความเป็นจริง เราคงไม่ต้องไปคาดหวังว่าอุตสาหกรรมทางด้านนี้เราจะไปแข่งในระดับโลก เพราะยังไงเสียก็ตามเราคงแข่งขันในระยะสั้น 5-10 ปีลำบากเพราะเราขาดบุคลากร แต่สิ่งที่เราต้องทำในระยะสั้นคิอต้องพัฒนาให้มีการใช้ซอฟต์แวร์ที่ผลิตภายในประเทศได้บ้างรวมถึงอาจต้องทำให้การนำเข้านักพัฒนาซอฟต์แวร์จากต่างประเทศเป็นไปได้ง่ายขึ้น พยายามผลักดันให้ประเทศไทยเป็นศูนย์กลางของนักพัฒนาซอฟต์แวร์ทั่วโลกที่จะเข้ามาทำงาน และระยะยาวก็คงต้องเร่งพัฒนาบุคลากรทางด้านนี้ โดยเฉพาะเน้นการปฎิรูปการศึกษาให้เยาวชนไทยมีความสามารถทางด้านวิทยาศาสตร์และเทคโนโลยีมากขึ้น

4) การปฎิรูปกฎหมายด้านดิจิทัล

กฎระเบียบหลายๆอย่างของบ้านเรายังไม่เอื้อต่อการเป็น Digtial Economy การติดต่อราชการหลายๆเรื่องเราต้องใช้เอกสารจำนวนมาก ถึงแม้ว่าบ้านเราเป็นประเทศแรกๆในโลกที่ใช้บัตรประชาชนที่เป็น smartcard แต่การทำธุรกรรมในหน่วยงานต่างๆยังต้องมีการทำสำเนาบัตรประชาชน ในแง่การจัดซื้อจัดจ้างหรือการทำนิติกรรมต่างๆยังมีกฎระเบียบที่ค่อนข้างล้าหลังอ้างอิงกับรูปแบบเดิมๆที่ต้องใช้หลักฐานจำนวนมากในรูปแบบที่เป็นกระดาษและสำเนาซึ่งไม่เอื้อต่อการทำธุรกรรมออนไลน์

กฎหมายที่เกี่ยวข้องกับงานด้านดิจิทัลจำนวนมากยังไม่ผ่านสภาฯไม่ว่าจะเป็นกฎหมายด้านลายเซ็นดิจิทัล กฎหมายคุ้มครองสิทธิส่วนบุคคล กฎหมายพาณิชย์อิเล็กทรอนิกส์ที่ทันสมัย กฎหมายคอมพิวเตอร์ต่างๆ ซึ่งในปัจจุบันเรามีกฎหมายเหล่านี้หลายร้อยฉบับที่จะต้องทำการปรับปรุงเปลี่ยนแปลง  นอกจากนี้ถ้าเราต้องการเข้าสู่  Real Time Economy อย่างเต็มรูปแบบเราอาจต้องแก้แม้กระทั่งกฎหมายแรงงานที่ครอบคลุมให้ลูกจ้าง สามารถทำงานแบบออนไลน์ หรือทำงานที่บ้านได้ โดยได้รับความเป็นธรรมจากนายจ้าง

5) การผลักดันให้เกิดกฎหมาย Open Data

อีกประเด็นที่สำคัญคือการผลักดันให้เกิดเรื่อง Open Data ทีเป็นการเปิดข้อมูล (และ Information) ของรัฐบาล องค์กรสาธารณะต่างๆ และหน่วยงานเอกชนที่ไม่ใช่ข้อมูลส่วนบุคคลของประชาขน ในรูปแบบที่เป็นมาตรฐานเปิด (Open Format) ไม่ใช่มาตรฐานเฉพาะ (Proprietary format) เพื่อคนหรือหรือเครื่องคอมพิวเตอร์อ่านได้ แล้วนำไปใช้หรือต่อยอดในการพัฒนาข้อมูลอื่นๆต่อไปได้ การเปิดข้อมูลจะเป็นการลดอุปสรรคในการเข้าถึงข้อมูลของภาคประชาชนและยังช่วยทำให้เกิดการนำไปใช้ในด้านอื่นๆที่มีประโยชน์ต่อไป

การมี Open Data โดยเฉพาะในภาครัฐบาลนอกเหนือจากการสร้างความโปร่งใสและทำให้เกิดธรรมาภิบาลในการบริหารงานภาครัฐ เพราะข้อมูลของภาครัฐในด้านต่างๆเช่น การจัดซื้อจัดจ้าง การใช้จ่ายเงินงบประมาณ ถูกเปิดเผยออกมาแล้ว ยังทำให้เกิดประโยชน์ในด้านอื่นๆอีกเช่นการช่วยทำให้บริการของรัฐดีขึ้นอาทิเช่น การเปิดเผยข้อมูลจราจรทำให้เกิดบริการสาธารณะที่ดีขึ้นรวมถึงทำเกิดธุรกิจต่างๆขึ้นมากมายและเป็นประโยชน์ต่อสังคม ดังนั้นเรื่องสำคัญในการปฎิรูปประเทศให้สู่เศรษฐกิจเชิงดิจิทัลก็คือ การผลักดันกฎหมาย  Open Data โดยการอิงหลัก 8 ประการตามที่ผมเคยเสนอไว้ในบทความ Open Government Data กับการปฎิรูปประเทศไทย

6)  การปฎิรูปหน่วยงานภาครัฐด้านไอซีที

หน่วยงานทางด้านไอซีทีของภาครัฐยังขาดความพร้อมทั้งในแง่ของบุคลากรและอำนาจหน้าที่ที่จะมากำกับหน่วยงานอื่นๆ นอกจากนี้ยังขาดความชัดเจนของบทบาทหน้าที่ และบางหน่วยงานก็มีหน้าที่ซ้ำซ้อนกัน เรามีทั้งองค์กรอิสระที่เป็นผู้ดูแลกำกับโครงสร้างด้านอินเตอร์เน็ตและโทรคมนาคมอย่าง กสทช แต่ขณะเดียวกันกระทรวงไอซีทีก็มีบางภารกิจบางอย่างที่ใกล้เคียงหรือซ้ำซ้อนกัน เรามีหน่วยงานในกำกับที่เป็นองค์กรมหาชนภายใต้กระทรวงไอซีทีหลายหน่วยงานอย่าง สำนักงานส่งเสริมอุตสาหกรรมซอฟต์แวร์แห่งชาติ (SIPA) สำนักงานรัฐบาลอิเล็กทรอนิกส์ (EGA) แต่บางครั้งหน่วยงานเหล่านี้เช่น  EGA กลับไม่มีอำนาจหน้าที่โดยตรงที่เข้าไปกำกับดูแล e-Service ของหน่วยงานรัฐอื่นๆ ทำให้การบริการอิเล็กทรอนิกส์ภาครัฐยังขาดทิศทางที่สอดคล้องกัน หรือบางหน่วยงานอย่าง  SIPA ก็มีปัญหาภายในที่ไม่รู้จบทำให้อุตสาหกรรมไม่สามารถคาดหวังอะไรได้

หน่วยงานด้านไอซีทีก็ย้งอยู่ข้ามกระทรวงต่างๆเช่นกระทรวงวิทยาศาสตร์และเทคโนโลยีก็มีหน่วยงานอย่าง NECTEC ที่น่าจะมีการบูรณาการบางภารกิจมาอยู่ใต้กระทรวงใหม่ หรือแม้แต่หน่วยงานอย่าง Software  Park ซึ่งไม่มีงบประมาณจัดสรรมาดำเนินงานใดๆโดยตรงก็ควรจะมีการทบทวนบทบาทบทบาทและหน้าที่ว่าควรจะจัดสรรงบประมาณให้โดยตรงหรือไม่ หรือควรจะอยู่ในสังกัดใด  ยังไม่รวมถึงหน่วยงานอื่นๆที่จะมีผลต่อการปฎิรูปเศรษฐกิจดิจิทัลทั้ง กรมส่งเสริมอุตสาหกรรม สสว. กระทรวงพาณิชย์ กระทรวงการคลัง กระทรวงเกษตรและสหกรณ์ และหน่วยงานอื่นๆอีกเป็นจำนวนมากที่อาจจะต้องมีการจัดภารกิจใหม่ให้สอดคล้องกัน หรืออาจต้องมีการตั้งหน่วยงานภายใต้กระทรวงที่จะเกิดมาใหม่

บทสรุป

จากที่กล่าวมาทั้งหมดคือแนวคิดบางประเด็นของผมต่อการปฎิรูปประเทศ และเป็นสิ่งที่ควรจะทำได้ภายในหนึ่งปี โอกาสนี้เป็นโอกาสดีของประเทศที่จะทำให้เกิดรูปธรรมที่ชัดเจน แต่สิ่งที่สำคัญยิ่งกว่าคือการดำรงไว้ซึ่งหลักการและแนวคิดของ Digital Economy ถ้ารัฐบาลตั้งเป้่าไว้ว่าจะอยู่เพียงหนึ่งปีคงจะเป็นเรื่องยาก ดังนั้นหลังปฎิรูปเสร็จรัฐบาลควรที่จะรักษาอำนาจและทำงานต่ออีกซักพัก เพื่อให้บรรลุถึงเป้าหมายมิฉะนั้นแล้วการปฎิรูปจะสูญเปล่า เราอาจเห็นแค่การตั้งกระทรวง  Digital Economy  ขึ้นมาแค่นามธรรมแต่สุดท้ายการปฎิบัติก็จะไม่บรรลุตามวัตถุประสงค์

สุดท้ายคำว่า Digital Economy  หรือคำว่า Real-time Economy มันก็คือ  New Economy เรากำลังปฎิรูปเศรษฐกิจใหม่ให้กับคนรุ่นใหม่ สิ่งที่สำคัญที่สุดเราต้องให้คนรุ่นใหม่มีส่วนร่วมมากที่สุดในการปฎิรูปครั้งนี้  เราอย่าลืมนะครับว่าประเทศ สิงคโปร์ที่ปฎิรูปประเทศมาได้ตอนนั้นนายกรัฐมนตรีลีกวนยูมีอายุไม่ถึง 40  ปี ตอนเราปฎิวัติ 2475  ผู้นำในคณะราษฎร์ส่วนใหญ่คือคนอายุต่ำกว่า  40 ปี ถ้าเราจะปฎิรูป  Digtial Economy  แล้วเราจะเอาแต่คนรุ่นเก่ามาปฎิรูปแล้วพยายามจะมาบอกว่าอนาคตของเศรษฐกิจหรือวิถีชีวิตของคนรุ่นใหม่จะเป็นไปได้อย่างไร ยิ่งคนคิดปฎิรูปหลายๆคนอาจมีความเข้าใจเรื่องดิจิทัลน้อยกว่าคนรุ่นใหม่บางทีก็ยิ่งน่าเป็นห่วงมากขึ้นไปอีก อย่าว่าแต่คนอายุมากกว่า 60  ปีเลยครับแม้แต่คนรุ่นอย่างผมบางทีก็อาจอายุมากเกินไปแล้วในการจะมาคิดเรื่องปฎิรูปให้พวกเขาตามลำพัง เราควรต้องมีสัดส่วนของเด็กรุ่นใหม่ๆจำนวนมากในการปฎิรูปสังคมสู่    Digital Economy มันเป็นเรื่องของ New Generation  สู่  New Economy ไม่ใช่แค่กลุ่มของผู้ใหญ่มาคุยกันแล้วจะบอกอนาคตให้คนรุ่นใหม่ที่เขาต้องอยู่กับอนาคตของเขาอีกหลายสิบปี ครับให้เขามีส่วนร่วมในการกำหนดอนาคตของเขาด้วยครับ

ธนชาติ นุ่มนนท์

IMC Institute

Big Data on Cloud ตอนที่ 1: Hadoop as a Service

Hadoop เป็นเทคโนโลยีทางด้าน Big Data ที่น่าสนใจเพราะสามารถที่จะเก็บข้อมูลที่เป็น   Unstructure จำนวนเป็น PetaByte ได้ ซึ่งในทางทฤษฎีการศึกษาการติดตั้งระบบ Hadoop และการนำมา  Hadoop  มาใช้ในการวิเคราะห์ข้อมูลโดยใช้โปรแกรมอย่าง MapReduce  หรือใช้เทคโนโลยีต่างๆอย่าง  Hive, Pig, Scoop หรือ HBase เป็นเรื่องไม่ยากนัก แต่ในทางปฎิบัติปัญหาสำคัญที่องค์กรจะพบในการติดตั้ง Hadoop Big Data  ก็คือการหาเครื่อง Server จำนวนมากมาเพื่อติดตั้งระบบ Hadoop Cluster  จำนวนตั้งแต่  5  เครื่องไปจนเป็นร้อยเป็นพันเครื่อง

HadoopProcess

รูปที่ 1 Hadoop Lifecycle [Source: Rackspace]

การแก้ปัญหาในเรื่องการจัดหา  Server อาจทำได้โดยการใช้ระบบ  Public Cloud  ซึ่งก็จะเป็นการลดค่่าใช้จ่ายขององค์กร ทั้งนี้รูปแบบของการใช้ Hadoop  บน Public Cloud   มีสองแบบคือ

  1. ติดตั้ง Hadoop Cluster โดยใช้ Virtual Server ในระบบ  Public IaaS Cloud อย่าง Amazon Web Services  (AWS) หรือ Microsoft Azure  กรณีนี้จะใช้ในกรณีที่เราจะต้องการนำ Hadoop มาใช้ในการเก็บข้อมูลขนาดใหญ่โดยใช้ HDFS และใช้ในการวิเคราะห์ข้่อมูลโดยใช้เครื่องมืออย่าง  MapReduce, Hive, Pig
  2. การใช้บริการ  Hadoop as a Service ของ  Public Cloud Provider ที่ได้ติดตั้งระบบ Hadoop ไว้แล้ว และเราต้องการใช้ระบบที่มีอยู่เช่น MapReduce, Hive, Pig มาใช้ในการวิเคราะห์ข้อมูล ทั้งนี้ข้อมูลที่จะนำมาวิเคราะห์อาจอยู่ในองค์กรเราหรือเก็บไว้ที่อื่น

การใช้ Public Cloud ในกรณีที่ 1  ถ้ามีข้อมูลขนาดใหญ่มาก  ก็อาจจะมีค่าใช้จ่ายที่สูง ยิ่งถ้ามีจุดประสงค์เพื่อที่จะใช้ในการเก็บข้อมูลแบบ Unstructure  ก็ดูอาจไม่คุ้มค่านัก แต่ก็มีข้อดีที่มีระบบ  Hadoop Cluster ที่ติดตั้งเองและไม่ต้องใช้ร่วมกับคนอื่น ผู้เขียนเองเคยทดลองติดตั้งระบบแบบนี้โดยใช้ Azure HDInsight และทดลองติดตั้ง Hadoop CloudEra Distribution  ลงใน AWS EC2  และล่าสุดทดลองติดตั้ง Apache Hadoop Cluster  4 เครื่องลงบน  AWS EC2

สำหรับกรณีที่ 2  น่าจะเหมาะกับผู้ต้องการวิเคราะห์ข้อมูลขนาดใหญ่เช่น  ข้อมูลที่เป็น Text หรือ ข้อมูลจาก  Social Media โดยใช่้เทคโนโลยี Hadoop โดยไม่ต้องการลงทุนซื้อเครื่อง  Server  และก็ไม่ได้เน้นที่จะใช้ Hadoop Cluster  ในการเก็บข้อมูลอย่างถาวร ในปัจจุบันมีผู้ให้บริการ  Cloud Computing อยู่่หลายรายที่ให้บริการ Hadoop as a Service โดยจะคิดค่าบริการตามระยะเวลาที่ใช้ในการประมวลผล และอาจรวมถึงขนาดของข้อมูล  การใช้  Bandwidth ตัวอย่างของผู้ให้บริการมีดังนี้

  • Amazon Elastic Map Reduce

เป็นบริการ  Hadoop Cluster ของ  AWS ที่ผู้ใช้บริการสามารถที่จะเลือกขนาดของ Cluster หรือภาษาที่จะใช้การวิเคราะห์ข้อมูลเช่น Java  สำหรับ  MapReduce หรือ Python สำหรับ Streaming และ  Hive, Pig  ผู้เขียนเองเคยใช้   AWS EMR ในการวิเคราะห์ข้อมูลดยการ Transfer ข้อมูลผ่าน  Amazon  S3 ก็สะดวกและใช้งานง่าย ทั้งนี้ Hadoop Distribution ที่ลงบน EMR ผู้ใช้สามารถเลือกได้ระหว่าง  Amazon หรือ  MapR Distribution

Screenshot 2014-09-16 15.18.54

รูปที่ 2 ตัวอย่างการใช้  Amazon EMR

  • Rackspace Cloud Big Data Platform

Rackspace   หนึ่งในผู้นำด้าน  Public IaaS Cloud  มีบริการที่เรียกว่า Hadoop as a Service  เพื่อให้ผู้ใช้สามารถที่จะส่งข้อมูลมาประมวลผลได้ โดยได้ร่วมมือกับ  Hortonworks  ในการติดตั้ง Distribution ของ  Hadoop

Screenshot 2014-09-16 15.24.41  รูปที่ 3 Rackspace Big Data

  • Qubole

Qubole  เป็นผู้ให้บริการ Hadoop as a Service  โดยเฉพาะ ซึ่งทางบริษัทนี้ติดตั้ง  Hadoop Cluster  บนเครื่อง Server  ของ  AWS และ Google Compute Engine คิดค่าบริการ  Data Service ในการวิเคราะห์ข้อมูลทั้งแบบเหมาจ่ายรายเดือน  (เริ่มตั้งแต่ $5,900 ต่อเดือน) และตามการใช้งาน ($0.11 ต่อ Computing Hour และ $0.22  ต่อ import/export)

Screenshot 2014-09-16 15.39.21

   รูปที่ 4 Qubole.com

  • Google Cloud Platform

Google มีระบบ  Apache Hadoop  ที่รันอยู่บน Google Cloud ให้ผู้ใช้สามารถประมวลข้อมูลโดยใช้ MapReduce,  Hadoop Streaming, Hive หรือ Pig  ที่เก็บอยู่บน Google Cloud Storage  ได้ โดยคิดค่าใช้จ่ายตามปริมาณการใช้งาน

Screenshot 2014-09-16 16.13.40

 รูปที่ 5 Google Apache Hadoop

  • IBM Bluemix: Analytic on Hadoop

IBM Bluemix ซึ่งเป็น  Public PaaS ก็มีการติดตั้ง  Hadoop Cluster  เพื่อให้ผู้ใช้สามารถประมวลผลข้อมูลขนาดใหญ่โดยใช้ MapReduce, Hive หรือ Pig เช่นเดียวกับ Google  หรือ AWS ทั้งนี้ Hadoop  ที่ติดตั้งบน  Bluemix เป็น Distribution ของ  IBM ที่ชื่อ InfoSphere BigInsights

Screenshot 2014-09-16 21.15.24

รูปที่ 6 IBM Analytics fo Hadoop

จากที่กล่าวมาทั้งหมดนี้จะเห็นได้ว่า ในปัจจุบันองค์กรต่างๆสามารถทำการประมวลผลข้อมูลโดยใช้ เทคโนโลยี Hadoop ได้เลยผ่านบริการ  Public Cloud โดยไม่ต้องจัดหาเครื่อง Server หลายๆองค์กรก็อาจจะห่วงเรื่องความปลอดภัยของข้อมูล ซึ่ีงในกรณีของ Hadoop as a Service เราไม่จำเป็นต้องเก็บข่้อมูลลงใน  Hadoop Cluster  โดยเราสามารถ  Transfer ข้อมูลที่จำเป็นในการประมวลผลไปใช้ได้เป็นครั้งคราวไป ทำให้เราน่าจะเชื่อมั่นในเรื่องข้อมูลได้ดีขึ้น ข้อสำคัญเราจะเห็นว่ามีองค์กรใหญ่ๆจำนวนมากมาใช้บริการแบบนี้ ซึ่งแน่นอนข้อมูลขององค์กรเหล่านั้นก็มีความสำคัญไม่น้อยกว่าของเรา จึงทำให้เห็นได้ว่าองค์กรต่างๆมีความเชื่อมั่นในบริการแบบนี้มากขึ้นเรื่อยๆ

ธนชาติ นุ่มนนท์

IMC Institute

กันยายน 2557

การคาดการณ์แนวโน้มของ Big Data

เมื่อวานนี้ทาง IMC Institute  จัดงานฟรีสัมมนาร่วมกับ Computerlogy ภายใต้หัวข้อ Big Data: From Data to Business Insight โดยมีผู้เข้าร่วมสัมมนาประมาณ 100  คน หัวข้อที่ผมไปบรรยายในงานสัมมนานี้คือ  Forecast of Big Data Trends เพื่อให้ผู้เข้าร่วมสัมมนาทราบถึงแนวโน้มของ Big Data โดยมี Slide ที่ใช้ในการบรรยายดังนี้

ฺBigData-Seminar

การบรรยายเริ่มต้นโดยการบรรยายหลักการของ Big Data ทั้งนี้เพราะหลายๆคนยังเข้าใจผิดคิดว่า Big Data คือการที่มีข้อมูลดิจิตอลขนาดมหาศาล แต่จริงๆแล้วเรามักจะนิยามความหมายของ Big Data ด้วยคำย่อว่า 3V คือ Volume, Velocity และ Variety

  • Volume: คือมืจำนวนข้อมูลมากเกินกว่าระบบฐานข้อมูลแบบเดิมๆจะสามารถที่จะจัดการได้
  • Velocity: คือข้อมูลจะมีการเปลี่ยนแปลงอย่างรวดเร็ว เช่นข้อมูลจาก Social Media ข้อมูลการซื้อขาย ข้อมูล Transaction การเงินหรือการใช้โทรศัพท์  หรือข้อมูลจาก Sensor
  • Variety: คือข้อมูลจะมีหลากหลายรูปแบบทั้ง Structure และ Unstructure ซึ่งอาจจะอยู่ในรูปทั้ง RDBMS, text, XML, JSON หรือ Image

ดังนั้นการจัดการ Big Data จึงจำเป็นต้องใช้ระบบการเก็บข้อมูลหรือการประมวลในรูปแบบอื่นๆที่อาจไม่ใช่เพียงแค่ฐานข้อมูล RDBMS แบบเดิมๆ ซึ่งเทคโนโลยีที่นำมาใช้ในปัจจุบันมีทั้ง Hadoop, NoSQL, NewSQL และ MPP เราจึงเห็นได้ว่า แนวโน้มการลงทุนไอทีขององค์กรต่างๆจึงมีการลงทุนเพื่อปรับปรุง Information Infrastructure มากขึ้น เพื่อให้รองรับกับการใช้งานด้าน Big Data

คราวนี้มาถึงการคาดการณ์แนวโน้มของ Big Data ที่ผมได้รวบรวมมาจากแหล่งต่างๆ ผมได้สรุปมา 10 เรื่องดังนี้

1) Hadoop will gain in stature 

ตลาด  Hadoop  ซึ่งเป็นซอฟต์แวร์ Open Source ที่ใช้ในการเก็บและประมวลผลข้อมูลแบบ  Unstructure  ขนาดใหญ่จะโตขึ้นเรื่อยๆ โดยองค์กรต่างๆจะมีการลงทุนเพื่อใช้งาน  Hadoop  คู่กับฐานข้อมูล  RDBMS แบบเดิม และ  NoSQL โดยทาง IDC ระบุว่าในปี 2012  มีการลงทุนด้านซอฟต์แวร์ Hadoop สูงถึง $209 ล้านเหรียญสหรัฐหรือคิดเป็น  11% ของมูลค่าตลาดด้าน Big Data

2) SQL holds biggest promise for Big Data

องค์กรส่วนใหญ่ยังใช้ภาษา  SQL ในการประมวลผล สังเกตุได้จากการลงทุนทางเทคโนโลยีด้าน  Big Data ร้อยละ 64 ขององค์กรก็ยังเป็นการจัดหาฐานข้อมูล RDBMS แบบเดิม มีเพียง 28%  ที่จัดหา  Hadoop/MapReduce  ส่วนหนึ่งก็เป็นเพราะภาษาที่ใช้ในการประมวลผลข้อมูลของ  Hadoop ยังเป็น MapReduce ซึ่งยากต่อการพัฒนา   จึงทำให้ผู้พัฒนา OpenSource  ของ Hadoop ต้องพัฒนาเครื่องมือใหม่ๆอย่าง  Hive, Impala หรือ  Jaql  เพื่อให้ผู้ใช้สามารถใช้ภาษา  SQL ได้ ทำให้เป็นโอกาสที่ดีสำหรับผู้ที่ต้องการประมวลผล  Big Data  ที่จะสามารถประมวลผลได้ง่ายและรวดเร็วขึ้น

3) Big Data vendor consolidation begins

ในปัจจุบันเรามีผู้ผลิตซอฟต์แวร์ ฮาร์ดแวร์และผู้ให้บริการ  Big Data  อยู่หลายราย โดยเฉพาะผู้ที่ทำด้าน Hadoop มีคนนำ Open Source ตัวนี้มาพัฒนาต่อยอดหลายรายและทำเป็นหลาย  distribution จนเป็นเรื่องยากที่ผู้ใช้จะเลือก distribution ที่เหมาะสม การคาดการณ์เรื่องหนึ่งคือเราอาจเห็นจำนวนผู้ผลิตซอฟต์แวร์เหล่านี้น้อยลง จะเหลือเพียงไม่กี่ราย รายเล็กๆที่น่าสนใจอย่าง  CloudEra  ก็จะต้องมาแข่งกับบริษัทใหญ่ๆอย่าง  Microsoft หรือ  IBM

4) Internet of things grow

การเข้ามาของอุปกรณ์ที่เป็น  Internet of Things  เช่น  Wearable Devices, Smart TV จะทำให้ข้อมูลโตขึ้นเรื่อยๆ โดยมีการคาดการณ์ว่าภายในปี  2017  จำนวน  Internet of Things  จะแซงหน้าจำนวนรวมของ  PC, Smartphone  และ  Tablet

5) More data warehouses will deploy enterprise data hubs

Data warehouses  จะมีการติดตั้ง  Enterprise Data Hubs  โดยเป็นการรวบรวมข้อมูลจากแหล่งต่างๆทั้งภายในและภายนอกองค์กร โดยจะมีรูปแบบข้อมูลที่หลากหลายทั้งเป็น  Structure และ  Unstructure โดยจะมีการใช้เทคโนโลยี  Hadoop ที่ประหยัดค่าใช้จ่ายกว่าเทคโนโลยีอื่นมาทำหน้าที่เป็น  Data Hub และช่วยทำหน้าที่ OffLoad ETL ข้อมูลที่ไม่สำคัญมากใน Data Warehouse

 6) Business intelligence (BI) will be embedded on smart systems

การคาดการณ์อีกเรื่องหนึ่งคือแนวโน้มที่เราจะเห็นอุปกรณ์หรือระบบต่างๆมีระบบ    Business Intelligence  (BI) ฝั่งอยู่ในระบบ เช่นระบบการขายต่อไปเซลล์ขายสินค้าอาจสามารถที่จะดูข้อมูลและวิเคราะห์ลูกค้าผ่านอุปกรณมือถือได้เลยโดยเลยโปรแกรม BI ผ่าน  Cloud Services

7) Less relational SQL, more NoSQL

เนื่องจากข้อมูลจะมีความหลากหลายมากขึ้น ดังนั้นการวิเคราะห์ข้อมูลที่เป็นโครงสร้างแบบเดิมโดยใช้ภาษา  SQL  จึงอาจไม่เพียงพอ ทำให้เทคโนโลยีที่เป็น  NoSQL หรือที่เรียกว่า   Not Only SQL จะเข้ามาใช้ร่วมกับฐานข้อมูล RDBMS แบบเดิม โดยเราจะเริ่มเห็นซอฟต์แวร์ใหม่ๆเหล่านี้อาทิเช่น MongoDB  ถูกนำมาใช้มากขึ้น

8) Hadoop will shift to real-time processing

Hadoop เวอร์ชั่น 1.x จะมีข้อจำกัดในเรื่อง  Namenode ทำให้ขยายขนาดเกิน 4,000 เครื่องไม่ได้ และมีข้อจำกัดในเรื่องการประมวลผลข้อมูลบน HDFS ที่เป็น MapReduce ที่ต้องรันแบบ Batch ไม่ใช่ Realtime  แต่ใน Hadoop  เวอร์ชั่น 2.x  ได้มีการปรับปรุงนำ  Data Operating System อย่าง  YARN  เข้ามาทำให้รูปแบบประมวลมีมากกว่า MapReduce  โดยสามารถใช้ NoSQL หรือ  Stream อย่าง  Python  ที่เป็น  Realtime ได้

9) Big Data as a Service (BDaaS)

ประเด็นสำคัญหนึ่งในการประมวลผลข้อมูล Big Data คือการลงทุนจัดหาเครื่องคอมพิวเตอร์ Server จำนวนมากเข้าใช้งาน ซึ่งต้องลงทุนสูงและอาจไม่คุ้มค่า จึงเริ่มมีการให้บริการการประมวลผลบน  Cloud Service มากขึ้น ตัวอย่างเช่นการใช้ Hadoop บน  Cloud ที่ในปัจจุบันมีผู้ให้บริการรายหลายอาทิเช่น Amazon EMR, Microsoft Azure HDInsight, IBM Bluemix และ  Qubole

BDaaS

10) External data is as important as internal data

ในปัจจุบันองค์กรจะมีข้อมูลที่ต้องนำมาพิจารณามากขึ้น โดยจำเป็นจะต้องให้ความสำคัญกับข้อมูลจากภายนอกองค์กร อาทิเช่นข้อมูลจาก Social Media พอๆกับการให้ความสำคัญกับข้อมูลในองค์กร เพื่อนำข้อมูลต่างๆเหล่านี้มาวิเคราะห์เชิงธุรกิจ

สุดท้ายคงต้องจบที่ว่าทาง IMC Institute และ  Computerlog ยังมีหลักสูตรอบรมเรื่อง Big Data  ใหกับผู้บริหารในวันที่ 1-2  ตุลาคมนี้เรื่อง  Big Data in Action for Senior Management ซึงผู้สนใจสามารถเข้าไปดูรายละเอียดได้ที่ www.imcinstitute.com/bigdatamgmt

ธนชาติ นุ่มนนท์

IMC Institute

กันยายน 2557