บทนำ จากหนังสือรวมบทความปี 2562 ของผม

73251706_1522920721188596_4970794027956830208_n

ผมจบปริญญาตรีสาขาวิศวกรรมไฟฟ้าที่มหาวิทยาลัยขอนแก่น จบมาในยุคที่ยังเรียนโปรแกรมคอมพิวเตอร์ ภาษา Fortran ด้วยการเจาะบัตรที่ใช้เครื่องคอมพิวเตอร์เมนเฟรม เรียนจนปีสุดท้ายถึงจะเริ่มเห็นเครื่องไมโครคอมพิวเตอร์เข้ามา แล้วก็เริ่มหัดมาเขียนภาษาปาสคาล โปรล็อก และ ภาษาซี บนเครื่องไมโครคอมพิวเตอร์ ตอนไปเรียนปริญญาโทและเอกสาขาวิศวกรรมไฟฟ้าและอิเล็กทรอนิกส์ที่มหาวิทยาลัยโอ็กแลนด์ ประเทศนิวซีแลนด์ ก็ได้เรียนเกี่ยวข้องกับวิชาคอมพิวเตอร์มากขึ้นหน่อยเพราะทำวิจัยทางด้าน Image Progrocessing และ Machine Leaning Algorithm และเมื่อใกล้ๆจะเรียนจบก็เริ่มมีระบบอินเตอร์เน็ตเข้ามาใช้ ทำให้สามารถเขียนโปรแกรมที่ซับซ้อนขึ้นและก็สามารถส่งโปรแกรมไปรันผ่านเครืองคอมพิวเตอร์ความเร็วสูงข้ามประเทศได้ แต่ประสิทธิภาพของระบบคอมพิวเตอร์และความเร็วของอินเตอร์เน็ตสมัยนั้นยังห่างชั้นกับปัจจุบันอย่างมากมาย

เมื่อจบปริญญาเอกกลับมาสอนหนังสือ และเขียนโปรแกรมต่างๆ ตลอดจนพัฒนาการเรียนรู้ตัวเองจนเป็น Certified Java Programmer ก็ยังรู้สึกว่าตัวเองเป็นนักไอที มองว่าเราคือโปรแกรมเมอร์และอาจารย์ ที่อาจจะแปลกแยกกับโลกของธุรกิจหรือสังคมส่วนใหญ่ ไอทีในยุคนั้นยังเป็นเพียงแค่งานสนับสนุนให้องค์กรหรือธุรกิจทำงานไปได้ดีขึ้น แม้จะมีมือถือรุ่นใหม่ๆอย่างที่สามารถพัฒนาโปรแกรมภาษาจาวาอย่าง Nokia 7650 และตัวผมเองก็มีโอกาสไปสอนคนตามที่ต่างๆให้ใช้มืือถือรุ่นใหม่ ให้พัฒนาโปรแกรมบนมือถือ แต่ก็ยังเป็นโลกไอทีที่ยังไม่สอดคล้องกับธุรกิจมากนัก แม้จะมีการใช้อินเตอร์เน็ตแต่ส่วนใหญ่ก็ยังเป็นการเชื่อมต่อโดยการใช้เครื่องคอมพิวเตอร์มากกว่าทางมือถือ และความเร็วของการใช้อินเตอร์เน็ตก็ยังช้าอยู่

เมื่อเริ่มเข้ามาทำงานในภาคเอกชนกับบริษัท Sun Microsystems  ก็เริ่มเห็นการเปลี่ยนแปลงของการใช้ไอทีมากขึ้น ตอนนั้นก็อยู่ในยุคอุตสาหกรรม 3.0 ที่เป็นยุคของไอที และกำลังเข้าสู่ช่วงของ Mobile First มีการเข้ามาของสื่อสังคมออนไลน์อย่าง Facebook การใช้มือถือเพื่อการสื่อสารก็เปลี่ยนจากการส่ง SMS หรือ MMS มาสู่การใช้มือถือเพื่อเล่นเว็บ เล่นโมบายแอปพลิเคชั่นต่างๆ โลกการพัฒนาโปรแกรมก็เริ่มเปลี่ยนเป็นการเชื่อมต่อระบบต่างๆเข้าหากันผ่าน Service Oriented Platform (SOA) หลักการพัฒนาโปรแกรมก็เปลี่ยนไปมากขึ้น และก็เริ่มเข้าสู่ยุคแรกๆของ Cloud Computing เริ่มเห็นการเข้ามาของ Cloud Virtual Server หรือ  Cloud Storage

หลังจากนั้นผมเองก็มีโอกาสเข้าไปทำงานที่เขตอุตสาหกรรมซอฟต์แวร์ประเทศไทย และมาทำงานกับสถาบันไอเอ็มซี ซึ่งกำลังเข้ามาสู่ยุคอุตสาหกรรม 4.0 ที่จะเริ่มเห็นการเปลี่ยนแปลงของเทคโนโลยีไปอย่างมาก มีเรื่องของ  Big Data, AI, IoT หรือ Blockchain เข้ามา ผู้คนหันมาใช้ไอทีและกลายเป็นเรื่องปกติ ไอทีกับองค์กรและสังคมเริ่มเป็นเรื่องเดียวกัน พฤติกรรมของผู้คนก็เปลี่ยนแปลงไปตามเทคโนโลยีและเริ่มเห็นกระแสของ Digital Disruption ที่กำลังทำให้อุตสาหกรรมหรือธุรกิจแบบเดิมล้มหายตายจากไป เพราะการเปลี่ยนแปลงพฤติกรรมของผู้บริโภค จากที่ไอทีเคยเป็นเพียงงานหลังบ้านสนับสนุนให้ธุรกิจทำงานได้ดีขึ้น กลายเป็นว่าไอทีเป็นเครื่องมือขับเคลื่อนทำให้เกิดธุรกิจใหม่ๆ ผลิตภัณฑ์หรือบริการใหม่ๆ และองค์กรส่วนใหญ่ก็จะเริ่มให้ความสำคัญกับเรื่ิอง Digital Transformation มีการพูดถึงกลยุทธ์ในด้านดิจิทัล การพัฒนากำลังคน การปรับเปลี่ยนองค์กรให้รองรับกระแสดิจิทัล และมีการผลักดันเป็นนโยบายประเทศอย่าง Thailand 4.0

ภาพของความเป็นคนไอทีที่แต่ก่อนเป็นเรื่องที่เคยดูแตกต่างจากกลยุทธ์ธุรกิจและเกี่ยวข้องกับสังคมไม่มากนัก ก็กลายเป็นว่าองค์กรและคนนอกวงการไอทีให้ความสนใจเกี่ยวกับเทคโนโลยีมากยิ่งขึ้น ตัวผมเองเลยต้องมีส่วนไปช่วยให้คำแนะนำหน่วยงานต่างๆเรื่องแนวโน้มของเทคโนโลยี การวางกลยุทธ์องค์กร การทำ Digital Transformation หรือแม้แต่ให้เข้าไปช่วยในการพัฒนาระบบ Big Data  และก็มีโอกาสได้เข้าไปทำงานเป็นบอร์ดและกรรมการอิสระในองคกร์ต่างทั้งภาครัฐและเอกชน ก็ยิ่งทำให้เข้าใจการเปลี่ยนแปลงของธุรกิจและสังคมดีขึ้น

หนังสือเล่มนี้เลยได้รวมรวมบทความและข้อเขียนต่างๆที่ผมลงในหนังสือพิมพ์กรุงเทพธุรกิจและ Business Today รวมถึงในบล็อกส่วนตัว thanachart.org ในรอบปีที่ผ่านมา โดยมีจุดประสงค์เพื่อให้เข้าใจกระแสของ Digital Disruption และการทำ  Digital Transformation แนวโน้มของเทคโนโลยีต่างๆ รวมถึงการเปลี่ยนแปลงวิถีชีวิตและการทำงาน ซึ่งก็หวังว่าน่าจะเป็นประโยชน์กับผู้อ่านในการที่จะเข้ากระแสการเปลี่ยนแปลงของโลกได้ดีขึ้น

ธนชาติ นุ่มนนท์

IMC Institute

เมื่อเทคโนโลยีทำให้คนชอบอ่านหนังสือ Gen X เปลี่ยนไป แต่เนื้อหา (Content) ดีๆยังไม่มีวันตาย

IT Trend2020

สมัยเรียนชั้นประถมต้นทุกเช้าผมจะตั้งหน้าตั้งตารอรถมอเตอร์ไซค์มาส่งหนังสิอพิมพ์ที่บ้าน และวิ่งไปรับด้วยความดีใจเมื่อหนังสือพิมพ์มาถึง ผมชอบตามข่าวฟุดบอลอังกฤษแต่สมัยนั้นไม่มีการถ่ายทอดกีฬาฟุตบอลสดๆไม่มีอินเตอร์เน็ตและคนไทยก็ยังไม่นิยมดูฟุตบอลต่างประเทศเหมือนในปัจจุบัน เมื่อได้หนังสิอพิมพ์มาผมก็จะต้องรีบเปิดดูข่าวกีฬาในหนังสือพิมพ์ Bangkok Post ที่อยู่หน้าสุดท้ายเป็นอย่างแรก เพื่อจะลุ้นดูผลบอลอังกฤษด้วยความตื่นเต้นว่าเมื่อคืนใครชนะ ข่าวในหน้าหนังสือพิมพ์เป็นช่องทางหลักที่สำคัญในยุคนั้นที่ทำให้เราทราบและติดตามความเคลื่อนไหวต่างๆในแต่ละวัน มีหนังสือพิมพ์หลายฉบับที่ได้อ่านในยุคนั้นไม่ว่าจะเป็น ไทยรัฐ บ้านเมือง เดลินิวส์ สยามรัฐ หรือ Bangkok Post

พอผมย้ายมาอยู่นครปฐมตั้งแต่ช้นประถมปลายที่บ้านเปิดร้านขายหนังสือ คุณพ่อและแม่ก็จะมีการบ้านให้เอาหนังสือมาอ่านในแต่ละสัปดาห์และต้องสรุปส่งให้ บางทีก็อ่านหนังสือประวัติศาสตร์การเมืองต่างๆทำให้เป็นคนชื่นชอบกับการอ่านหนังสือมากขึ้น เมื่อขึ้นสู่ชั้นมัธยมศึกษาความสุขเล็กๆน้อยๆของนักเรียนอย่างผมก็เริ่มต้นจากที่ตามคุณแม่ที่ไปค้นเอกสารที่ กองจดหมายเหตุแห่งชาติ ทำให้เรามีโอกาสเข้าไปอ่านและค้นหนังสือที่ หอสมุดแห่งชาติ ท่าวาสุกรี ตอนหลังก็เริ่มนั่งรถเมล์ไปเองจากนครปฐมเพื่อไปอ่านหนังสือพิมพ์เก่าๆย้อนหลังเป็นสิบๆปี บางทีอยู่ที่หอสมุดแห่งชาติได้ทั้งวัน หรือบางครั้งก็ไปเดินดูหนังสือที่ ร้านดวงกมล ตรงสยามสแควร์ ไปยืนเลือกดูหนังสือได้เป็นชั่วโมง อุปนิสัยนี้ที่ได้มาก็เพราะพ่อกับแม่ชอบพาไปร้านหนังสือตามที่ต่างๆ

 

50102461

รูปที่  1 Encyclopedia Britannica ปี 1967

ความสุขอีกอย่างหนึ่งของเด็กนักเรียนอย่างผมก็คือการได้อ่าน Encyclopedia Britannica ที่พ่อซื้อมาชุดใหญ่ตั้งแต่สมัยทำงาน BBC ที่อังกฤษ แม้จะเป็นรุ่นตั้งแต่ปี 1967 แต่มันก็เป็นคลังความรู้ชั้นดีของผม และมันก็ทำให้ผมสนใจดูข้อมูลสถิติต่างๆ อยากเห็นตัวเลขอะไรสารพัดโดยเฉพาะสถิติกีฬาต่างๆในอดีต เวลาเข้าห้องสมุดหรือร้านหนังสือบางทีผมก็จะรีบไปดูหนังสือภาษาอังกฤษที่เป็น World Almanac สรุปสถิติต่างๆ จำได้ว่าแม้แต่พี่ชายตอนกลับมาจากต่างประเทศในสมัยนั้นยังซื้อหนังสือ Sport Almanac มาฝากแทนที่จะซื้ออย่างอื่น

ตอนเข้าเรียน มหาวิทยาลัยขอนแก่น ก็เริ่มสนใจอ่านอ่านนิตยสารวิเคราะห์การเมืองอย่าง อาทิตย์รายสัปดาห์  และหนังสือการเมืองต่างๆ นอกจากนี้ผมก็ยังชอบเข้าไปยืมและหาหนังสืออ่านในห้องสมุดของมหาวิทยาลัย ยุคนั้นยังไม่มีคอมพิวเตอร์และการอ่านข่าวก็ต้องพึ่งจากหนังสือพิมพ์หรือนิตยสารที่อยู่ในห้องสมุด และก็ชอบเมื่อมีโอกาสเข้าเมืองก็จะไปดูหนังสือที่ ร้านหนังสืออาเข่ง แถวตลาดโต้รุ่ง ที่สมัยนั้นมีหนังสือให้เลือกมากมาย และเมื่อมีโอกาสกลับเข้ากรุงเทพ สถานที่ซึ่งเลือกจะไปเยี่ยมก็คือร้านหนังสือต่างๆ ไม่ใช่ศูนย์การค้าหรือร้านกาแฟ โดยเฉพาะร้านหนังสือต่างๆบริเวณสยามสแควร์ หรือแม้แต่แว๊บนั่งรถเมล์เข้าไปค้นหนังสือเก่าๆในหอสมุดแห่งชาติ

อุปนิสัยนี้ติดตัวมาจนเข้าทำงานและเรียนต่อประเทศ ผมก็จะเลือกไปดูหนังสือตามห้องสมุด ตามร้านหนังสือ ในต่างประเทศ จำได้ว่าตอนเรียนต่อปริญญาโทและเอกที่  University of Auckland  ประเทศนิวซีแลนด์ ผมก็ไปห้องสมุดของมหาวิทยาลัยหาหนังสือพิมพ์ไทยอ่านที่อาจเป็นหนังสือพิมพ์เก่าย้อนหลัง 2-3 สัปดาห์อ่าน เพราะเป็นช่องทางเดียวที่จะทราบข่าวเมืองไทยในยุคที่ยังไม่มีอินเตอร์เน็ต แม้แต่ตอนไปทำงานในต่างประเทศบางครั้งมีเวลาว่างผมยังเลือกที่จะไปร้านหนังสือมากกว่าทีอื่น จำได้ว่าครั้งหนึ่งมีเวลาแค่วันเดียวในเมือง Toronto ประเทศแคนาดา ผมเลือกที่ไปดูหนังสือที่ร้าน Barnes and Nobles และอยู่ที่นั้น 4-5 ชั่วโมง มากกว่าที่จะไปเที่ยวที่อื่นๆ หรือแม้แต่ตอนทำงาน Sun Microsystems ที่ช่วงหนึ่งต้องไปประชุมที่สิงคโปร์บ่อยๆผมก็จะต้องแวะไปดูหนังสือที่ร้าน Computer Book Center ในห้าง Funan Digital IT Mall  ทุกครั้งที่มีโอกาส ซึ่งร้านมีหนังสือคอมพิวเตอร์ให้ผมเลือกมากมาย ยืนดูได้เป็นชั่วโมง

แต่ทุกวันนี้ ข่าวในหน้าหนังสือพิมพ์ได้ตายจากผมไปแล้ว ผมไม่เคยตื่นเต้นต้องมารอคนมาส่งหนังสือพิมพ์เหมือนเดิมแล้ว โลกโซเชียลทำให้ผมทราบข่าวตรงจากผู้สื่อข่าวจากสนามข่าวผ่าน Tweeter หรือออนไลน์ต่างๆ ข่าวที่ลงในหนังสือพิมพ์เป็นข่าวที่ทราบมาก่อนแล้ว หนังสือพิมพ์วันนี้ผมเน้นที่จะอ่านบทความ บทวิเคราะห์  ผมยังซื้อหนังสือพิมพ์อยู่แต่ไม่ใช่เป็นกระดาษแบบเดิมแล้ว เลิกรับแบบเดิมมานับสิบปีแล้ว เมื่อสิบปีก่อนผมก็เริ่มซื้อหนังสือพิมพ์ โพสต์ทูเดย์ โดยตรงจาก App Store ฉบับที่เป็น e-Book ทุกวัน (แต่จ่ายเป็นรายเดือน) หลังจากนั้นก็มารับหนังสือพิมพ์และนิตยสารแบบบุฟเฟ่ต์ของ OokBee อ่านในรูปแบบของ e-Book อยู่หลายปี จนหนังสือพิมพ์หรือนิตยสารที่เคยอ่านในนั้นทยอยปิดตัวไปเรื่อยๆ จากที่เคยได้อ่านหนังสือพิมพ์วันละ 4-5 ฉบับทยอยปิดตัวไปเรื่อยๆจนกระทั่งไม่มีหนังสือพิมพ์หรือนิตยสารที่ผมอยากอ่านเหลืออยู่เลย จนสุดท้ายก็ต้องหันกลับมารับฉบับออนไลน์โดยตรงกับเจ้าของสำนักพิมพ์คือ กรุงเทพธุรกิจ และล่าสุดก็สมัครเป็นสมาชิกหนังสือพิมพ์ Business Today  ใช่ครับคนกลางที่เป็นแผงหนังสือหรือคนส่งหนังสือพิมพ์กำลังหายไปแล้ว

ร้านหนังสือที่เคยไปยืนเลือกดูหนังสือเป็นชั่วโมงๆ ก็เริ่มหายไปแล้ว หนังสือดีๆที่น่าอ่านก็มีให้เลือกน้อยลง ไปร้านหนังสือวันนี้แทบไม่มีนิตยสารให้เลือก หนังสือตามชั้นก็เน้นเรื่องธุรกิจ การเล่นหุ้น หรือวิธีการรวยทางลัด นอกนั้นก็อาจเป็นหนังสือท่องเที่ยว ส่วนหนังสือคอมพิวเตอร์ ประวัติศาสตร์ สังคมก็น้อยลงไปเรื่อยๆ ผมยังไปนั่งทานกาแฟแถวร้านหนังสือที่ Think Space B2S ซึ่งเป็นร้านขนาดใหญ่ตรง Central EastVille และก็ไปทานกาแฟที่ร้านหนังสือบริเวณ Open House ตรง Central Embassy แต่ก็มีหนังสือน้อยเล่มที่ให้เลือกซื้อ

72698843_394940214791098_7983564778368925696_n

รูปที่  2 ตัวอย่างหนังสือใน Kindle App ของผม

ร้านหนังสือผมกลายเป็นว่ามาอยู่ในโลกออนไลน์ ถ้าอยากจะได้หนังสือดีๆก็ต้องซื้อตรงจาก Amazon.com  อ่านผ่าน Kindle App แถมบางเล่มยังสามารถซื้อไฟล์เสียงได้ แล้วก็สั่งด้วยเสียงของเราเปิดฟังอัตโนมัติผ่าน Amazon Echo ในยามที่ต้องการได้ หนังสือก็มีให้เลือกมากมายไม่จำกัด แถมยังมีเนื้อหายังใหม่ๆตลอดเวลา ส่วนร้านหนังสือคอมพิวเตอร์ของผมก็ย้ายมาอยู่ที่ Safari Book Online มีหนังสือด้านเทคโนโลยีให้ผมเลือกอ่านเป็นพันๆเล่ม ผมจ่ายเป็นรายปีอ่านแบบไม่จำกัด แถมยังมีวิดีโอหลักสูตรคอมพิวเตอร์ต่างๆให้ผมเรียน ที่สำคัญสุดหนังสือเทคโนโลยีเหล่านี้ใหม่มากๆบางทีผู้เขียนยังเขียนเสร็จไม่ครบทุกบทยังไม่ตีพิมพ์เป็นเล่มขายแต่ผมก็ได้อ่าน E-Book ที่เป็น Early Edition หรือ Pre-Print แล้ว

72578371_2459527324155471_8548084280343920640_n

รูปที่  3 ตัวอย่างหนังสือที่ผมอ่านใน Safari Book Online

Encyclopedia ก็กลายเป็น Wikipedia หรือ Google แม้อินเตอร์เน็ตจะมีข้อมูลมากมาย หลายแหล่งอาจไม่ถูกต้อง แต่ด้วยความโชคดีที่ได้ฝึกทักษะในการอ่าน ในการค้นข้อมูล สรุปย่อความและคิดวิเคราะห์ตั้งแต่เด็ก ก็เลยพอมั่นใจตัวเองได้ในระดับหนึ่งว่ามีหลักการในการหาข้อมูลที่พอเชื่อถือได้ จากทักษะตั้งแต่ในยุคอนาล็อกนั้นละครับ ไม่ใช่ประเภทตามกระแสโซเชียลที่กด Click, Like และ Share

ล่าสุดผมเห็นข่าวงานสัปดาห์หนังสือแห่งชาติในปีนี้ คนเริ่มเงียบเหงาลง มีคำถามว่าหนังสือก็ตายแล้วหรอ สำหรับผมเนื้อหา (Content) ยังไม่มีวันตาย เผลอๆในโลกยุคปัจจุบันผู้คนต้องการบริโภคเนื้อหาทีถูกต้องและแม่นยำกว่าเดิม คนที่ต้องการเนื้อหาดีๆยังต้องจ่ายเงินแต่ช่องทางอาจเปลี่ยนไปแล้ว อาจไม่ใช่เป็นกระดาษเป็นเล่มแบบเดิม แต่อาจเป็นการซื้อบนโลกออนไลน์ แบบทันทีทันใด อ่านจากอุปกรณ์ไหนก็ได้ และเนื้อหาต้องทันสมัย สำคัญสุดวันนี้ถ้าเราอยากให้ลูกหลานเราอ่านเนื้อหาดีๆ ภาษาอังกฤษพวกเขาต้องเก่ง เพราะมีเนื้อหามากมายในโลกออนไลน์ ที่จะรอแปลมาเป็นไทยก็อาจไม่ทันโลกแล้ว และสำคัญสุดในยุคเทคโนโลยีดิจิทัลเราต้องสอนให้เด็กรุ่นใหม่ ค้นข้อมูล และคิดเชิงวิเคราะห์ให้ได้ว่าข้อมูลไหนถูกต้อง ไม่ใช่แค่สอนการใช้กูเกิ้ล

ธนชาติ นุ่มนนท์

IMC Institute

 

ยุคของ Citizen Data Scientist กำลังมา

Screenshot 2019-10-01 10.27.57

เรามักจะได้ยินว่าอาชีพหนึ่งที่เป็นที่ต้องการในยุคนี้คือ Data Scientist (นักวิทยาศาสตร์ข้อมูล) ซึ่งเป็นผู้ที่จะนำอัลกอริทึมทางด้าน Machine Learning มาใช้ในการวิเคราะห์ข้อมูล Data Scientist จะต้องมีความรู้ทางด้านคณิตศาสตร์ การพัฒนาโปรแกรม และองค์ความรู้ทางธุรกิจที่จะใช้ในการวิเคราะห์ข้อมูล อาชีพนี้เป็นที่ต้องการของบริษัทใหญ่ๆจำนวนมาก โดยเฉพาะบริษัทเทคโนโลยีอย่าง Amazon, Google, NetFlix หรือ Uber แม้แต่ในบ้านเราเองก็มีความพยายามที่จะหานักวิทยาศาสตร์ข้อมูลที่มีจบปริญญาโทหรือเอก หรือมีประสบการณ์ในการทำงานด้านนี้ในต่างประเทศเข้ามาทำงาน

บางสถาบันในบ้านเราก็เปิดหลักสูตรระดับปริญญาตรีด้าน Data Scientist ซึ่งก็น่าจะเป็นสาขาที่เรียกยากเพราะผู้ที่จะจบการศึกษาด้านนี้และออกมาทำงานได้ดี ก็ควรจะต้องมีความเชี่ยวชาญด้านคณิตศาสตร์ในระดับสูง มีความสามารถที่จะพัฒนาโมเดลทางคณิตศาสตร์และเข้าใจอัลกอริทึมต่างๆได้เป็นอย่างดี ซึ่งหลักสูตรส่วนใหญ่ในบ้านเราก็อาจจะสอนเน้นไปทางการพัฒนาโปรแกรมหรือไม่ก็ใช้เครื่องมือในการวิเคราะห์ข้อมูลอย่าง Data Visualisation หรือ  Business Intelligent เสียมากกว่า

ดังนั้นจะเห็นได้ว่าการหา Data Scientist  หรือแม้แต่การพัฒนา Data Scientist  ดีๆมาซักคนหนึ่งจึงเป็นเรื่องที่ยาก และทำให้อาชีพนี้ยังขาดแคลนบุคลากร แต่เมื่อไม่กี่ปีที่ผ่านมาบริษัทวิจัย Gartner ก็ได้นิยามคำว่า  Citizen Data Scientist ขึ้นมาโดยระบุว่า “เป็นผู้ที่ใช้โมเดลในการทำ Predictive หรือ prescriptive analytics ในการวิเคราะห์ข้อมูล แต่ไม่ได้เน้นศาสตร์ทางด้านคณิตศาสตร์ กล่าวคือใช้เครื่องมือสำเร็จรูปมาในการวิเคาระห์ข้อมูล โดยทำหน้าที่เสมือนผู้ที่เชื่อมโยงงานของ Business User ที่ต้องการวิเคราะห์ข้อมูลเอง กับ  Data Scientist ทีมีความสามารถด้านการทำ Analytics  ขั้นสูง”

ด้วยเครื่องมือที่ดีในปัจจุบันทำให้เราสามารถที่จะจัดการข้อมูลได้อย่างอัตโนมัติในหลายๆด้านอาทิเช่น

  • Augmented data preparation คือการใช้ Machine Learning  ในการจัดการเตรียมข้อมูลต่างๆได้อย่างอัตโนมัติเช่น การทำ data profiling หรือการปรับปรุงคุณภาพของข้อมูล
  • Augmented data discovery คือการที่ Citizen data scientists สามารถใช้ machine learning ได้อย่างอัตโนมัติในการ ค้นหา ความสัมพันธ์, Pattern หรือ คาดการณ์ข้อมูลได้โดยไม่ต้องสร้างโมเดลคณิตศาสตร์หรือเขียนอัลกอริทึมใดๆ

ทั้งนี้เครื่องมือเหล่านี้มักจะมี visualization tools ในลักษณะ Drag and drop หรือการใช้ภาษาทั่วไปในการสอบถามข้อมูล (natural-language query)  โดยไม่ต้องเขียนโปรแกรม

Gartner ได้กำหนดให้เทคโนโลยีอย่าง Augmented Analytics เป็นหนึ่งในแนวโน้มเทคโนโลยีที่น่าจับตามองในปี 2019 และคาดการณ์ว่าจำนวน citizen data scientists จะเพิ่มขึ้นรวดเร็วกว่า data scientists  ปกติถึง 5 เท่าในปี 2020 และคาดการณ์ว่าการทำ Adavanced Analytics ในปีนี้จะถูกสร้างมาจาก citizen data scientist มากกว่า data scientist ปกติ โดย 40% ของงาน Data Science จะกลายเป็นระบบอัตโตมัติที่ถูกสร้างมาจากเครื่องมือที่ดีขึ้น

ตารางที่ 1  เปรียบเทียบบทบาทหน้าที่ต่างๆ

Screenshot 2019-01-02 11.13.41

ซึ่งหากเราจะสรุปบทบาทหน้าของ Citizen data scientist, Business User และ Data scientist ก็อาจพอสรุปคร่าวๆได้ดังตารางที่ 1 และสรุปท้ายผมขอยกตัวอย่างเครื่องมือในการทำ Augmented Analytics บางตัวที่ Gartner  ระบุไว้เพื่อให้เห็นกันดังภาพข้างล่างนี้

ธนชาติ นุ่มนนท์

IMC Institute

Screenshot 2019-01-02 10.54.58

Screenshot 2019-01-02 10.55.10

 

 

Hybrid Cloud Computing แนวโน้มของระบบไอที

Screenshot 2018-10-14 13.55.59

สัปดาห์ที่ผ่านมา (9-11 ตุลาคม 2018) ทีมงาน IMC Institute  พาผู้เข้าอบรม 16 ท่านไปดูงาน Cloud Expo Asia 2018 ที่ประเทศสิงคโปร์ โดยนับเป็นปีที่ 5 ที่ทางเราพาผู้เข้าอบรมไป ซึ่งนอกเหนือจากการเข้าชมงานก็ยังได้พาผู้เข้าอบรมไปเยียมชมบริษัท Oracle ด้วย

43462155_1228836723930332_1337121326103527424_n

สำหรับในปีนี้ทางผมเองได้เข้าไปร่วมบรรยายในงานนี้ด้วยในหัวข้อ Hybrid Cloud Strategies Drive Demand for Colocation ซึ่งผู้สนใจสามารถดูสไลด์การบรรยายของผมได้ที่ https://tinyurl.com/hybrid-cloud-imc โดยในการบรรยายนี้ผมได้กล่าวนำให้เห็นว่าจากการมาเยียมชมงาน Cloud Expo Asia ต่อเนื่องมาทุกปี ได้เห็นการเปลี่ยนแปลงของงานจากเดิมที่ปีแรกๆจะเน้นที่ ผู้ให้บริการ Public cloud ค่ายต่างๆอย่าง  Amazon, Google, Micrsoft มาออกงาน ในปีหลังๆก็จะเห็นเน้นไปที่การทำโซลูชั่นอย่าง IoT, Big Data หรือ AI โดยใช้ Cloud Computing มากขึ้น และในปัจจุบันก็เน้นไปที่การทำ Multi-cloud มากขึ้น ซึ่งก็สอดคล้องกับผลสำรวจของ Rightscale ปีล่าสุดที่ชี้ให้เห็นว่า ระบบไอทีในองค์กรต่างๆจะเป็น  Multi-cloud  มากขึ้น โดยมีแนวโน้มที่จะเป็น Hybrid cloud มากกว่าที่จะเป็น Multiple public cloud หรือ   Multiple private cloud ดังแสดงในรูปที่ 1 นอกจากนี้ก็ยังพบว่าจากการสำรวจผู้ใช้ทั่วโลกเกือบ 1000 ราย เกือบ 96% จะใช้ Cloud computing  ในปัจจุบันโดยเกือบ 71% จะตอบว่าจะใช้  Hybrid cloud ดังแสดงในรูปที่ 2

Screenshot 2018-10-14 14.09.25

รูปที่ 1 ผลการสำรวจการใช้  Cloud ขององค์กรขนาดใหญ่  [จาก RightScale]

Screenshot 2018-10-14 14.14.55

รูปที่ 2 ผลการสำรวจการใช้  Cloud   [จาก RightScale]

แม้ Public cloud รายใหญ่ๆจะมีประโยชน์ในด้านเงินลงทุนที่ค่อนข้างต่ำ เพราะเป็นการคิดค่าใช้จ่ายตามการใช้งาน และยังมีจุดเด่นที่มีบริการใหม่ๆมากมายอาทิเช่นด้าน  Big data, IoT หรือ AI ที่จะทำให้หน่วยงานพัฒนาระบบไอทีใหม่ๆได้รวดเร็วขึ้น แต่เมื่อมีการใช้งานมากๆค่าใช้จ่ายก็อาจสูงขึ้นกว่าการพัฒนาระบบ Private cloud เองหรือสูงกว่าการใช้ On-premise นอกจากนี้ก็อาจมีปัญหาเรื่องความปลอดภัยหรือด้าน Compliance ประเด็นที่สำคัญอีกด้านก็คืออาจเจอปัญหาเรื่อง  Vendor Lock-in

ดังนั้นจึงเป็นไปได้ยากที่องค์กรจะใช้เฉพาะ  Public cloud และแนวโน้มด้านไอทีเราคงจะต้องเห็นการผสมผสานกันระหว่างการใช้ Private cloud หรือระบบ  On-premise กับการใช้ Public cloud โดยเราอาจแบ่งระบบไอทีขององค์กรได้เป็นสองกลุ่ม

  • กลุ่มที่ 1 ระบบ Application ดั้งเดิม หรือระบบที่มีความสำคัญยิ่งยวด รวมถึงระบบ Core ขององค์กร ซึงพวกนี้ก็จะเป็นกลุ่มที่ใช้ Private cloud/On-premise
  • กลุ่มที่ 2 ระบบ Application ใหม่ๆ ที่ต้องการความรวดเร็วในการพัฒนา หรือที่ใช้เทคโนโลยีใหม่ๆในการพัฒนา กลุ่มพวกนี้จะใช้ Public cloud

ซึ่งองค์กรสามารถที่จะดูแลระบบไอทีทั้งสองนี้ในรูปแบบของ Bi-model IT กล่าวคือทั้งสองระบบจะแยกกันอยู่ หรือจะเป็น  Single infrastructure ก็ได้ โดยในรูปแบบหลังจะมีผลดีกว่าเพราะสามารถจะย้าย  workload ต่างๆได้ง่ายขึ้น โดยทั้งสองระบบจะเชื่อมต่อผ่าน VPN ดังรูปที่ 3

Screenshot 2018-10-14 14.31.25.png

รูปที่ 3 Hybrid Cloud Model

ทั้งนี้เราสามารถใช้  Hybrid Cloud ได้หลายรูปแบบอาทิเช่น

  • Isolated use cases คือการวางระบบ  Application ที่ต่างกันแยกในส่วนของ Private หรือ  Public cloud ที่ต่างกัน
  • Coexisting use cases  คือการที่เราอาจเอา Application เดียวกันมาติดตั้งไว้ในทั้ง Private และ Public cloud  เช่นกรณีของ  Cloud bursting ที่เราจะใช้ Private cloud สำหรับกรณีของ Fixed load แล้วในช่วงของ Peak load ก็ขยายไปใช้ Public cloud หรือกรณีของ Big data  ที่อาจมีข้อมูลเก็บไว้ในทั้งสองระบบ และเมื่อต้องการประมวลผลข้อมูลขนาดใหญ่ก็อาจไปใช้ Public cloud
  • Supporting application use cases  คือตัวอย่างของการพัฒนา Applicationใหม่ๆที่อาจต้องการใช้เครื่องมือใน Public cloud เช่นการใช้ Machine learning

การพัฒนาระบบขององค์กรสู่ Hybrid cloud จะมีขั้นตอนสำคัญที่ต้องพิจารณาคือ

  1. วางแผนระบบ  Application ต่างๆว่าระบบใดเหมาะกับ  Cloud โมเดลแบบไหน เช่น Private, Public หรือ  On-Premise
  2. ต้องพยายามเลือก Cloud Framework หนึ่งเดียวเพื่อลดความวุ่นวายในการดูแลลหลายระบบ อาทิเช่นอาจต้องตัดสินใจเลือก  VMWare, OpenStack, Azure stack หรือ ระบบอื่นๆ
  3. ต้องปรับเปลี่ยนระบบไอทีในองค์กรที่เป็น On-premise ให้เป็นระบบที่ทันสมัย โดยอาจเป็น Private cloud โดยต้องยึดกับ Framework ที่เลือกไว้
  4. พยายามเลือก Public cloud หรือ Cloud service provide ที่มี Framework ตามที่เลือกไว้และทำการเชื่อมต่อกับ Private cloud ผ่าน  VPN

ทั้งหมดก็เป็นการสรุปการบรรยายของผมสั้นๆที่กล่าวในงานดังกล่าว

ธนชาติ นุ่มนนท์

IMC Institute

การวิเคราะห์ Big Data กับสิทธิของข้อมูลส่วนบุคคล

Screenshot 2018-08-05 11.29.12

เมื่อวันศุกร์ที่ผ่านมาผมมีโอกาสได้ไปบรรยายในงานครบรอบ 10 ปีสถาบันคุ้มครองเงินฝากในหัวข้อเรื่อง Digital Disruptive Technology in Financial Services โดยได้ชี้เห็นว่าเทคโนโลยีที่กำลังเข้ามามีผลกระทบกับอุตสาหกรรมการเงินอย่างมากที่สุดอย่างหนึ่งก็คือ Big data analytics  สิ่งที่น่าสนใจก็คือว่า การที่เรานำเงินไปฝากไว้กับสถาบันการเงิน ไม่เพียงแต่จะมีเงินที่เข้ามาฝากไว้ที่สถาบันการเงิน แต่ยังมีข้อมูลต่างๆอีกเป็นจำนวนมาก อาทิเช่น ข้อมูลรายละเอียดส่วนบุคคล (ชื่อ,  ที่อยู่, อายุ, สถานที่ทำงาน), ข้อมูลด้านการเงิน (เงินฝาก, เงินกู้, รายได้, รายจ่าย) หรือข้อมูลธุรกรรมการเงินต่างๆอีกมากมาย ก็เลยอยากตั้งคำถามว่า ข้อมูลเหล่านี้เป็นของใคร ของลูกค้าหรือของสถาบันการเงิน

Screenshot 2018-08-05 12.59.06

บางท่านอาจเข้าใจว่าเป็นของสถาบันการเงิน ผมอยากให้ลองคิดถึงข้อมูลทางการแพทย์โดยเฉพาะข้อมูลการรักษาพยาบาลของเรา ข้อมูลเหล่านั้นเป็นของโรงพยาบาล,ของเราหรือของรัฐบาล ผมคิดว่าหลายๆคนคงตอบว่า เป็นข้อมูลส่วนบุคคลของเรา เราคงไม่ยินยอมถ้าทางโรงพยาบาลหรือแพทย์จะเอาข้อมูลเหล่านั้นไปทำ Big Data Analytics มาทำการวิเคราะห์หรือคาดการณ์อะไรต่างๆกับตัวเราโดยที่เราไม่ทราบล่วงหน้า หากโรงพยาบาลอยู่ๆจะนำประวัติการรักษาของเรามาวิเคราะห์และมาคาดการณ์ว่าเราจะเป็นโรคนั้นโรคนี้โดยที่เราไม่ได้อนุญาตล่วงหน้าเราคงไม่ยินดี และถือว่าเป็นการละเมิดสิทธิส่วนบุคคลอย่างมาก ดังนั้นการวิเคราะห์ข้อมูลในวงการแพทย์จะต้องไม่สามารถที่จะสืบกลับมาได้ว่าเป็นข้อมูลของใคร และถ้าเป็นการคาดการณ์เรื่องของโรคร้ายต่างๆก็น่าจะเป็นการวิเคราะห์ภาพรวม ยกเว้นเสียแต่ว่าคนไข้จะยินยอมให้ใช้ข้อมูลส่วนบุคคลไปวิเคราะห์หรือทำ  Predictive analytics กับคนไข้เฉพาะราย

big-data-analytics-banking-industry-video

เช่นกันโดยหลักการข้อมูลที่อยู่สถาบันการเงินก็น่าจะเป็นข้อมูลของลูกค้า โดยหลักการสถาบันการเงินก็ไม่น่าที่จะมีสิทธิเอาข้อมูลลูกค้ามาวิเคราะห์เป็นรายบุคคลโดยไม่ขออนุญาตว่าจะทำการวิเคราะห์อะไร ไม่ควรที่จะมาวิเคราะห์ว่า

  • ลูกค้ามีรายได้เท่าไร มีเงินเพียงพอหรือไม่
  • ลูกค้าต้องการจะกู้ยืมหรือไม่
  • ลูกค้ามีรายจ่ายอย่างไร ซื้อบ้านกี่หลัง ผ่อนรถกี่คน
  • ลูกค้าไปใช้จ่ายเงินอย่างไร ประเภทใด ร้านค้าใด
  • ลูกค้าชำระค่าน้ำ ค่าไฟ ค่าโทรศัพท์เดือนเท่าไร
  • ลูกค้าเดินทางไปต่างประเทศบ่อยไหม

ข้อมูลเหล่านี้เป็นข้อมูลส่วนบุคคล ถ้าลูกค้าไม่ได้ร้องขอสินเชื่อให้ทำการวิเคราะห์ สถาบันการเงินก็ไม่สมควรที่จะนำไปทำการวิเคราะห์โดยไม่ได้รับความยินยอมจากลูกค้า หรืออยู่ดีๆจะมาแนะนำว่าผลการวิเคราะห์ลูกค้าใช้จ่ายอย่างไร จะต้องการกู้ยืมเงินไหมเพราะคิดว่าเรามีรายได้ไม่พอใช้

บางท่านอาจแย้งว่าลูกค้าได้เคย  consent อนุญาตให้ใช้ข้อมูลตั้งแต่เปิดบัญชีแล้ว จริงๆแล้วการ  consent น่าจะเป็นการใช้ข้อมูลโดยทั่วไป และไม่เคยมีการบอกมาชัดเจนว่าจะนำไปใช้อะไร ทำให้นึกถึงกรณีกฎระเบียบด้านข้อมูลอันใหม่ของ EU เรื่อง General Data Protection Regulation (GDPR) ได้เขียนไว้ชัดว่าข้อมูลต่างๆเหล่านี้เป็นของประชาชนและย่อมมีสิทธิที่จะทราบว่าผู้เก็บข้อมูลจะเอาไปทำอะไร แม้แต่การ Consent: ที่ต้องขอความยินยอมจากเจ้าของข้อมูลต้องเข้าใจง่าย และต้องระบุอย่างชัดเจนว่าจะนำข้อมูลไปใช้ทำอะไร เพื่อวัตถุประสงค์ใด หรือสิทธิของเจ้าของข้อมูล (ประชาชน) ที่จะขอดูข้อมูล ขอให้ลบและเคลื่อนย้าย

ข้อมูลที่เราเก็บไว้ในสถาบันการเงิน แตกต่างกับข้อมูลใน Social media อย่าง Facebook หรือ  Google พวก Social media เหล่านั้นลูกค้ามีสิทธิที่จะให้หรือไม่ให้ข้อมูลก็ได้ จะบอกที่อยู่ อายุ ชื่อจริง หรือเบอร์มือถือหรือไม่ก็ได้ แต่ข้อมูลที่อยู่กับสถาบันการเงินลูกค้าต้องใช้ข้อมูลจริง และเป็นข้อมูลส่วนบุคคลด้านการเงิน ที่สถาบันการเงินเก็บไว้ ซึ่งถือว่าเป็นข้อมูลที่สำคัญยิ่งและมีความอ่อนไหว (sentitive data) ไม่ควรต่อการให้ใครก็ได้นำมาวิเคราะห์ต่างๆโดยไม่ได้รับอนุญาต แต่เดิมลูกค้าอาจไม่เคยเห็นความสำคัญของข้อมูลเหล่านี้แต่ในปัจจุบันเราเริ่มเห็นกันแล้วว่าสินทรัพย์ที่สำคัญอีกอย่างหนึ่งที่เราฝากไว้กับสถาบันการเงินนอกเหนือจากตัวเงินก็คือข้อมูล เรามีสถาบันคุ้มครองเงินฝากของเรา แล้วใครละจะมาคุ้มครองข้อมูลของเราไม่ให้ถูกละเมิด

ธนชาติ นุ่มนนท์

IMC Institute

 

ขั้นตอนการทำโครงการ Big Data

Screenshot 2018-05-03 16.00.42

คำว่า Big Data กำลังเป็นศัพท์เทคนิคที่น่าสนใจในมุมของผู้บริหารองค์กรหลายๆแห่งทั้งภาครัฐและเอกชน ซึ่งนอกจากว่าผู้บริหารจำนวนหนึ่งจะมาใช้เป็นศัพท์ในการตลาดแล้วบางครั้งก็ทำให้ราวเหมือนกับว่ามันจะเป็นเทคโนโลยีวิเศษที่จะสร้างประโยชน์ให้กับองค์กรอย่างมากมาย

มีคนเคยบอกความหมายของคำว่า Big data ในเชิงคบขำไว้ว่า “Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, so everyone claims they are doing it... ”  (Prof. Dan Ariely ) คำพูดก็คล้ายกับที่ประเทศเราในตอนนี้ที่ทุกคนต่างก็พูดถึง Big Data บางทีข้อมูลเล็กนิดเดียวก็บอกว่าทำ Big Data บางครั้งก็สั่งงานให้ฝ่ายเทคโนโลยสารสนเทศไปเริ่มทำโครงการ Big Data ทั้งๆที่ Big Data น่าจะเริ่มจากกลยุทธ์ไม่ใช่เริ่มที่เทคโนโลยี แล้วบางคนก็บอกว่าทำโครงการ Big Data  เสร็จแล้ว

Untitled (1)

รูปที่ 1 ขั้นตอนการทำโครงการ Big Data

เมื่อวันก่อนผมมีโอกาสเขียนรูปภาพแสดงขั้นตอนง่ายๆให้เห็นว่าเราจะเริ่มทำโครงการ Big Data ได้อย่างไร  โดยมีขั้นตอนดังแสดงในรูปที่ 1

โครงการ  Big Data ต้องเริ่มต้นด้วยการทำกลยุทธ์ข้อมูล (Data strategy) ที่ผู้บริหารหน่วยงานต่างๆในองค์กรมากำหนดร่วมกัน ซึ่งกลยุทธ์ที่ดีไม่ได้ดูที่ว่ามีข้อมูลอะไรอยู่ในองค์กร แต่อยู่ที่ว่าธุรกิจมีเป้าหมายอะไร และข้อมูลใดที่จะช่วยให้บรรลุเป้าหมายนั้น

ซึ่งเมื่อได้กลยุทธ์แล้วเราจะเริ่มเข้าใจได้ว่าลักษณะข้อมูลที่ต้องการใช้เป็นอย่างไร ทั้งนี้ข้อมูลที่ต้องการจะนำมาใช้อาจแบ่งเป็นสองกลุ่มคือ

  • ข้อมูลที่มีอยู่ในปัจจุบันอยู่แล้ว แต่เราไม่เคยนำมาวิเคราะห์ ข้อมูลลักษณะนี้เราเรียกว่า Dark data ซึ่งก็อาจเป็นข้อมูลขนาดใหญ่ในองค์กร
  • ข้อมูลที่ยังไม่มี แต่คิดว่าน่าจะเป็นประโยชน์ ทั้งนี้อาจต้องไปหาข้อมูลเหล่านี้มาจากแหล่งอื่นๆเช่น พันธมิตร หรืออาจต้องซื้อข้อมูล บางครั้งอาจต้องหาเทคโนโลยีเช่น IoT เข้ามาช่วยในการเก็บซึ่งอาจต้องใช้เวลากว่าจะสะสมหรือหาข้อมูลได้

หากกลยุทธ์ต้องการข้อมูลกลุ่มหลังก็อาจต้องใช้เวลากว่าที่จะเริ่มทำโครงการได้ หรือบางครั้งเราอาจไม่มีข้อมูลเหล่านั้นเลยก็เป็นไปได้ ซึ่งสุดท้ายเราอาจจะต้องปรับกลยุทธ์ใหม่เพื่อให้ได้ข้อมูลที่มีอยู่แล้วเพื่อความรวดเร็วในการทำโครงการ

เมื่อเรามีข้อมูลที่เพียงพอคำถามถัดมาก็คือว่า ข้อมูลเหล่านั้นเป็นไปตามนิยามของ Big data ที่ว่า Volume, Variety, Velocity, Varacity จริงหรือไม่

  • ถ้าใช่ เราก็อาจต้องลงทุนโครงสร้างพื้นฐานด้าน Big data เช่นการจัดหา Data Lake อย่าง Hadoop หรือ Cloud storage
  • ถ้าไม่ใช่ บางครั้งโครงสร้างพื้นฐานที่มีอยู่อย่าง  ระบบ Database  ที่เป็น RDBMS ก็อาจเพียงพอและไม่จำเป็นจะต้องจัดหาระบบอย่าง  Data Lake

กรณีที่ข้อมูลที่ต้องการไม่ใช่ Big Data ก็คงต้องวิเคราะห์ต่อว่า จะมีการทำ Predictive Analytic โดยการใช้ Machine Learning หรือ เพราะถ้ามี ก็อาจจำเป็นต้องจัดหาเครื่องมือในการทำเรื่องนี้มาใช้ เพราะภาษา SQL ที่ใช้กับระบบ Database ไม่สามารถจะมาใช้ทำ Predictive Analytic ได้

แต่ถ้าข้อมูลไม่ใช่ Big data มีแค่จำนวนเป็นหลักสิบล้านและไม่ได้เข้าข่ายนิยามอะไรที่เป็น Big data แลัวก็ยังไม่มีการทำ Predictive Analytic  เน้นแต่การสอบถามข้อมูล (Data query) ทำ Dashboard เป็นโครงการทำ Data warehouse และ Business Intelligence แต่ผู้บริหารอยากเรียกว่า Big data เราก็คงต้องเข้าใจว่าเป็นอย่าง Prof. Dan Ariely ว่า ก็ยอมๆไปแล้วกันครับ เพราะผู้บริหารต้องการใช้คำว่า Big data ในการตลาด

สุดท้ายถ้าเรามีข้อมูลขนาดใหญ่และต้องการทำ Predictive analytics เราก็อาจใช้ทีม Data science ที่เข้าใจ Machine learning มาช่วยงาน และอาจต้องมีการแสดงผลผ่าน Data visualisation ซึ่งเราก็จะอาจจะได้ผลลัพธ์ตามกลยุทธ์ที่กำหนดไว้ในตอนต้น แต่โครงการทั้งหมดก็ต้องใช้เวลาในการทำงาน ตั้งแต่รวบรวมข้อมูล การทำโครงสร้างพื้นฐาน และการวิเคราะห์ข้อมูล ไม่มี Quick win ในการทำโครงการ  Big data ครับ

ธนชาติ นุ่มนนท์

IMC Institute

พฤษภาคม 2561

 

 

Mini Project ในหลักสูตร Big data certification

Screenshot 2018-04-02 08.54.14

เมื่อวันเสาร์ที่ 20 มกราคม ทาง IMC Institute ได้จัดให้ผู้เรียนหลักสูตร Big Data Certification รุ่นที่ 6 ที่เรียนกันมาสี่เดือนตั้งแต่เดือนกันยายนปีที่แล้ว รวม 120 ชั่วโมง ได้มานำเสนอ Mini-project ของตัวเองโดยมีผู้นำเสนอสามกลุ่มคือ

  • กลุ่ม Anime Recommendation ที่มีการนำข้อมูลการดูการ์ตูนจำนวน 7.8 ล้านเรคอร์ดจากหนังการ์ตูน 12,294 เรื่องจาก Kaggle มาทำ Recommendation โดยใช้ ALS algorithm, ทำ Clustering โดยใช้ K-Means algorithm และมีการวิเคราะห์จำนวนการดูหนังแบบ Real-time โดยใช่ KafKa และ Spark streaming (Slide การนำเสนอสามารถดูได้ที่ >> Anime slide)
  • กลุ่ม Telecom churn analysis ที่มีการวิเคราะห์การย้ายค่ายโทรศัพท์มือถือของผู้ใช้ โดยการนำข้อมูลมาวิเคราะห์ดูลักษณะของการย้ายค่าย ทำ Visualisation แสดงผลการวิเคราะห์ต่างๆและมีการทำ  Predictive analytic โดยใช้ Decision Tree Algorithm (Slide การนำเสนอสามารถดูได้ที่ >> Telecom churn slide)
  • กลุ่ม Crime Analysis เป็นการนำข้อมูลอาชญากรรมในเมือง Chicago จำนวน 6 ล้านเรคอร์ด มาทำ Classification โดยใช้ Decision Tree Algorithm เพื่อจะวิเคราะห์ว่าอาชญกรรมกรณีไหน ในสถานการณ์และวันอย่างไร ที่มีโอกาสที่จะจับผู้ร้ายได้สูง   (Slide การนำเสนอสามารถดูได้ที่ >> Crime analysis slide)

Screenshot 2018-01-21 13.22.52

ผมพบกว่านำเสนอของทั้งสามกลุ่ม เข้าใจหลักการของการทำ Big data ได้เป็นอย่างดีตั้งแต่ การทำความเข้าใจปัญหา การเตรียมข้อมูล การใช้เทคโนโลยีและเครื่องมือต่างๆ และรวมถึงการใช้ Algorithm ในการวิเคราะห์ แต่ผัญหาที่เรามักจะเห็นมนบ้านเรากลับเป็นเรื่องของข้อมูลที่ยังมีไม่มากทำให้ขาดโอกาสที่จะใช้ความรู้ในการวิเคราะห์ข้อมูลของบ้านเรามากกว่า ซึ่งหากมีข้อมูลคนที่ผ่านหลักสูตร Big data certification เหล่านี้จำนวน 6 รุ่นแล้ว ก็น่าจะเป็นกำลังสำคัญที่เข้ามาช่วยพัฒนาการวิเคราะห์ข้อมูลขนาดใหญ่ในบ้านเราได้ในอนาคต

สำหรับ IMC Institute เราก็จะจัดงานเพื่อให้ผู้ทีผ่านการอบรมหรือบุคคลทั่วไปได้ลองมาแข่งกันทำ Mini project ในลักษณะนี้ ในโครงการที่ชื่อว่า Big data hackathon โดยตั้งใจจะจัดขึ้นในวันที่ 24-25 กุมภาพันธ์นี้ โดยไม่มีค่าใช้จ่ายใดๆ ซึ่งผู้สนใจสามารถติดต่อเข้าร่วมโครงการสามารถดูรายละเอียดการสมัครได้ที่ www.imcinstitute.com/hackathon ภายในวันที่ 16 กุมภาพันธ์ พ.ศ. 2561

ธนชาติ นุ่มนนท์

IMC Institute

มกราคม 2561