[บทความตอนที่ 2 สามารถอ่านได้จาก >> https://tinyurl.com/dsm37zsw]

อาชีพนักวิทยาศาสตร์ข้อมูล (Data Scientist) เป็นอาชีพที่กล่าวขานกันมากที่สุด คนหลายคนอยากทำงานอาชีพนี้ เยาวชนรุ่นใหม่ได้รับการบอกกล่าวว่าเป็นอาชีพที่น่าจะมีอนาคตที่ดี สถาบันการศึกษาในบ้านเราหลายที่ก็เปิดสาขาด้าน Data Science ในระดับปริญญาตรีขึ้นมา

พอถามไปลึกๆว่านักวิทยาศาสตร์ข้อมูลทำอะไร คืออะไร หลายคนก็ยังงงๆอยู่ คิดว่าทำงานกับข้อมูล เอาข้อมูลมาวิเคราะห์ และก็คิดว่าน่าจะเป็นตำแหน่งงานด้านไอที และเหมาไปว่างานด้านข้อมูลทุกอย่างต้องเป็นหน้าที่ของนักวิทยาศาสตร์ข้อมูล แต่โดยแท้จริงแล้วงานทางด้านข้อมูลต่างๆรวมถึงด้าน Big Data อาจมีตำแหน่งงานหลายหน้าที่ และแต่ละหน้าที่ก็ใช้ทักษะความชำนาญการไม่เหมือนกัน อาทิเช่น

  • วิศวกรข้อมูล (Data engineer) คือผู้ที่จะนำข้อมูลเข้าระบบ ทำการแปลงข้อมูล ทำเรื่อง Data Cleansing ทำให้ข้อมูลมีความถูกต้องขึ้น ซึ่งงานตรงส่วนนี้ต้องมีความรู้ด้านไอที การพัฒนาโปรแกรมภาษาต่างๆเช่น Python และเทคโนโลยีด้านข้อมูล โดยเฉพาะเรื่องของ Big Data อาทิเช่น Database, Hadoop, Spark และ Cloud services ต่างๆ
  • นักวิเคราะห์ด้านข้อมูล (Data analyst) หรือคนที่จะนำข้อมูลที่ผ่านขบวนการของ Data engineering มาแล้วมาวิเคราะห์ทางธุรกิจในอุตสาหกรรมนั้นๆ แล้วอาจนำไปแสดงผลต่อ ซึ่งงานตรงส่วนนี้นอกจากต้องมีความรู้ด้านธุรกิจนั้น อาจมีความสามารถในการใช้ภาษาคอมพิวเตอร์ที่จะสอบถามข้อมูลอย่าง SQL และอาจต้องสามารถใช้เครื่องมือพวก Data visualisation ได้
  • นักวิทยาศาสตร์ข้อมูล (Data Scientist) คือผู้ที่จะนำข้อมูลที่ผ่านขบวนการของ Data engineering มาแล้ว มาทำการพัฒนาโมเดล พยากรณ์ในเรื่องต่างๆ โดยใช้หลักการของ Machine Learning, AI หรือ Deep learning ผู้ที่จะทำงานด้านนี้ต้องมีความรู้ทางด้านคณิตศาสตร์ การเขียนโปรแกรม และความรู้เชิงธุรกิจนั้นได้ดี แต่ด้วยงานพยากรณ์ข้อมูลมีหลากหลายและเครื่องมือเริ่มง่ายขึ้น ทำให้เราอาจแบ่งนักวิทยาศาสตร์ข้อมูลนี้ได้เป็นกลุ่มย่อยต่างๆดังนี้
    • นักวิทยาศาสตร์ข้อมูลขั้นสูง คือคนที่มีความรู้ด้านคณิตศาสตร์ อัลกอริทึมต่างๆเป็นอย่างดี และจะมาพัฒนาโมเดลในการพยากรณ์ในเรื่องใหม่ๆหรือต้องเจาะลึก และยากกว่าที่เป็นปัญหาโดยทั่วไป ทีมีโมเดลและ Library มาตรฐานอยู่
    • นักวิทยาศาสตร์ข้อมูลที่เน้นการพัฒนาโปรแกรม คนกลุ่มนี้อาจแปรผันมาจาก วิศวกรข้อมูล แต่จะเน้นการเขียนโปรแกรมจากเครื่องมือ หรือ Library ต่างๆที่มีอยู่ เช่นการเขียนภาษา Python หรือ R เพื่อใช้ Scikit-Learn หรือ TensorFlow คนกลุ่มเหล่านี้อาจไม่ได้เก่งโมเดลทางคณิตศาสตร์นัก ทำให้ไม่สามารถทีจะทำการพยากรณ์ในเรื่องยากๆ ที่ต้องมีความรู้ด้านโมเดลเป็นอย่างดี และถ้าในอนาคตเครื่องมือง่ายๆขึ้นไปเรื่อยๆงานของกลุ่มคนเหล่านี้ ก็จะมีความสำคัญน้อยลง เพราะสามารถใช้คนกลุ่มที่สามทำงานได้ดีกว่า
    • Citizen Data Scientist เนื่องจากเครื่องมือในการทำวิทยาศาสตร์ข้อมูลในปัจจุบันเริ่มง่ายขึ้นมาก จนบางครั้งคนทั่วไปก็สามารถทำได้ เช่นการใช้เครื่องมืออย่าง AutoML ดังนั้นคนกลุ่มนี้ในอนาคตจะเป็นกลุ่มใหญ่ในการพยากรณ์ข้อมูล โดยเน้นที่มีความรู้เชิงธุรกิจหรืออุตสาหกรรมนั้น เข้าใจโจทย์ได้ลึกซึ้งกว่าสองกลุ่มแรก จะทำให้มีความต้องการคนในกลุ่มนี้มากขึ้น โดยเอาคนที่มีความรู้ในธุรกิจนั้นไปเรียนรู้การใช้เครื่องมือ เช่นนักเศษฐศาสตร์ นักวิชาการเกษตร แพทย์ นักการตลาด เป็นต้น
  • ผู้ดูแลระบบ (Data administrator) การวิเคราะห์ข้อมูลจำเป็นต้องมีระบบโครงสร้างพื้นฐานด้านไอที จึงต้องมีคนที่มีความสามารถที่จะติดตั้งและดูแล Server หรือ Middleware ต่างๆเช่น Database, Data warehouse หรือ Hadoop ซึ่งงานตรงส่วนนี้ต้องมีความรู้ด้านไอที โดยเฉพาะในเชิงของระบบปฎิบัติการต่างๆ

จากที่เขียนสรุปมานี้จะเห็นได้เลยว่า งานทางด้านข้อมูล ไม่ใช่สำคัญแค่นักวิทยาศาสตร์ข้อมูล และถ้านักวิทยาศาสตร์ข้อมูลไม่เก่งจริง ไม่ใช่คนที่มีความรู้ด้านคณิตศาสตร์ อัลกอริทึมต่างๆเป็นอย่างดี แล้วเน้นเพียงแค่การพัฒนาโปรแกรมโอกาสในการทำงานในอนาคตก็อาจจะถูกแย่งโดยกลุ่ม Citizen Data Scientist ดังนั้นที่เราบอกว่าเรียน Data Science อนาคตจะดีก็ต้องดูลึกๆว่าหลักสูตรที่เรียนได้เน้นด้านคณิตศาสตร์มากแค่ไหน

สิ่งที่สำคัญอีกอย่างที่เห็นจากรูปคืองานด้านข้อมูลส่วนใหญ่ จะเริ่มต้นจากขบวนการ Data Engineering และเผลอๆมากกว่า 70-80% ของงาน จะเป็นงานของวิศวกรข้อมูล อย่างที่เรารู้กันดีครับ ถ้าข้อมูลถูกต้องการวิเคราะห์ต่างๆก็จะถูกต้องตาม หรือที่เรามักพูดว่า “garbage in garbage out”

เดี๋ยวในตอนหน้า ผมจะมาเขียนสรุปให้ต่อว่า ทำไมงาน Data Engineer มีความสำคัญมากพอๆกับงานของ Data Scientist หรือบางครั้งอาจสำคัญกว่าด้วยซ้ำไป

ธนชาติ นุ่มนนท์

IMC Institute

[บทความตอนที่ 2 สามารถอ่านได้จาก >> https://tinyurl.com/dsm37zsw]

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Google photo

You are commenting using your Google account. Log Out /  เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

Connecting to %s