Screenshot 2015-01-13 08.34.13

วันก่อนได้เห็น Infographic ตามรูปข้างล่างนี้ที่ชื่อว่า The Future of the Database ของ Robin Puro ที่โพสต์ใน  Wired Information Insights ผมว่าเป็นรูปที่เล่าประวัติและคาดการณ์อนาคตของเทคโนโลยีด้านการเก็บข้อมูลได้เป็นอย่างดี

ในรูปเล่าให้เห็นตั้งแต่เทคโนโลยีเก็บข้อมูลในยุคเริ่มต้นในทศวรรษ 1960 แต่ก็จะเน้นให้เห็นถึงในยุคทศวรรษ 1970 ซึ่งเป็นยุคเริ่มต้นของเทคโนโลยีด้าน Relational Database (RDBMS) ทุกคนก็จะเริ่มให้ความสนใจกับเทคโนโลยีการเก็บข้อมูลที่ใช้ภาษา SQL ระบบจะเป็นแบบ Scale Up คือหาเครื่องคอมพิวเตอร์ขนาดใหญ่เข้ามาช่วยในการเก็บข้อมูล จึงเขียนในรูปว่าเป็น Single Instance Relational Database เราจะเห็นโซลูชั่นของ Vendor หลายใหญ่อย่าง Oracle ที่เป็น Commerical Database ตัวเแรก, IBM  ที่ใช้ DB2 หรือ SyBase

ในปลายยุค 1970 และช่วง 1980 ก็มีความพยายามทีจะทำ Entity Relational Database และ Object Oriented Database เพื่อที่จะมาแทนที่ RDBMS แต่ก็ไม่ประสบความสำเร็จและก็หยุดการพัฒนาไป

จากรูป Infographic เราก็จะเห็นว่า มีอีกเทคโนโลยีที่เข้ามาในปลายยุค 1980 ก็คือ Dataware House เพื่อที่จะรวบรวมข้อมูลจากฐานข้อมูลจำนวนมาก ส่วนหนึ่งก็ทำหน้าที่เป็น ETL ของฐานข้อมูลต่างๆ ซึ่ง Dataware House ก็เป็นระบบขนาดใหญ่ที่เป็นเทคโนโลยีแบบ Distributed ที่จะเริ่มใช้ Server หลายๆตัว แต่ก็ยังเป็น SQL โดยมี Vendor อย่าง Teredata เป็นผู้ผลิตโซลูชั่นทางด้านนี้

พอเข้าสู่ยุคของอินเตอร์เน็ตบูมในช่วงปลายทศวรรษ 1990  ข้อมูลเริ่มมีจำนวนมากขึ้น การจะใช้ Server ขนาดใหญ่เพียงเครื่องเดียวเก็บข้อมูลก็เริ่มจะมีปัญหา และต้องใช้ทรัพยากรเช่น CPU หน่วยความจำ หรือ  Storage มากขึ้น การทำวิเคราะห์ข้อมูลอย่างการทำ Business Intelligence หรือ Analytics ก็เริ่มมีมากกว่าการใช้ Transactional Database

ดังนั้นพอขึ้นในยุคทศวรรษ 2000 ก็เริ่มที่จะมีเทคโนโลยีใหม่ๆที่จะเก็บข้อมูลใหญ่ๆได้อย่าง Distrubuted SQL ที่ใช้เครื่อง  Server หลายๆเครื่องอย่าง Clustrix หรือ  NuoDB และก็ Dataware House ใหม่ๆที่เป็นสถาปัตยกรรมแบบ MPP (Massively Palallel Processing) เช่นของ Netezza, Microsoft,  Oracle หรือ IBM มีเทคโนโลยีอย่าง NoSQL ที่ไม่ได้เป็น RDBMS และสามารถเก็บข้อมูลขนาดใหญ่ได้เช่น Google BigTable, MongoDB และ Cassandra และในปลายยุค 2000 ก็มีเทคโนโลยีใหม่อย่าง Hadoop ที่สามารถเก็บข้อมูลที่เป็นแบบ unstructure ได้เป็นจำนวนนับ  Petabyte

มาในยุคปัจจุบันที่กำลังเข้าสู่ Big Data ข้อมูลเริ่มมีขนาดใหญ่ มีหลากหลายรูปแบบไม่ใช่เฉพาะ structure และข้อมูลเปลี่ยนแปลงอย่างรวดเร็ว   (3V: Volume, Variety, Velocity) ทำให้การใช้เทคโนโลยีที่เป็น SQL แบบ Scale Up มีราคาที่แพงขึ้นในขณะที่ระบบแบบ Scale Out ที่เป็น Distributed SQL จะช่วยทำให้เก็บข้อมูลได้มากขึ้น และสามารถวิเคราะห์ข้อมูลแบบ Real-Time ตามความต้องการของธุรกิจได้ และก็เริ่มมีการนำเทคโนโลยีใหม่ที่เป็น MPP มาใช้ใน Distributed SQL รวมถึงโซลูชั่นใหม่ๆอย่าง SAP HANA ที่เป็น in-Memoery Database หรือ  Oracle ExaData นอกจากนี้เราก็ยังเห็นการพัฒนาการของเทคโนโลยีอย่าง Hadoop ที่มีการใช้ภาษาใหม่อย่าง Hive, Pig หรือการพัฒนา Hadoop เวอร์ชั่น 2 ที่มีเทคโนโลนีอย่าง YARN  ที่ช่วยทำให้ประมวลผลแบบ Real-time ได้

สุดท้ายในอนาคต แนวโน้มของ Database ก็จะมี Platform หลักๆอยู่สามตัวที่จะรองรับข้อมูลหลายหลายที่มีขนาดใหญ่คือ  NoSQL, Hadoop  และ  Distributed SQL ทั้งนี้ Single Instance SQL จะมีปัญหาเรื่องการ Scale Up เพื่อรองรับข้อมูลขนาดใหญ่และ Dataware House เองถ้าจะนำมาใช่ในการทำ Analytics ก็จะถูกแทนที่ด้วย Distributed SQL ที่สามารถนำมาใช้ประมวลผลแบบ Real-time  ได้

FutureofDatabase

ธนชาติ นุ่มมนท์

IMC Institute

2 thoughts on “อนาคตของเทคโนโลยีฐานข้อมูล (The Future of the Database)

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s