เทคโนโลยี Big Data: Hadoop, NoSQL, NewSQL และ MPP

ผมเคยเขียนบล็อกอธิบายความหมายของ Big Data และได้บอกว่าความหมาย Big Data ไม่ได้มีความหมายแค่ข้อมูลมันใหญ่ แต่เรากำลังพูดถึงเทอม 3V  คือ Volume, Velocity และ Variety ซึ่งจะทำให้เราไม่สามารถที่จะใช้เทคโนโลยีฐานข้อมูลแบบเดิมวิเคราะห์ข้อมูลได้ทั้งหมด และอาจต้องพิจารณาเทคโนโลยีใหม่ๆเช่น Hadoop เข้ามาใช้งานในองค์กร (เนื้อหาสำหรับบล็อก Big Data และเทคโนโลยี Hadoop กับการพัฒนาองค์กรด้านการวิเคราะห์ข้อมูล สามารถดูได้ที่ tinyurl.com/pa2av55)

แต่ถ้าพูดถึงเทคโนโลยีสำหรับ  Big Data แล้วเราอาจเห็นเทคโนโลยีใหม่ๆอีกหลายอย่างที่อาจแบ่งออกได้เป็น 4 กลุ่มดังรูป

  • Hadoop คือเทคโนโลยีที่รองรับ Unstructure Data  ที่มีขนาดใหญ่หลาย PetaByte  ซึ่ง Hadoop เป็นเทคโนโลยี Opensource และมี vendor หลายรายนำไปเผยแพร่ต่อเช่น MapR หรือ CloudEra
  • NoSQL  คือเทคโนโลยีืที่เน้นเก็บข้อมูลขนาดใหญ่ที่ไม่ใช่ RDBMS แต่จะเน้นการเขียนและอ่านข้อมูลมากกว่าการใช้คำสั่งในการค้นหาที่ซับซ้อน จึงไม่ได้มีการใช้ภาษา SQL  ในระบบฐานข้อมูลแบบนี้ ตัวอย่างของซอฟต์แวร์ที่ใช้เทคโนโลยีนี้คือ MongoDB, GraphDB, BerkeleyDB และ CouchDB
  • NewSQL คือฐานข้อมูล  RDBMS แบบใหม่ที่ต้องการจะรองรับข้อมูลขนาดใหญ่ให้ได้เหมือนกับ NoSQL ซึ่งบางส่วนก็อาจนำ Cloud Comuputing มาใช้เช่น  Amazon RDS  หรือ SQL Azure แต่ก็มีตัวอย่างซอฟต์แวร์ฐานข้อมูลอีกหลายตัวที่สามารถรองรับข้อมูลจำนวนมากได้เช่น MySQL Cluster หรือ VoltDB
  • MPP หรือ  Massively Parallel Processing คือระบบที่สามารถประมวลข้อมูลขนาดใหญ่โดยใช้เทคโนโลยีแบบคู่ขนานได้อย่างรวดเร็ว  ซึ่งอาจเป็นเทคโนโลยีพวก Datawarehouse  หรือ  Applicance ของ อาทิเช่น Oracle Exadata, Netezza หรือ Greenplum

รูปภาพ

และหากพิจารณาเทคโนโลยีต่างๆในด้าน Big Data  เราจะพบว่ามีเทคโนโลยีต่างๆมากมายดังรูป โดย Hadoop อาจเป็นเทคโนโลยีที่นำหน้ารายอื่นๆ ในแง่ของการเป็นระบบสำหรับเก็บและวิเคราะห์ Unstructure Data  ขนาดใหญ่

รูปภาพ

ดังนั้นเราจะเห็นได้ว่าการจะพัฒนา  Big Data ในองค์กรจำเป็นจะต้องมีการพัฒนาระบบโครงสร้างด้านข้อมูล (Information Infrastructure) ซึ่งต้องมีเทคโนโลยีหลายๆด้าน โดยไม่ได้มีเพียงแค่ Hadoop  และก็ไม่ได้เป็นการนำเทคโนโลยีใหม่มาแทนระบบเดิม ซึ่งเราอาจเห็นตัวอย่างของเทคโนโลยีต่างๆดังรูป ที่จะเห็นว่ามีการนำเทคโนโลยีที่หลากหลายมาใช้ทั้ง RDBMS, NoSQL, Hadoop, MPP และ  BI

รูปภาพ,

Advertisements

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s