ผมเคยเขียนบล็อกอธิบายความหมายของ Big Data และได้บอกว่าความหมาย Big Data ไม่ได้มีความหมายแค่ข้อมูลมันใหญ่ แต่เรากำลังพูดถึงเทอม 3V  คือ Volume, Velocity และ Variety ซึ่งจะทำให้เราไม่สามารถที่จะใช้เทคโนโลยีฐานข้อมูลแบบเดิมวิเคราะห์ข้อมูลได้ทั้งหมด และอาจต้องพิจารณาเทคโนโลยีใหม่ๆเช่น Hadoop เข้ามาใช้งานในองค์กร (เนื้อหาสำหรับบล็อก Big Data และเทคโนโลยี Hadoop กับการพัฒนาองค์กรด้านการวิเคราะห์ข้อมูล สามารถดูได้ที่ tinyurl.com/pa2av55)

แต่ถ้าพูดถึงเทคโนโลยีสำหรับ  Big Data แล้วเราอาจเห็นเทคโนโลยีใหม่ๆอีกหลายอย่างที่อาจแบ่งออกได้เป็น 4 กลุ่มดังรูป

  • Hadoop คือเทคโนโลยีที่รองรับ Unstructure Data  ที่มีขนาดใหญ่หลาย PetaByte  ซึ่ง Hadoop เป็นเทคโนโลยี Opensource และมี vendor หลายรายนำไปเผยแพร่ต่อเช่น MapR หรือ CloudEra
  • NoSQL  คือเทคโนโลยีืที่เน้นเก็บข้อมูลขนาดใหญ่ที่ไม่ใช่ RDBMS แต่จะเน้นการเขียนและอ่านข้อมูลมากกว่าการใช้คำสั่งในการค้นหาที่ซับซ้อน จึงไม่ได้มีการใช้ภาษา SQL  ในระบบฐานข้อมูลแบบนี้ ตัวอย่างของซอฟต์แวร์ที่ใช้เทคโนโลยีนี้คือ MongoDB, GraphDB, BerkeleyDB และ CouchDB
  • NewSQL คือฐานข้อมูล  RDBMS แบบใหม่ที่ต้องการจะรองรับข้อมูลขนาดใหญ่ให้ได้เหมือนกับ NoSQL ซึ่งบางส่วนก็อาจนำ Cloud Comuputing มาใช้เช่น  Amazon RDS  หรือ SQL Azure แต่ก็มีตัวอย่างซอฟต์แวร์ฐานข้อมูลอีกหลายตัวที่สามารถรองรับข้อมูลจำนวนมากได้เช่น MySQL Cluster หรือ VoltDB
  • MPP หรือ  Massively Parallel Processing คือระบบที่สามารถประมวลข้อมูลขนาดใหญ่โดยใช้เทคโนโลยีแบบคู่ขนานได้อย่างรวดเร็ว  ซึ่งอาจเป็นเทคโนโลยีพวก Datawarehouse  หรือ  Applicance ของ อาทิเช่น Oracle Exadata, Netezza หรือ Greenplum

รูปภาพ

และหากพิจารณาเทคโนโลยีต่างๆในด้าน Big Data  เราจะพบว่ามีเทคโนโลยีต่างๆมากมายดังรูป โดย Hadoop อาจเป็นเทคโนโลยีที่นำหน้ารายอื่นๆ ในแง่ของการเป็นระบบสำหรับเก็บและวิเคราะห์ Unstructure Data  ขนาดใหญ่

รูปภาพ

ดังนั้นเราจะเห็นได้ว่าการจะพัฒนา  Big Data ในองค์กรจำเป็นจะต้องมีการพัฒนาระบบโครงสร้างด้านข้อมูล (Information Infrastructure) ซึ่งต้องมีเทคโนโลยีหลายๆด้าน โดยไม่ได้มีเพียงแค่ Hadoop  และก็ไม่ได้เป็นการนำเทคโนโลยีใหม่มาแทนระบบเดิม ซึ่งเราอาจเห็นตัวอย่างของเทคโนโลยีต่างๆดังรูป ที่จะเห็นว่ามีการนำเทคโนโลยีที่หลากหลายมาใช้ทั้ง RDBMS, NoSQL, Hadoop, MPP และ  BI

รูปภาพ

ธนชาติ นุ่มนนท์

IMC Institute

มีนาคม 2557

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out /  เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

w

Connecting to %s