BigData

มันอะไรกัน BigData

ความหมายแรกที่ผุดขึ้นมาในหัวผมเลยเมื่อได้เห็นคำว่า BigData ก็คือ ข้อมูลใหญ่ อืมมันก็ใช่ข้อมูลใหญ่ หรือเยอะๆ ผมเข้าใจถูกต้องละ ซึ่งเขาก็เรียกปริมาณเยอะๆใหญ่ๆแบบนี้ว่า Volume นี่ก็คือลักษณะหนึ่งใน BigData แล้วมันต้องใหญ่ขนาดไหนละ ถึงจะเรียกว่าเป็น BigData ได้ ก็ใหญ่ขนาดที่บรรจุข้อมูลเช่น Log ของ Application ทุกๆวินาที, ข้อมูลทุกๆธุรกรรมบน Web Application อย่าง Amazon หรือ PayPal, ข้อมูลที่เป็นข้อความ รูปภาพ เสียง วีดีโอ หรือเรียกรวมๆว่า MediaFile ที่มาจาก Facebook หรือ Instagram หรือ Google+ หรือ YouTube ที่เกิดขึ้นตลอดเวลา, ข้อมูล GPS หรือ ODB จากรถยนต์ทั่วทั้งประเทศทุกๆนาที หรือวินาที, สายธารข้อมูลจาก Sensor จากบ้านผู้คน จากเขื่อน จากตุ้มลอยในทะเล หรือจากฟามร์ ที่เข้ามาทุกวินาที, ข้อมูลหลายๆอย่างจาก Mobile หรือ GameConsole ของผู้ใช้ทั้งประเทศ หรือทั้งโลก, ข้อมูลที่ไหลเข้าออกบนอุปกรณ์เครือข่าย หรือข้อมูลจาก Device อะไรก็แล้วแต่อีกเยอะแยะมากมาย อย่างนี้เป็นต้น เยอะมั้ยละครับ ข้อมูลที่จะต้องเก็บไว้เหล่านั้น

เอาเป็นว่าเราจะได้ข้อมูลมาเก็บไว้ วันละไม่ต่ำกว่า 1GB หรือมากกว่านั้นก็ว่าได้ จริงๆแล้วคำว่าข้อมูลเยอะๆใหญ่ๆ นี้ก็น่าจะอธิบาย BigData ได้แล้ว เพราะคุณก็ดูดิ ข้อมูลมันได้มาจากความหลากหลายแหล่ง มันมาได้หลากหลายแบบไม่จำกัดโครงสร้าง จำกัดรูปแบบกันไปเลยทีเดียว ซึ่งจะเรียกลักษณะเช่นนี้ของ BigData สั้นๆว่า Variety แหล่งข้อมูลที่หลากหลายก็เลยได้โครงสร้างข้อมูลที่หลากหลายตามมา ซึ่งตรงนี้ต้องการความสำคัญของคุณลักษณะของ BigData  ต่อไป

เมื่อเรามีข้อมูลที่มาจากหลากหลายที่ หลากหลายรูปแบบ เยอะๆมากๆอย่างนี้ ส่งสัยต่อไปว่าเก็บมาทำไม ก็เลยนึกขึ้นได้ว่า โดยความรู้ที่เรามีในด้านการวิเคราะห์ข้อมูล เทคนิคการค้นหาความรู้จากข้อมูล คิดได้ดังนั้น เพื่อไม่ให้ข้อมูลที่เก็บมาเยอะๆมากๆนี้ไร้ประโยชน์ไปเสีย เราก็เลยนำข้อมูลเยอะๆมากๆนี้มาใช้วิเคราะห์(Analytics) ซะเลยสิ ซึ่งเทคนิคการวิเคราะห์ก็คือการจำแนกแยกแยะข้อมูลออกมาว่า มันมีอะไรบ้าง ทำไมถึงต้องมีข้อมูลเหล่านั้น มันสัมพันธ์กันอย่างไร มันเกิดขึ้นมาเมื่อไร แหล่งกำเนิดข้อมูลเหล่านี้ต้นเหตุมาจากที่ไหน มันมีรูปแบบหรือพฤติกรรมอย่างไรละ เป็นต้น เมื่อเราวิเคราะห์ เพื่อแยกแยะข้อมูล ทำความเข้าใจรูปแบบมันได้แล้ว เราก็สามารถนำมาประยุกต์ใช้ในด้านการทำนาย(Predictive) วางแผน(Plainning) ตัดสินใจ(DecisionMaking) เพื่อดำเนินการอะไรต่อมิอะไรของเราต่อไปในอนาคตได้ และนั่นก็คืองานการประมวลผลบน BigData นั่นเอง เช่น สืบค้นข้อมูล, ดำเนินการใดๆกับข้อมูลที่มีรูปแบบที่หลากหลาย, คำนวณค่าทางสถิติ DataMining, MachineLearning, คำนวณแบบจำลองทางคณิตศาสตร์ เพื่อการวิเคราะห์และตัดสินใจได้เร็วจนถึงชนิดที่เรียกว่าแทบจะทันทีทันใดเลยก็ว่าได้(RealTime หรือ NearRealTime) ก็เลยกลายเป็นคุณลักษณะสุดท้ายของ BigData นั่นก็คือความเร็วในการประมวลผลดำเนินการกับข้อมูลหรือที่เรียกสั้นๆว่า Velocity

ผมก็ขอสรุปกันทื่อๆไปเลยว่า BigData ก็คือ ข้อมูลนั่นละ แต่มันมีคุณลักษณะ 3 อย่างก็คือ Volume, Variety และ Velocity หรือเรียกสั้นๆว่า 3V จะมี V อื่นๆอีกก็ว่ากันไปครับ ไม่ผิดครับ สำหรับผม

ขอบคุณครับ

#:P

Advertisements

#big-data