ความสำคัญของ Big Data ในธุรกิจประเภทต่าง ๆ
Big Data หากให้จำกัดความโดยง่ายมันก็คือข้อมูลที่สามารถนำมาสร้างประโยชน์ให้กับธุรกิจหรืออุตสาหกรรมต่าง ๆ ได้ รวมถึงสร้างประสบการณ์ในการใช้สินค้าหรือบริการที่ดีขึ้นแก่ผู้ใช้งานอีกด้วย ซึ่งตัวข้อมูลที่นำมาใช้ในธุรกิจนั้นไม่ได้จำเป็นว่าต้องมีปริมาณมหาศาลขนาดใหญ่แต่อย่างใด ส่วนสาเหตุที่เรียกว่าบิ๊กดาต้านั้นเป็นเพราะว่าข้อมูลที่เป็นประโยชน์เหล่านี้จะแอบซ่อนอยู่ในกลุ่มข้อมูลจำนวนมากนั่นเอง (การหา Hidden Pattern จากข้อมูลจำนวนมาก) ในปัจจุบันมีการนำข้อมูลมาปรับใช้กับธุรกิจเพิ่มขึ้นมากมาย โดยมีตัวอย่างดังนี้
- Recommendation System ระบบแนะนำสิ่งที่ผู้ใช้สนใจ โดยจะแตกต่างกันไปในแต่ละ user เพื่อเพิ่มโอกาสให้ผู้ใช้กลับมาใช้แพลตฟอร์มของเรามากยิ่งขึ้น
- Customer Segmentation ใช้กับธุรกิจที่มีลูกค้าหรือกลุ่มเป้าหมายจำนวนมากวิธีนี้จะช่วยให้เสนอโปรโมชั่นได้เหมาะสมกับแต่ละกลุ่มเป้าหมายมากขึ้น เสนอสินค้าและบริการที่ตรงกับกลุ่มลูกค้าได้ดียิ่งขึ้น
- Up-Selling and Cross-Selling การทำ up-selling เป็นการเสนอสินค้าที่มีราคาสูงขึ้นให้กับลูกค้าเพียงแต่สูงขึ้นที่ว่าอาจหมายถึงคุ้มค่าตรงใจลูกค้ามากยิ่งขึ้นด้วย ส่วน cross-selling เป็นการแนะนำสินค้าที่เกี่ยวข้องเชื่อมโยงกันหรือต้องใช้งานประกอบกัน
- Fraud Detection การตรวจสอบความผิดปกติต่าง ๆ ที่เกิดขึ้นระหว่างการใช้งานหรือสิ่งที่แตกต่างไปจากพฤติกรรมเดิม ๆ ของผู้ใช้บริการ
- Price Optimization สำหรับปรับราคาสินค้าและบริการให้เหมาะสมที่สุดตามความต้องการกับช่วงเวลา
นอกจากนี้ยังมี Use Cases อีกมากมายที่ทำกัน โดยในบทความถัด ๆ ไปจะมาลองวิเคราะห์กัน
ขั้นตอนการนำ Big Data
มาใช้ในธุรกิจ
การที่จะมีข้อมูลมาใช้นั้นย่อมต้องเริ่มจากการเก็บรวบรวมข้อมูลก่อน ประเภทของข้อมูลนั้นมี 2 อย่างหลัก ๆ ที่พูดถึงกันเป็นประจำคือ Structured Data และ Unstructured Data โดยแหล่งที่มาจะแบ่งเป็น Internal Data Source กับ External Data Source ส่วนในแง่ของลักษณะของข้อมูลนั้นจะแบ่งเป็น Demographic Data และ Behavior Data วิธีการที่จะได้มาซึ่งข้อมูลจะมีดังนี้
- ข้อมูลภายในองค์กรที่มีอยู่ต้องนำมาจัดเก็บลง Database เพื่อให้ง่ายต่อการเรียกใช้ ค้นหา หรือนำไปวิเคราะห์เบื้องต้น เช่น ข้อมูลลูกค้า, ข้อมูลสินค้าหรือบริการ, ข้อมูลบริษัท, ข้อมูลของสาขา ฯลฯ เป็นต้น การจัดเก็บข้อมูลเหล่านี้มักทำเป็นตารางที่ประกอบด้วย Column กับ Row และใช้ SQL ในการจัดการ
- การทำแบบสอบถามแบบสำรวจตามหัวข้อเรื่องที่ต้องการศึกษา ด้วยความทันสมัยของโลกยุคใหม่ทำให้แบบฟอร์มเหล่านี้ทำผ่านคอมพิวเตอร์ มือถือ แท็บเล็ตได้ และยังสามารถดาวน์โหลดออกมาเป็นตาราง spread sheet แบบ csv, excel ได้อีกด้วยทำให้ง่ายต่อการบันทึกกับการนำไปใช้มากยิ่งขึ้น
- ข้อมูลจาก Social Media ทั้ง Facebook, Line, Twitter สิ่งที่สามารถเก็บได้คือข้อมูลทั่วไปของผู้ใช้งาน พฤติกรรมการคลิก ไลก์ คอมเม้นท์ รีทวิต ข้อความคุยโต้ตอบ ฯลฯ โดยการเก็บพวกนี้จะทำด้วย Coding ใช้ดัก action ต่าง ๆ และเชื่อมต่อไปยัง application ด้วย API
- ข้อมูลจากหน้าเว็บไซต์ต่าง ๆ อย่างรายชื่อธุรกิจ รายชื่อผู้ประกอบการ อีเมลล์ เบอร์โทร ตามแหล่งข้อมูลสาธารณะ วิธีการเก็บนั้นทำด้วยวิธีการ Web Scrapping ซึ่งดีกว่าการ Copy Paste มากเพราะไม่จำเป็นต้องทำซ้ำ อีกทั้งยังลดข้อผิดพลาดหากต้องทำในปริมาณมาก ๆ ไปจนถึงสามารถจัดเก็บได้ในรูปแบบที่ต้องการอีกด้วย
- การเก็บข้อมูลการใช้งานจาก Application หรือ Platform ของธุรกิจนั้น ๆ หลักการเดียวกับของ Social Media แต่จะได้ข้อมูลเชิงพฤติกรรมมากกว่า
จากที่กล่าวมานี้ถือเป็นช่องทางที่หาข้อมูลได้จำนวนมหาศาลมากและยังสามารถทำเองได้อีกด้วย แต่นอกจากนี้ยังมีการซื้อข้อมูลหรือการลงทุนสำรวจต่าง ๆ อีกเช่นกัน ขั้นต่อมาคือการเก็บและการนำมาใช้
- ข้อมูลที่ได้มาในตอนแรกนั้นอาจเก็บอยู่ในรูปแบบไฟล์ ถ้าข้อมูลไม่เยอะมากนักก็สามารถใช้ได้เลยแต่ถ้าหากเป็นธุรกิจขนาดใหญ่มากขึ้นการเก็บเป็นไฟล์นั้นย่อมมีปัญหาแน่นอน จึงควรนำมาเก็บลง Database ก่อนเป็นอันดับแรก
- การเก็บจะมีทั้ง Relational Database Management System และ Non-Relational Database Management System โดยจะแตกต่างกันที่เป็นรูปแบบ Structured หรือ Unstructured
- SQL ข้อมูลจะเก็บในรูปแบบตารางสามารถเรียกดู อัพเดท แก้ไข รวมข้อมูลได้สะดวกมาก แก้ปัญหาการบันทึกซ้ำซ้อน ข้อมูลตกหล่น ประหยัดพื้นที่จากการสร้างไฟล์เพื่ออัพเดทข้อมูลที่มีอยู่เดิม
- NoSQL จะเก็บข้อมูลที่หลากหลายรูปแบบมาก (ที่มาจากช่องทาง Social Media, Website, Application) รูปแบบการบันทึกมีทั้ง Key-Value Database, Document Database, Column-Oriented Database, Graph Database
- วิธีจัดการกับข้อมูลจำนวนมากนี้จะมีทั้ง Scaling up และ Scaling out โดยใช้ Hadoop, Spark, Hive ต่าง ๆ เข้ามาช่วยโดยหลักการคือทำ Map และ Reduce หรือก็คือการแยกแล้วบันทึกเป็นส่วน ๆ นอกจากนี้ยังทำบน RAM ได้อีกด้วยส่งผลให้เร็วกว่าการนำไปเขียนบนฮาร์ดดิสก์แล้วส่งไปมากว่าแต่ก่อนมาก
- การนำมาใช้นั้นทำได้หลากหลายทั้งเชื่อม Database กับ API เพื่อทำ Web E-commerce, Application, Platform ที่ต้องตัดสต๊อกสินค้าหรือดึงข้อมูลผู้ใช้งานเป็นประจำ ส่วนในการวิเคราะห์ข้อมูลสามารถนำมาแบ่ง train test เพื่อทำโมเดลได้ ไม่ว่าจะเป็นเชิงสถิติศาสตร์ หรือ Data Science ก็ตาม
Conclusion
การนำ Big Data มาใช้กับธุรกิจทำได้ในทุกอุตสาหกรรม โดยการเก็บข้อมูลนั้นหาได้จากทั้งภายใน และภายนอกองค์กรประโยชน์ของมันคือการลดข้อผิดพลาดในการบันทึก ลดความซ้ำซ้อนของการบันทึกข้อมูล แก้ปัญหาเรื่องการบันทึกข้อมูลไม่ตรงกัน อีกทั้งยังสามารถนำไปเพิ่มประสิทธิภาพให้กับ Application, Platform ต่าง ๆ ได้อีกด้วย ท้ายที่สุดเรามี Keyword ตัวอย่างที่เป็นการใช้ข้อมูลทำประโยชน์ให้ไปศึกษากันอีกด้วยได้แก่ Customer Lifetime Value, Next Best Action, Propensity to Buy, Churn Prevention, Risk Management, Demand Forecast, Predictive Maintenance
อ่านบทความอื่นได้ที่ SBC-Blog เเละ Facebook page Subbrain