9 Steps of Practical Data Analytics

Thanachart Ritbumroong
3 min readMar 12, 2021

ช่วงหลังสิ่งที่สอนแล้วคนรู้สึกชอบเรียน ก็คือ การสอนให้วิเคราะห์โจทย์ธุรกิจ สอนให้เปลี่ยนคำถามธุรกิจหรือปัญหาเป็น analytics tasks แล้วก็ link ผลที่เจอจากการวิเคราะห์ข้อมูลกลับมาเป็น business actions ให้ได้จริงๆ

เมื่อ newbie ด้าน analytics ถามว่า เราต้องเริ่มวิเคราะห์ข้อมูลอย่างไร

คำตอบที่จะเจอซ้ำๆ ก็คือ เริ่มจากการตั้งคำถาม เราต้องตั้งคำถามให้ดี แล้วคำถามที่ดี หน้าตาเป็นอย่างไร

คำตอบก็จะเป็นแนวว่า

ก็ต้องเป็นคำถามเชิงลึก เชิงวิเคราะห์

อันนี้คือ ประสบการณ์ส่วนตัวเลย เวลาไปตอบคำถาม

ซึ่ง คนฟังก็คงแบบ อิหยังวะ ก็พยายามไปนั่งรวบรวมสติอยู่นานว่า จริงๆ แล้ว

Thought Process หรือ กระบวนการความคิดของเราทำงานแบบไหนเวลาวิเคราะห์ข้อมูล ก็พบว่า มันเป็น Collection ของ Multiple Analytics Task มากๆ

ขอมาสรุปให้อ่านกันเพลินๆ ครับ

1. Begin with the end in mind

ส่วนมาก ผมก็จะเริ่มการวิเคราะห์จากจุดประสงค์หลักของการทำธุรกิจก่อนเลยครับ (แล้วดันไปบอกชาวบ้านให้เริ่มจากตั้งคำถาม ฮ่าๆๆ)

การจะ align analytics กับ business ได้ เราก็ต้องเข้าใจธุรกิจก่อนว่าเค้าต้องการอะไรใช่ไหมครับ ซึ่งแต่ละ function งานั้น ก็จะมีจุดสนใจที่ไม่เหมือนกัน

ใครสนใจอยากให้ย้อนไปอ่านแนวคิดการบริหารพวกนี้ครับ

- Management by Objective

ก็จะเป็นแนวคิดการบริหารที่มุ่งเน้นเป้าประสงค์ขององค์กรเป็นหลัก

อย่าง Finance ก็จะมีคติมุ่งมั่นอย่างแรงกล้าว่า วัตถุประสงค์หลักขององค์กร คือ Maximize Shareholder Value ซึ่งก็คือการสร้างผลกำไรให้กับผู้ถือหุ้น (หลังๆ ก็มี debate เยอะนะครับ ว่ามันไม่ใช่แค่การสร้างกำไรอย่างเดียว มันต้องมองมิติอื่นด้วย)

ถ้าไปถามคน Supply Chain เค้าก็จะสนใจเรื่อง Efficiency หรือ Cost Optimization

ถาม Sales ก็สนใจ ยอดขาย จำนวนลูกค้า ฯลฯ

ก่อนจะไปเริ่มทำ analytics ให้ใครก็ควรจะรู้ก่อนว่า เค้ามีความต้องการอะไรครับ แต่ละธุรกิจ แต่ละช่วง business stage ก็จะมีความต้องการไม่เหมือนกัน

- Management by Exception

อีกแนวคิดหนึ่ง ก็จะมองว่า เราไม่สามารถมีสติกับการจัดการทุกสิ่งอย่างในโลกได้ เราจะให้ความสนใจอย่างมากกับปัญหาที่เกิดขึ้น หรือ สิ่งที่ผิดปกติไปจากความเป็นจริง

ต่อให้เป็นแนวคิดเก่าแก่ แต่ถ้าลองวิเคราะห์ดูก็จะพบว่า ผู้บริหารส่วนมาก ก็มีวิธีการบริหารองค์กรในรูปแบบนี้กันเยอะ คือ ถ้าไม่มีปัญหา ก็จัดการกันไป มีปัญหา ก็รีบเอามาคุย

อันนี้ก็เป็น arena ให้กับ analytics ได้ลงไปสร้าง value ให้กับธุรกิจ โดยการช่วยตั้งแต่ว่า เอาข้อมูลมาดูเพื่อบอกให้ได้ว่า ปัญหาที่ทุกคนรับรู้ว่ามี ตกลงมีจริงไหม เกิดจากสาเหตุที่ทุกคนคาดเดาไว้จริงไหม ปัญหามีความรุนแรงเท่าไหร่ เกิดบ่อยขนาดไหน เกิดเป็นประจำไหม เกิดที่ไหน เกิดทั่วทั้งบริษัทเลยหรือเปล่า หรือเกิดเฉพาะจุด

ตลอดไปจนถึงวิเคราะห์เพื่อหาทางแก้ไขปัญหา ก็สามารถทำได้ว่า อะไรที่ทำให้อดีตไปแล้ว อันไหนทำแล้วแก้ปัญหาได้ อันไหนทำแล้วแก้ได้แค่ระยะสั้น อันไหนแก้ไม่ได้เลย

2. Operationalization

ในโลกของธุรกิจหรือการจัดการ ก็จะมี Concept หรือ แนวคิดเยอะแยะไปหมด ตั้งแต่ Customer Loyalty ไปจนถึง Process Efficiency ซึ่งสิ่งเหล่านี้เป็นแนวคิดกว้างๆ กว้างมากกกกก เวลาเราลงมือทำ analytics เราจะต้องเจาะลงไปถึงว่า สิ่งเหล่านี้จะวัดผลเป็นตัวเลขอย่างไร

ที่เราเรียกว่า Churn หรือ การที่ลูกค้าหยุดซื้อ/หยุดใช้ เราจะวัดแบบไหน บางทีเราก็ต้อง Challenge Assumption ปัจจุบันว่า ทำไมถึงเป็น 3 เดือนที่ลูกค้าหยุดซื้อ แล้วค่อยนับว่า Churn ล่ะ ทำไมไม่ 4–6 เดือน ทำไมไม่ 2 เดือน ก็ต้องเอาข้อมูลมาดูว่า เมื่อลูกค้าหยุดซื้อแล้ว เค้าก็จะมีโอกาสกลับมาซื้อ แต่ถ้าหยุดไปนิ่งๆ ถึงกี่เดือน โอกาสที่จะกลับมาจะน้อยมากๆ เมื่อทำ Cohort Analysis ก็จะรู้ว่า จะเอาเดือนไหนเป็น cut-off ดีที่สุด

3. Action-oriented analytics

อีกสิ่งหนึ่งที่เวลาวิเคราะห์แล้ว ถ้าจะ align กับ business ได้ เราก็ต้องมี Empathy กับคนฝั่ง business ด้วย ด้วยแบบมากๆๆๆ

เราต้องเข้าใจก่อนว่า บางทีพอเราไปวิเคราะห์ข้อมูล มันก็เหมือนไปขุดคุ้ยหาความผิดของเค้า หรือ ไปเจอว่าสิ่งที่เธอทำนั้นยังไม่เพียงพอนะ เธอต้องทำเพิ่มนู่นนั่นนี่

นี่แบบ ไปทำ analytics เพื่อสร้างงานให้ชาวบ้านเค้ามากมาย

จากผลการทำ analytics เราก็ควรต้องรับรู้รับทราบข้อจำกัดของคนที่จะเอาผลไกใช้ด้วย

เช่น

เค้าอยากรู้ว่า ลดราคาเท่าไหร่ ถึงกำไรที่สุด แทนที่จะไปบอกว่า 4.73% ก็อาจจะต้องเป็น 3–5% ดีกว่าไหม เค้าจะได้มีความยืดหยุ่นในการเอาไปใช้ได้

หรือ พอทำ Customer Segmentation ผลออกมาได้ 9 กลุ่ม และด้วยความขยัน ก็แตกกลุ่มย่อยลงไปอีก สรุปว่า ได้ลูกค้าออกมา เกือบ 30 กลุ่ม แล้วไปบอก ทีม Marketing ว่า พี่ต้องมี Personalized Campaign ทั้งหมด 30 แบบนะ เธอจ๋าาา ใครจะไปทำไหว ทุกวันนี้ Campaign เดี่ยวๆ ก็ทำไม่ทันแล้ว ระบบที่บริษัทก็ไม่พร้อม เราก็ต้องเข้าใจว่า เค้าทำไหวแค่ไหน การที่บริษัทยังไม่ลงทุนระบบ ก็เพราะยังไม่รู้ว่าจะเกิด return จริงไหม หน้าที่เราก็ต้องเข้าไปช่วย support แล้ว prove ให้ได้ว่า เห็นมั้ย personalize ด้วยระบบอัตโนมือ แค่ 2–3 campaign ยังได้กำไรเพิ่มเท่านี้แหละ ลงทุกมั้ยล่ะ

4. Bird’s eye view analysis

จุดเริ่มต้นของการวิเคราะห์ ก็ควรที่จะเห็นภาพรวมกว้างๆ ของข้อมูลก่อน

เริ่มอย่างง่ายที่สุด คือ ข้อมูลที่เราได้มา มีกี่ record นะ ป็นข้อมูลตั้งแต่วันไหน ถึงวันไหน มีตัดอะไรออกไปไหม ค่าเฉลี่ย ผลรวม คือเท่าไหร่

เหมือนให้เราเห็นก่อนว่า สงครามที่เราจะไปรบนี่ มีจำนวนศัตรูเท่าไหร่ กองทัพเค้าใหญ่หรือเล็ก เก่งหรือไม่เก่งอย่างไร

5. Data distribution

หลังจากเห็นภาพใหญ่แล้ว เราก็ควรต้องเริ่มดูว่าข้อมูลที่เรามี ในแต่ละตัวแปรนั้น มีการกระจุกตัว หรือ กระจายตัวอย่างไร

คือ ผมก็ชอบตั้งคำถามกับพฤติกรรมลูกค้าตลอดเวลาว่า

พฤติกรรมแบบนี้ กระจุกตัวกันอยู่แถวๆ ค่าเฉลี่ยหรือเปล่า ก็คือ ทุกคนทำพฤติกรรมเหมือนกันหมด ก็จะเออ แปลกดี งั้นทำแบบนี้ไปแหละ ไม่ต้องไปเจาะอะไรต่อก็ได้มั้ง

แต่ถ้าพฤติกรรมกระจายมาก ก็จะตั้งคำถามต่อว่า อะไรเป็นปัจจัยที่ทำให้แต่ละคนมีพฤติกรรมที่ไม่เหมือนกัน

6. Anomaly detection

ก่อนจะกระโดดลงไปวิเคราะห์อะไรซับซ้อน เราก็ควรที่จะดูก่อนว่า มีข้อมูลอะไรประหลาดล้ำอยู่หรือไม่ ตั้งแต่อายุสูงลิ่ว พฤติกรรมที่มีความถี่สูงผิดปกติ จำนวนที่มีมากหรือน้อยผิดปกติ ยอดซื้อมากหรือน้อยผิดปกติ

แต่ละคนก็จะมีเทคนิคในการหาความผิดปกติแบบหลากหลาย ตามความถนัดของตัวเองไปครับ

7. Divide-and-conquer

อันนี้เป็นความชอบส่วนตัวเลยครับ เวลาวิเคราะห์ข้อมูลโดยส่วนมาก ผมชอบที่จะแบ่งกลุ่มข้อมูลออกเป็นส่วนๆ ก่อน เช่น เวลาวิเคราะห์พฤติกรรมลูกค้า ก็ชอบที่จะเอาลูกค้ามาแบ่งกลุ่มก่อน เพื่อที่จะเจาะลงไปวิเคราะห์ในกลุ่มย่อยๆ

การวิเคราะห์หา insight จากภาพใหญ่นั้น เอาจริงๆ คือ จะสะท้อนภาพแบบกว้างๆ พฤติกรรม mass ที่ทุกคนรู้อยู่แล้ว เราอยากเห็นอะไรที่ซุกซ่อนอยู่ แบบที่เรานึกไม่ถึง แต่คนที่ทำพฤติกรรมแบบนี้ ก็ต้องมีจำนวนมากระดับหนึ่งด้วยนะ การแบ่งกลุ่มลูกค้าออกก่อนที่จะวิเคราะห์ ก็จะช่วยให้การวิเคราะห์ง่ายขึ้นมาก (สำหรับตัวผมนะ)

8. Hypothesis generation and testing

ส่วนที่สนุกและก็ไม่สนุกเวลาวิเคราะห์ก็คือ การเจาะหา insight นี่แหละครับ กระบวนการค่อนข้าง unstructured มาก

วิธีการที่ผมชอบทำ ก็คือ เอาข้อมูลที่แบ่งกลุ่มเสร็จแล้ว มาเจาะดูทีละกลุ่ม แล้วหยิบสุ่มขึ้นมา เพื่อดูพฤติกรรมแบบละเอียดๆ

เช่น กลุ่มนี้ชอบมาซื้อของวันธรรมดานะ ส่วนมากตอนสายๆ บ่ายๆ

ผมก็จะเริ่มตั้งคำถามไปเรื่อยว่า แล้วคนกลุ่มนี้ เค้าชอบซื้ออะไร ราคาประมาณเท่าไหร่ เค้าไม่ซื้อวันหยุดเลยเหรอ หรือ เค้าทำซ้ำแบบนี้ บ่อยขนาดไหน

ส่วนนี้ ก็เหมือนการทำ hypothesis generation อ่ะครับ

แล้วเราก็เอาข้อมูลมา validate เพื่อเป็นการทำ hypothesis testing อีกทีหนึ่ง

ให้นึกถึงเวลาที่เราเมาท์คนอื่นอ่ะ แบบ

เรา: เมริงงงงงง คนนี้มันชอบกินชาบูทุกอาทิตย์เลยว่ะ (hypothesis generation)

เพื่อน: รู้ได้ไงอ่ะ (fact validation)

เรา: นี่ไง //ส่งรูปที่แค่จาก facebook// ไปกินได้ไงวะทุกอาทิตย์ ไม่กลัวอ้วนเหรอ (hypothesis testing)

9. Reality check

ส่วนสุดท้ายก่อนที่จะสรุปผลหรือแปรผล

เราก็ควรจะเอาสิ่งที่เราเจอจากการวิเคราะห์เอามานั่งคุยกัน หรือไปถามจากคนทั่วไปเพื่อให้เกิดความเข้าใจมากขึ้น เพราะต้องบอกว่า แต่ละคนก็จะมี world view ที่จำกัด อย่างผม ชอบเล่นเกมฟรี ไม่เคยเติมเงิน เราก็จะไม่รู้ว่า คนที่เติมเงินเพื่อเล่นเกม เค้าจัดสรรการใช้จ่ายอย่างไร

ผมก็มักจะเอาผลที่เจอจากการวิเคราะห์ไปเปิดบทสนทนา เพื่อหา insight เพิ่มเติม เหมือนเป็นการทำ reality check อ่ะครับ

ขอยกตัวอย่างต่อเนื่องจากการเมาท์เพื่อนเมื่อกี้

พอเราเห็นแล้วว่า คนนี้ ชอบโพสต์รูปกินชาบูเยอะ ด้วยความอยากเผือก เราก็อาจจะแอบไปทำ reality check บน โพสต์เค้าต่อ

เรา: โหย น่ากินจังเลย กินขนาดนี้ ไม่อ้วนขึ้นเลยอ่ะ ดีจัง (reality check)

เหยื่อ: ไม่เลย นี่น้ำหนักขึ้นหลายกิโลแล้วอ่ะ (reality confirmed)

เรา: กินบ่อยขนาดนี้ เป็น member เลยป่าว (reality check)

เหยื่อ: ใช่เลย สมัครไว้ตั้งนานแล้ว (insight generated)

--

--

Thanachart Ritbumroong

Lecturer at Management of Analytics and Data Science Program, National Institute of Development Administration, Thailand and Data Analytics Consultant