EP6 — Backup & Disaster Recovery: ระบบที่ทุกคนคิดว่ามี แต่ใช้ไม่ได้เมื่อถึงเวลาจริง
“Backup ที่ไม่เคยทดสอบ
ไม่ต่างอะไรกับการไม่มี Backup”
🔹 บทนำ: ปัญหาที่เกิดขึ้นหลังเหตุการณ์ใหญ่เสมอ
หลังเหตุการณ์
-
Ransomware
-
Server พัง
-
Cloud Service ล่ม
-
Human Error ลบข้อมูลผิด
คำถามแรกที่มักถูกถามคือ
“มี Backup ไหม?”
แต่คำตอบที่เจอบ่อยคือ
-
“น่าจะมีนะ”
-
“เคยตั้งไว้แล้ว”
-
“Backup อยู่ แต่ restore ไม่ได้”
-
“ไม่เคยลองกู้จริง”
นี่คือความจริงที่โหดร้ายในหลายองค์กร:
Backup มีอยู่… แต่ใช้ไม่ได้
🔹 ทำไม Backup & DR ถึงเป็นงาน System Security ที่ถูกลืม?
✔ 1) Backup ไม่ได้สร้างผลลัพธ์ให้เห็นทันที
ไม่เหมือนระบบอื่นที่เห็นประโยชน์ชัด
Backup จะมีค่า “ก็ต่อเมื่อเกิดเหตุ”
ทำให้ถูกเลื่อนลำดับความสำคัญเสมอ
✔ 2) ไม่มีใครเป็นเจ้าของจริง
Support คิดว่าเป็นหน้าที่ System
System คิดว่า Vendor ดูแล
Vendor คิดว่าอยู่ใน Scope เดิม
สุดท้าย ไม่มีใครรับผิดชอบจริง
✔ 3) ไม่เคยทดสอบการกู้คืน (Restore Test)
หลายองค์กร backup ทุกวัน
แต่ไม่เคยลอง restore เลยแม้แต่ครั้งเดียว
✔ 4) เข้าใจผิดว่า “อยู่ Cloud แล้วปลอดภัย”
Cloud มี redundancy
แต่ ไม่ได้แปลว่ามี Backup ที่กู้ได้ตาม Business Requirement
Cloud ล่ม = ข้อมูลอาจยังอยู่
แต่ระบบอาจใช้งานไม่ได้เป็นวัน
✔ 5) Backup ไม่ครอบคลุมทุกระบบ
สิ่งที่มักลืม backup:
-
SaaS (Email, Drive, SharePoint)
-
Configuration (Firewall, Switch, DNS)
-
VM Template / Image
-
Source Code / Script
-
Log / Audit Data
🔹 ความต่างระหว่าง Backup กับ Disaster Recovery (DR)
| Backup | Disaster Recovery |
|---|---|
| เก็บข้อมูล | ฟื้นระบบทั้งชุด |
| กู้ไฟล์ | กู้บริการ |
| ใช้เวลานาน | ต้องเร็ว |
| ไม่สนใจ downtime | ต้องคุม downtime |
| ทำง่าย | ต้องออกแบบ |
Backup อย่างเดียว ≠ DR
แต่ DR ที่ดี ต้องมี Backup เป็นฐาน
🔹 ปัญหาที่พบจริงในองค์กรไทย
❌ Backup อยู่เครื่องเดียวกับ Production
Ransomware เข้าทีเดียว → พังหมด
❌ ไม่มี Off-site / Immutable Backup
ข้อมูลถูกลบพร้อมกันทั้ง Production และ Backup
❌ ไม่รู้ว่า Backup ล่าสุดคือเมื่อไหร่
หรือ backup fail มานานโดยไม่มีใครรู้
❌ Restore ใช้เวลาหลายวัน
กระทบธุรกิจหนักกว่าค่าไถ่ ransomware
❌ ไม่มี DR Plan เป็นลายลักษณ์อักษร
พอเกิดเหตุ ทุกคนตัดสินใจจากความตื่นตระหนก
🔹 องค์ประกอบของ Backup & DR ที่ “ใช้ได้จริง”
1) RPO & RTO ต้องชัด
-
RPO: ยอมเสียข้อมูลย้อนหลังได้กี่ชั่วโมง
-
RTO: ยอมให้ระบบหยุดได้กี่ชั่วโมง
ถ้าไม่กำหนด → ไม่มี DR ที่เหมาะสม
2) 3-2-1 Backup Rule
-
3 ชุดข้อมูล
-
2 media ต่างกัน
-
1 ชุดอยู่นอกสถานที่
หรือดีกว่านั้นคือ Immutable Backup
3) Backup ต้องแยกสิทธิ์จาก Production
บัญชีที่ใช้ Backup
ไม่ควร login เข้า Production ได้
4) ทดสอบ Restore อย่างน้อยปีละ 1–2 ครั้ง
ไม่ต้องใหญ่
แค่ restore VM / Database / File สำคัญ
5) DR Plan ต้องเข้าใจง่าย
ควรตอบได้ว่า:
-
ใครตัดสินใจ
-
ใครกู้ระบบไหนก่อน
-
ติดต่อใคร
-
ลำดับการฟื้นระบบ
DR ที่ดี = คนอ่านแล้วทำตามได้จริง
🔹 แนวทางเริ่มต้น Backup & DR สำหรับ SME
✔ 1) เริ่มจากระบบที่กระทบธุรกิจมากที่สุด
ERP, Email, Database, File Server
✔ 2) แยก Backup ออกจาก Domain / AD
ลดความเสี่ยงถูกยึดพร้อมกัน
✔ 3) ใช้ Cloud + On-prem ร่วมกัน
Hybrid DR ช่วยลดต้นทุนและเพิ่มความยืดหยุ่น
✔ 4) ทำ DR แบบ “เท่าที่จำเป็น”
ไม่ต้อง Perfect
แต่ต้อง “ใช้ได้จริง”
🔹 สรุป EP6
Backup & DR ไม่ใช่งาน IT ทั่วไป
แต่เป็น Business Continuity Control
“องค์กรไม่ได้ล้มเพราะโดนโจมตี
แต่ล้มเพราะฟื้นระบบไม่ได้ทันเวลา”
EP6 จึงเป็นอีกตอนที่สะท้อนว่า
System Security ที่ถูกลืม
มักจะเจ็บที่สุดเมื่อถึงวันที่ต้องใช้จริง


