EP6 — Backup & Disaster Recovery: ระบบที่ทุกคนคิดว่ามี แต่ใช้ไม่ได้เมื่อถึงเวลาจริง

“Backup ที่ไม่เคยทดสอบ
ไม่ต่างอะไรกับการไม่มี Backup”

🔹 บทนำ: ปัญหาที่เกิดขึ้นหลังเหตุการณ์ใหญ่เสมอ

หลังเหตุการณ์

Ransomware
Server พัง
Cloud Service ล่ม
Human Error ลบข้อมูลผิด

คำถามแรกที่มักถูกถามคือ
“มี Backup ไหม?”

แต่คำตอบที่เจอบ่อยคือ

“น่าจะมีนะ”
“เคยตั้งไว้แล้ว”
“Backup อยู่ แต่ restore ไม่ได้”
“ไม่เคยลองกู้จริง”

นี่คือความจริงที่โหดร้ายในหลายองค์กร:
Backup มีอยู่… แต่ใช้ไม่ได้

🔹 ทำไม Backup & DR ถึงเป็นงาน System Security ที่ถูกลืม?

✔ 1) Backup ไม่ได้สร้างผลลัพธ์ให้เห็นทันที

ไม่เหมือนระบบอื่นที่เห็นประโยชน์ชัด
Backup จะมีค่า “ก็ต่อเมื่อเกิดเหตุ”
ทำให้ถูกเลื่อนลำดับความสำคัญเสมอ

✔ 2) ไม่มีใครเป็นเจ้าของจริง

Support คิดว่าเป็นหน้าที่ System
System คิดว่า Vendor ดูแล
Vendor คิดว่าอยู่ใน Scope เดิม
สุดท้าย ไม่มีใครรับผิดชอบจริง

✔ 3) ไม่เคยทดสอบการกู้คืน (Restore Test)

หลายองค์กร backup ทุกวัน
แต่ไม่เคยลอง restore เลยแม้แต่ครั้งเดียว

✔ 4) เข้าใจผิดว่า “อยู่ Cloud แล้วปลอดภัย”

Cloud มี redundancy
แต่ ไม่ได้แปลว่ามี Backup ที่กู้ได้ตาม Business Requirement

Cloud ล่ม = ข้อมูลอาจยังอยู่
แต่ระบบอาจใช้งานไม่ได้เป็นวัน

✔ 5) Backup ไม่ครอบคลุมทุกระบบ

สิ่งที่มักลืม backup:

SaaS (Email, Drive, SharePoint)
Configuration (Firewall, Switch, DNS)
VM Template / Image
Source Code / Script
Log / Audit Data

🔹 ความต่างระหว่าง Backup กับ Disaster Recovery (DR)

Backup	Disaster Recovery
เก็บข้อมูล	ฟื้นระบบทั้งชุด
กู้ไฟล์	กู้บริการ
ใช้เวลานาน	ต้องเร็ว
ไม่สนใจ downtime	ต้องคุม downtime
ทำง่าย	ต้องออกแบบ

Backup อย่างเดียว ≠ DR
แต่ DR ที่ดี ต้องมี Backup เป็นฐาน

🔹 ปัญหาที่พบจริงในองค์กรไทย

❌ Backup อยู่เครื่องเดียวกับ Production

Ransomware เข้าทีเดียว → พังหมด

❌ ไม่มี Off-site / Immutable Backup

ข้อมูลถูกลบพร้อมกันทั้ง Production และ Backup

❌ ไม่รู้ว่า Backup ล่าสุดคือเมื่อไหร่

หรือ backup fail มานานโดยไม่มีใครรู้

❌ Restore ใช้เวลาหลายวัน

กระทบธุรกิจหนักกว่าค่าไถ่ ransomware

❌ ไม่มี DR Plan เป็นลายลักษณ์อักษร

พอเกิดเหตุ ทุกคนตัดสินใจจากความตื่นตระหนก

🔹 องค์ประกอบของ Backup & DR ที่ “ใช้ได้จริง”

1) RPO & RTO ต้องชัด

RPO: ยอมเสียข้อมูลย้อนหลังได้กี่ชั่วโมง
RTO: ยอมให้ระบบหยุดได้กี่ชั่วโมง

ถ้าไม่กำหนด → ไม่มี DR ที่เหมาะสม

2) 3-2-1 Backup Rule

3 ชุดข้อมูล
2 media ต่างกัน
1 ชุดอยู่นอกสถานที่

หรือดีกว่านั้นคือ Immutable Backup

3) Backup ต้องแยกสิทธิ์จาก Production

บัญชีที่ใช้ Backup
ไม่ควร login เข้า Production ได้

4) ทดสอบ Restore อย่างน้อยปีละ 1–2 ครั้ง

ไม่ต้องใหญ่
แค่ restore VM / Database / File สำคัญ

5) DR Plan ต้องเข้าใจง่าย

ควรตอบได้ว่า:

ใครตัดสินใจ
ใครกู้ระบบไหนก่อน
ติดต่อใคร
ลำดับการฟื้นระบบ

DR ที่ดี = คนอ่านแล้วทำตามได้จริง

🔹 แนวทางเริ่มต้น Backup & DR สำหรับ SME

✔ 1) เริ่มจากระบบที่กระทบธุรกิจมากที่สุด

ERP, Email, Database, File Server

✔ 2) แยก Backup ออกจาก Domain / AD

ลดความเสี่ยงถูกยึดพร้อมกัน

✔ 3) ใช้ Cloud + On-prem ร่วมกัน

Hybrid DR ช่วยลดต้นทุนและเพิ่มความยืดหยุ่น

✔ 4) ทำ DR แบบ “เท่าที่จำเป็น”

ไม่ต้อง Perfect
แต่ต้อง “ใช้ได้จริง”

🔹 สรุป EP6

Backup & DR ไม่ใช่งาน IT ทั่วไป
แต่เป็น Business Continuity Control

“องค์กรไม่ได้ล้มเพราะโดนโจมตี
แต่ล้มเพราะฟื้นระบบไม่ได้ทันเวลา”

EP6 จึงเป็นอีกตอนที่สะท้อนว่า
System Security ที่ถูกลืม
มักจะเจ็บที่สุดเมื่อถึงวันที่ต้องใช้จริง