Giải bài toán Quá tải hệ thống lõi và Tối ưu vận hành bằng AIOps
Trong cuộc đua chuyển đổi số, nếu dữ liệu được ví như “nguồn điện thứ hai”, thì hệ thống lõi (Core ERP) chính là trái tim của mọi hoạt động vận hành. Tuy nhiên, nghịch lý hiện nay là khi doanh nghiệp càng nỗ lực “AI hóa”, trái tim này lại càng dễ bị tổn thương và quá tải. Bài viết này sẽ phân tích lộ trình gỡ bỏ các nút thắt hạ tầng bằng công nghệ đồng bộ dữ liệu thời gian thực (CDC) và trí tuệ nhân tạo cho vận hành CNTT (AIOps).
Bài viết trích từ bài trình bày tại sự kiện
Hội thảo: AI-Powered Enterprise: From Data to Intelligent Operations
1. “Nút thắt cổ chai” tại hệ thống lõi: Khi dữ liệu bị khóa
Thách thức lớn nhất mà các doanh nghiệp lớn (đặc biệt là trong ngành Tài chính, Sản xuất, Bán lẻ) đang gặp phải là tình trạng hệ thống Core ERP bị quá tải do phải gánh vác cùng lúc hai nhiệm vụ xung đột: vận hành sản xuất và phục vụ nhu cầu truy xuất dữ liệu của hàng chục ứng dụng vệ tinh.
Thực tế cho thấy, việc dùng chung database chính cho hơn 50 ứng dụng nghiệp vụ khác nhau dẫn đến tình trạng “lock” dữ liệu khi cập nhật. Các công cụ trích xuất dữ liệu (ETL) truyền thống như SSIS thường có tốc độ đồng bộ chậm, hay bị treo và yêu cầu reset hệ thống thường xuyên. Điều này không chỉ làm chậm tiến độ báo cáo mà còn gây rủi ro dừng hoạt động sản xuất, ảnh hưởng trực tiếp đến doanh thu và uy tín doanh nghiệp.
2. Giải pháp tách tải và đồng bộ thời gian thực (CDC)
Để giải quyết triệt để vấn đề này, chiến lược hiện đại là xây dựng một kho dữ liệu hoạt động (ODS) tách biệt, được nuôi dưỡng bởi công nghệ Change Data Capture (CDC).
Cơ chế vận hành mức “Log-file”
Khác với ETL truyền thống quét toàn bộ database (gây tốn tài nguyên), giải pháp IBM Data Replication CDC thực hiện đồng bộ dữ liệu ở mức log-file. Công nghệ này chỉ nhận diện các thay đổi dữ liệu (thêm, sửa, xóa) ngay khi chúng phát sinh và đẩy sang hệ thống đích gần như tức thời (Near real-time).
Tác động cực thấp: Do chỉ đọc log, hệ thống Core ERP hầu như không cảm nhận được gánh nặng từ việc đồng bộ.
Tính linh hoạt cao: Hỗ trợ đa dạng nguồn/đích từ Oracle, SQL Server đến DB2 và cả môi trường Big Data.
Khi kết hợp với IBM DataStage, dữ liệu không chỉ được đồng bộ mà còn được làm sạch, chuẩn hóa và sẵn sàng cho các mô hình AI hoặc báo cáo phân tích chuyên sâu mà không cần can thiệp vào database sản xuất. Kết quả ghi nhận từ các dự án thực tế là khả năng đáp ứng nhu cầu truy xuất cho hơn 50 ứng dụng cùng lúc với hiệu năng vượt trội.
3. AIOps & FinOps: Dùng AI quản trị chính hệ thống CNTT
Khi hạ tầng ngày càng phức tạp với hàng ngàn máy ảo (VM) và container, con người không còn khả năng giám sát thủ công. Đây là lúc AIOps (AI cho Vận hành CNTT) trở thành “cứu cánh” để tối ưu hóa hiệu suất và chi phí.
Quan sát toàn diện (Observability) với Instana
IBM Instana cung cấp khả năng quan sát với độ phân giải 1 giây, tự động vẽ bản đồ Topology của toàn bộ hệ thống. Khi một dịch vụ gặp lỗi, AI sẽ thực hiện phân tích “Blast Radius” (Bán kính ảnh hưởng) để xác định chính xác các dịch vụ liên quan bị tác động dây chuyền, giúp đội ngũ kỹ thuật ưu tiên xử lý đúng trọng tâm.
Tối ưu nguồn lực và chi phí với Turbonomic
Trong kỷ nguyên đám mây, lãng phí tài nguyên là bài toán đau đầu. IBM Turbonomic ứng dụng AI để tự động điều chỉnh kích thước (resizing) tài nguyên RAM/CPU cho ứng dụng dựa trên tải thực tế theo từng khung giờ.
Giảm 30% chi phí: Tự động hóa việc phân bổ tài nguyên giúp doanh nghiệp cắt giảm đáng kể chi phí hạ tầng và đám mây.
Giảm 70% vé hỗ trợ: Khả năng tự phục hồi (Self-healing) thông qua các Runbook tự động giúp giảm thiểu số lượng sự cố cần con người can thiệp.
4. Hạ tầng lưu trữ thông minh: Lớp phòng thủ cuối cùng
Hạ tầng lưu trữ năm 2026 không chỉ đơn thuần là nơi chứa dữ liệu mà đã trở thành các “Tác nhân AI” (Agent-driven Storage).
Tương tác như ChatGPT
Với các dòng IBM FlashSystem mới, người quản trị có thể ra lệnh bằng ngôn ngữ tự nhiên để AI tự động cấu hình vùng lưu trữ hoặc thiết lập chính sách phòng chống thảm họa chỉ trong vài phút.
Phát hiện Ransomware trong 60 giây
Nhờ chip AI tích hợp trong module FCM5, hệ thống có khả năng phân tích mọi thao tác dữ liệu để nhận diện các mẫu hành vi tấn công mã hóa. Khi phát hiện đe dọa, hệ thống sẽ báo động trong dưới 60 giây và kích hoạt công nghệ Safeguarded Copy để tạo ra các bản sao dữ liệu bất biến (immutable). Điều này cho phép doanh nghiệp phục hồi toàn bộ hệ thống lõi chỉ trong 10-15 phút sau khi bị tấn công, thay vì mất nhiều ngày như trước đây.
5. Lộ trình thực thi cùng FPT IS và IBM
Hành trình hiện đại hóa hạ tầng cần sự phối hợp giữa công nghệ hàng đầu và am hiểu thực tiễn địa phương.
- Đánh giá (Map): Khảo sát hiện trạng hệ thống lõi và các điểm nghẽn dữ liệu
- Tách tải (Govern & Exploit): Triển khai CDC để đồng bộ dữ liệu sang ODS mới, giải phóng sức mạnh cho Core ERP.
- Tự động hóa (Manage): Nhúng Instana và Turbonomic để thiết lập trung tâm điều khiển tập trung Cloud Pak for AIOps.
- Bảo vệ: Nâng cấp lên FlashSystem để đảm bảo năng lực phục hồi số (Resilience).
Kết luận:
Để bước vào kỷ nguyên Agentic AI, doanh nghiệp không thể tiếp tục vận hành trên một “trái tim” lỗi thời. Việc tách tải dữ liệu thời gian thực và ứng dụng AIOps không chỉ là nâng cấp kỹ thuật, mà là chiến lược sống còn để tối ưu hóa chi phí, đảm bảo tính liên tục và kiến tạo lợi thế cạnh tranh bền vững cho doanh nghiệp số tại Việt Nam.
Bài viết độc quyền bởi Ông Nguyễn Hữu Thịnh – Chuyên gia Tư vấn Giải pháp FPT IS, Tập đoàn FPT

