Gian Lận Bảo Hiểm: Từ Siêu Xe Lamborghini Đến Bài Toán Tỷ Đô
Vào tháng 11 2019, một chiếc Lamborghini bị “tai nạn” tại Anh, chủ xe yêu cầu bồi thường thiệt hại rất lớn lên tới 400 nghìn bảng cùng khoản lợi nhuận mất mát từ việc cho thuê siêu xe. Chủ xe cho biết, xe của mình bị tổn hại nghiên trọng với chi phí sửa lên tới 72 nghìn bảng. Đồng thời, đây là mẫu xe công ty đó sẽ cho thuê với mức giá hơn 1600 bảng một ngày. Đó là cơ sở để họ đưa ra con số 400 nghìn bảng. Hồ sơ trông hoàn hảo với đầy đủ hóa đơn sửa chữa, báo giá chi tiết và chứng từ đi kèm. Nhưng khi điều tra viên đào sâu, họ phát hiện một mạng lưới gian lận tinh vi: cùng nhóm người đứng sau hàng loạt vụ “tai nạn” siêu xe tương tự, các hóa đơn sửa chữa chỉ là file Word tự tạo không có chứng từ thật, và mô típ lặp lại như công thức “siêu xe – tai nạn – mất lợi nhuận”. Cuối cùng, tòa án không chỉ bác bỏ yêu cầu bồi thường 1.3 triệu bảng Anh (khi cộng tổng toàn bộ các chi phí được liệt kê) mà còn buộc người khiếu nại phải trả 40,000 bảng chi phí pháp lý.
Câu chuyện của Covea hãng bảo hiểm nước Anh cho thấy để tận dụng bồi thường bảo hiểm, các tay trục lợi có thể liều lĩnh và đi xa tới đâu. Đây không phải là trường hợp đơn lẻ. Trên toàn cầu, gian lận bảo hiểm đang tiêu tốn hơn 80 tỷ USD mỗi năm, với khu vực Châu Á-Thái Bình Dương ghi nhận mức tăng 22% hàng năm. Tại Việt Nam, nơi thị trường bảo hiểm đạt doanh thu 227 nghìn tỷ đồng năm 2024 và dự kiến tăng trưởng 7% mỗi năm đến 2029, việc kiểm soát gian lận không còn là vấn đề tuân thủ đơn thuần mà đã trở thành yếu tố sống còn quyết định khả năng cạnh tranh.
Bản Chất Thực Sự Của Gian Lận: Hard Fraud vs Soft Fraud
Để hiểu rõ vấn đề, chúng ta cần phân biệt hai nhóm gian lận có bản chất hoàn toàn khác biệt. Gian lận cứng (hard fraud) là những hành vi có kế hoạch trước, mục tiêu rõ ràng là “lấy tiền của công ty bảo hiểm”. Vụ Lamborghini ở trên là ví dụ điển hình: một mạng lưới người có tổ chức, dàn dựng các vụ tai nạn giả, tạo chứng từ giả mạo, và thực hiện theo một kịch bản được tính toán kỹ lưỡng. Những hành vi này thường đi kèm với tội phạm hình sự như đốt nhà để lấy bảo hiểm, cố ý gây tai nạn, hoặc làm giả hồ sơ y tế.
Nhưng gian lận mềm (soft fraud) lại là câu chuyện khác, phổ biến hơn nhiều và cũng nguy hiểm không kém. Đây là những hành vi “thấy cơ hội thì tranh thủ” của người được bảo hiểm khi họ phóng đại thiệt hại hoặc khai sai một phần sự thật. Sau một vụ tai nạn xe thật, người được bảo hiểm có thể khai thêm những vết xước cũ không liên quan, hoặc khai danh sách đồ vật bị mất với giá trị cao hơn thực tế. Trong bảo hiểm sức khỏe, một cơn đau lưng nhẹ có thể được mô tả thành “không thể đi làm, đau dữ dội” để được nghỉ dài ngày và nhận bồi thường thu nhập cao hơn.
Theo thống kê ngành, soft fraud chiếm tới 60% tổng số trường hợp gian lận, nhưng tỷ lệ phát hiện bằng phương pháp truyền thống chỉ đạt 20-40%. Đây chính là lý do tại sao công nghệ trí tuệ nhân tạo trở nên then chốt, với khả năng đạt độ chính xác 87-97% trong phát hiện loại gian lận này.
Nâng Mã Dịch Vụ: Khi Nhà Cung Cấp Trở Thành Kẻ Gian Lận
Trong khi gian lận từ phía khách hàng thường được chú ý nhiều hơn, một hình thức gian lận nguy hiểm và tốn kém hơn nhiều lại đến từ chính các nhà cung cấp dịch vụ. Nâng mã dịch vụ (upcoding) xảy ra khi bệnh viện, phòng khám, hoặc garage sửa chữa cố ý sử dụng mã thanh toán cho dịch vụ phức tạp hơn, nặng hơn, hoặc đắt hơn so với dịch vụ thực tế cung cấp.
Case Study: Tenet Healthcare – 900 Triệu USD Từ Upcoding
Tập đoàn Y tế Tenet Healthcare, một trong những hệ thống bệnh viện lớn nhất Mỹ, đã ghi nhận khoản gian lận 900 triệu USD từ việc gán sai mã chẩn đoán để tăng thanh toán từ Medicare và Medicaid. Đây không phải là lỗi của vài cá nhân, mà là một chiến lược “kinh doanh ngầm” được hệ thống hóa trên diện rộng. Các bệnh nhân chỉ có triệu chứng ho và sốt được gán mã J18.9 (viêm phổi) – một chẩn đoán nặng hơn nhiều và được chi trả cao hơn đáng kể. Mức độ nghiêm trọng của ca nhập viện được “nâng cấp” lên “có biến chứng lớn” bằng cách thêm các chẩn đoán như suy hô hấp cấp hay nhiễm trùng huyết, dù người bệnh chỉ ở mức điều trị thường.
Một case study khác cũng rất điển hình là CareAll Management LLC tại Tennessee, đã phải trả 25 triệu USD để dàn xếp cáo buộc upcoding với Medicare và Medicaid. Công ty này chuyên cung cấp dịch vụ chăm sóc sức khỏe tại nhà, và họ đã phóng đại mức độ bệnh của bệnh nhân để được thanh toán ở mức cao hơn, đồng thời billing cho các dịch vụ “không cần thiết về mặt y khoa”. Điều đáng lo ngại là người bệnh và gia đình thường không nhận ra họ đang bị lạm dụng, vì họ tin tưởng vào chuyên môn của bác sĩ và nhà cung cấp dịch vụ.
Upcoding đặc biệt nguy hiểm vì khách hàng ít hiểu về các mã ICD, DRG hay CPT, và do đó hiếm khi phản đối. Gian lận này tạo gánh nặng tài chính lâu dài cho quỹ bảo hiểm và chỉ có thể được phát hiện hiệu quả thông qua phân tích dữ liệu so sánh với chuẩn mực ngành (peer benchmark) và các mô hình AI phân tích hàng loạt.
Yêu Cầu Bồi Thường Trùng Lặp: Từ Nhầm Lẫn Đến Gian Lận Có Hệ Thống
Yêu cầu bồi thường trùng lặp (duplicate claims) tưởng chừng đơn giản nhưng lại là một trong những hình thức gian lận khó phát hiện nhất. Bản chất của nó là cùng một sự kiện tổn thất dẫn đến hai hoặc nhiều yêu cầu bồi thường, nhằm nhận tiền nhiều lần cho cùng một thiệt hại. Điều phức tạp là không phải mọi trường hợp trùng lặp đều là gian lận cố ý – một số có thể do lỗi hệ thống hoặc nhân viên nhập liệu không cẩn thận. Nhưng khi có chủ đích, hành vi này có thể gây thiệt hại khổng lồ.
Case Study: Mạng Lưới Phát Hiện Duplicate Của Luther-AXA-AIA
Jeff và vợ Kelly gặp tai nạn ở Đức trong kỳ nghỉ. Jeff có bảo hiểm du lịch từ công ty A, còn Kelly có bảo hiểm từ công ty B (cả hai công ty đều ở Tây Ban Nha). Khi về nước, mỗi người nộp một claim cho công ty của mình – về cùng một sự kiện tai nạn, cùng chi phí y tế và vận chuyển. Vì hai công ty không chia sẻ dữ liệu, không có hệ thống kiểm tra tương đồng, cả hai đều có thể thanh toán toàn bộ, dẫn đến thanh toán trùng cho cùng một tổn thất.
Luther Technologies cùng AXA và AIA đã xây dựng một giải pháp đột phá: mỗi claim được chuẩn hóa, mã hóa và đưa vào “Resemblance Network” (mạng lưới tương đồng). Hệ thống so sánh claim mới với các claim đã lưu, kể cả từ các công ty khác, ở dạng mã hóa để bảo mật. Nếu có độ tương đồng đủ cao (ví dụ giống 8/10 trường dữ liệu), hệ thống sẽ cảnh báo cho cả hai công ty để review. Dù khách hàng có cố tình chỉnh nhẹ tên, số tiền hay mô tả, họ vẫn bị phát hiện vì độ tương đồng trên nhiều trường như ngày, nơi xảy ra, loại tai nạn và dịch vụ sử dụng.
Các kẻ gian lận thường cố gắng che dấu duplicate bằng cách thay đổi chi tiết nhỏ: lỗi chính tả trong tên, định dạng ngày khác nhau, mã nhà cung cấp được viết khác nhau, hoặc chênh lệch vài ngày giữa các lần gửi. Đây là lý do tại sao các hệ thống truyền thống chỉ tìm kiếm khớp hoàn toàn (exact match) thường bỏ sót 15-20% các trường hợp “gần giống nhau” (near-duplicates). Công nghệ đối sánh mờ (fuzzy matching) được thiết kế đặc biệt để bắt được những biến thể này, trở thành công cụ không thể thiếu trong kho vũ khí chống gian lận hiện đại.
Công Nghệ AI: Từ Lý Thuyết Đến Thực Tiễn
Mỗi loại gian lận đòi hỏi một cách tiếp cận công nghệ khác nhau, và đây là nơi trí tuệ nhân tạo thể hiện sức mạnh thực sự của nó. Đối với hard fraud có tổ chức như vụ Lamborghini, phân tích đồ thị mạng lưới (graph analytics) là vũ khí mạnh nhất. Thay vì nhìn vào từng yêu cầu riêng lẻ, công nghệ này xây dựng bản đồ các mối quan hệ giữa người được bảo hiểm, nhà cung cấp dịch vụ, luật sư và các bên liên quan. Khi phát hiện các cụm người và tổ chức có liên hệ chặt chẽ bất thường – ví dụ cùng một garage xuất hiện trong hàng chục vụ tai nạn của những người không quen biết, hoặc cùng một “nhân chứng” xuất hiện trong nhiều vụ việc khác nhau – hệ thống sẽ cảnh báo về khả năng tồn tại mạng lưới gian lận.
Soft fraud lại cần một bộ công cụ hoàn toàn khác. Xử lý ngôn ngữ tự nhiên (NLP) mang lại khả năng đột phá trong phân tích các mô tả văn bản tự do trong hồ sơ bồi thường. Công nghệ này có thể tự động trích xuất thông tin quan trọng như tên, ngày tháng, địa điểm từ hàng nghìn trang tài liệu, phát hiện những mâu thuẫn trong lời khai, và nhận diện ngôn ngữ không nhất quán hoặc đáng ngờ. Kết hợp với phân tích hành vi (behavioral analytics), hệ thống có thể so sánh mô tả của khách hàng với lịch sử hành vi và chuẩn mực thị trường để phát hiện những điểm bất thường.
Đối với upcoding, học máy có giám sát (supervised learning) với các thuật toán như XGBoost và Random Forest đã chứng minh hiệu quả vượt trội. Những mô hình này được đào tạo trên hàng triệu yêu cầu bồi thường lịch sử, học cách nhận diện các mẫu hình phức tạp mà con người khó có thể phát hiện. Hệ thống có thể phân tích pattern theo từng nhà cung cấp, so sánh tỷ lệ sử dụng các dịch vụ, mức chi trả bình quân, tỷ lệ ca nặng với các nhà cung cấp tương tự, và xem đường dẫn điều trị (care pathways) có hợp lý không. Ví dụ, nếu cùng một chẩn đoán nhưng nhà cung cấp X luôn cho thêm ba dịch vụ đắt tiền mà các nhà cung cấp khác hiếm khi sử dụng, đây là dấu hiệu cảnh báo mạnh mẽ.
Kết Quả Thực Tế: Con Số Không Nói Dối
FWD, một trong những công ty bảo hiểm hàng đầu châu Á, đã triển khai khung “Bảo hiểm Thông minh” từ năm 2021 và đạt được những kết quả ấn tượng. Độ chính xác phát hiện các yêu cầu rủi ro thấp đạt 97.2%, cho phép xử lý tự động số lượng lớn yêu cầu hợp lệ. Quan trọng hơn, khả năng phát hiện gian lận tăng vọt từ dưới 1% lên 52%, đồng thời phát hiện thêm 7 mẫu gian lận mới hoàn toàn. Anadolu Sigorta tại Thổ Nhĩ Kỳ đạt tỷ suất sinh lời đầu tư 210% chỉ trong năm đầu tiên, tiết kiệm 5.7 triệu USD chi phí gian lận.
Các con số từ nền tảng FRISS của Hà Lan còn ấn tượng hơn: tổng tiết kiệm 21 triệu USD trong hai năm, hiệu suất của mỗi điều tra viên tăng từ tiết kiệm 550,000 USD/năm lên 2 triệu USD/năm, và tỷ suất sinh lời lên tới 10 lần đầu tư ban đầu. Thời gian xử lý claims giảm 66%, trong khi tỷ lệ xử lý thẳng (straight-through processing) tăng 80%.
Lộ Trình Cho Công Ty Bảo Hiểm Việt Nam
Với bối cảnh Luật Bảo hiểm Y tế sửa đổi có hiệu lực từ tháng 7/2025 khuyến khích sử dụng công nghệ để giảm gian lận, đây là thời điểm vàng để các công ty bảo hiểm Việt Nam bắt đầu hành trình chuyển đổi số. Trong giai đoạn ngắn hạn từ sáu đến mười hai tháng, các công ty nên bắt đầu với những “điểm đột phá nhanh”. Phát hiện yêu cầu bồi thường trùng lặp là khởi đầu lý tưởng vì dễ triển khai, có tỷ suất sinh lời nhanh, và có thể tiết kiệm ngay 5-10% chi phí bồi thường. Đồng thời, đầu tư vào nền tảng dữ liệu chất lượng cao là điều kiện tiên quyết, vì không có dữ liệu tốt thì mô hình AI tốt nhất cũng không thể hoạt động hiệu quả.
Giai đoạn trung hạn từ một đến hai năm là lúc mở rộng sang nhiều loại hình gian lận. Triển khai phát hiện nâng mã dịch vụ cho bảo hiểm sức khỏe, phát hiện soft fraud cho bảo hiểm xe cộ và tài sản, và sử dụng phân tích đồ thị mạng lưới để phát hiện các băng nhóm gian lận có tổ chức. Đặc biệt chú trọng vào khả năng giải thích được của mô hình thông qua các công cụ như SHAP để xây dựng niềm tin và đáp ứng yêu cầu tuân thủ.
Nhưng quan trọng nhất là hiểu rằng AI không phải để thay thế điều tra viên, mà để khuếch đại năng lực của họ. Khi AI sắp xếp 10,000 yêu cầu và chỉ ra 500 yêu cầu đáng ngờ nhất, điều tra viên có thể tập trung 100% năng lượng vào những trường hợp thực sự quan trọng thay vì lãng phí thời gian với những trường hợp rủi ro thấp. Đây là lý do tại sao mô hình “con người kết hợp AI” luôn cho kết quả tốt hơn nhiều so với việc chỉ dùng riêng AI hoặc riêng con người.
Kết Luận: Cuộc Chơi Đã Thay Đổi
Từ chiếc Lamborghini giả mạo đến vụ Tenet Healthcare 900 triệu USD, từ những yêu cầu trùng lặp tinh vi đến các mạng lưới gian lận có tổ chức, bài toán gian lận bảo hiểm ngày càng phức tạp và tinh vi hơn. Nhưng công nghệ trí tuệ nhân tạo đã thay đổi cục diện của cuộc chơi này. Với khả năng phân tích hàng triệu giao dịch trong thời gian thực, phát hiện các mẫu hình phức tạp mà con người không thể nhìn thấy, và học hỏi liên tục từ mỗi trường hợp mới, AI đã trở thành vũ khí mạnh nhất trong kho vũ khí chống gian lận.
Điều quan trọng không phải là liệu các công ty bảo hiểm Việt Nam có nên áp dụng AI hay không, mà là khi nào và bắt đầu như thế nào. Với thị trường dự kiến tăng trưởng 7% hàng năm đến 2029 và khung pháp lý mới khuyến khích đổi mới công nghệ, những công ty đầu tư sớm vào trí tuệ nhân tạo phát hiện gian lận sẽ có lợi thế cạnh tranh vượt trội. Họ không chỉ bảo vệ lợi nhuận của mình mà còn xây dựng niềm tin với khách hàng thông qua xử lý nhanh hơn, chính xác hơn và công bằng hơn.
Thời điểm để hành động là bây giờ. Cuộc chơi đã thay đổi, và những người thắng cuộc sẽ là những người thích nghi nhanh nhất.
Tài Liệu Tham Khảo
- National Health Care Anti-Fraud Association (NHCAA): “The Challenge of Health Care Fraud” – https://www.nhcaa.org/tools-insights/about-health-care-fraud/the-challenge-of-health-care-fraud/
- ScienceDirect: “Fraud detection in health insurance” (2024) – https://www.sciencedirect.com/science/article/pii/S0933365724003038
- USI Insurance Services: “Insurance Fraud: How Policyholders Pay the Price” (Q2 2025) – https://www.usi.com/executive-insights/executive-series-articles/featured/personal-risk/q2-2025/insurance-fraud-how-policyholders-pay-the-price/
- Iowa Insurance Division: “Consumer Connection – What is Insurance Fraud” (January 2025) – https://iid.iowa.gov/consumer-connection/2025-01-03/consumer-connection-what-insurance-fraud
- Clyde & Co: “Untangling a Super-Sized Insurance Fraud” (Lamborghini Case Study) – https://www.clydeco.com/en/expertise/sectors/insurance-reinsurance/case-study/untangling-a-super-sized-insurance-fraud
- Nebraska Department of Insurance: “Insurance Fraud Examples” – https://doi.nebraska.gov/sites/default/files/doc/examples.pdf
- Ontario Nurses’ Association: “Hard Fraud vs Soft Fraud and How You Can Prevent Being a Victim” – https://www.ona.ca/blog/hard-fraud-vs-soft-fraud-and-how-you-can-prevent-being-a-victim/
- PubMed Central (PMC): “Upcoding in Healthcare – Tenet Healthcare Case Study” – https://pmc.ncbi.nlm.nih.gov/articles/PMC8649706/
- Phillips & Cohen LLP: “Upcoding, Unbundling, and Fragmentation – Healthcare Fraud” – https://www.phillipsandcohen.com/upcoding-unbundling-fragmentation/
- Luther Systems: “Detection of Duplicate Claims – Case Study with AXA and AIA” (November 2021) – https://www.luthersystems.com/media/45id3mda/luther-case-study_-detection-of-duplicate-claims-nov-2021-1.pdf
- Atlantis Press: “Fraud Detection in National Health Insurance System – Indonesia Study” – https://www.atlantis-press.com/article/125924395.pdf
- C2S Technologies: “Healthcare Fraud Detection Using AI” – https://c2stechs.com/healthcare-fraud-detection/
- Health Affairs: “Healthcare Fraud and AI Detection Methods” (2024) – https://www.healthaffairs.org/doi/10.1377/hlthaff.2024.00596
- Capelleveen Research: “Outlier Detection in Healthcare Fraud – Medicaid Dental Domain Case Study” (2016) – https://capelleveen.org/wp-content/uploads/2021/11/Capelleveen2016-Outlier-detection-in-healthcare-fraud-a-case-study-in-the-medicaid-dental-domain-pre-print.pdf
- SSRN Electronic Journal: “Machine Learning Approaches to Insurance Fraud Detection” (2024) – https://papers.ssrn.com/sol3/Delivery.cfm/5590610.pdf?abstractid=5590610&mirid=1
Ông Hùng Nguyễn – Trưởng phòng Phát triển Sản phẩm – Khối Chăm sóc Sức khỏe FPT IS
Chuyên gia có hơn 10 năm kinh nghiệm trong lĩnh vực phát triển phần mềm và chuyển đổi số, với thế mạnh trong việc thiết kế kiến trúc hệ thống, xây dựng sản phẩm số và dẫn dắt đội ngũ kỹ thuật triển khai các dự án quy mô lớn. Định hướng phát triển công nghệ gắn liền với chiến lược kinh doanh, giúp doanh nghiệp tối ưu vận hành và tạo ra lợi thế cạnh tranh bền vững.
