FPT đạt thành tích xuất sắc trong nghiên cứu ứng dụng AI xử lý ngôn ngữ tiếng Việt tại VLSP 2025
Ngày 29 – 30/10, các chuyên gia FPT đã tham gia Hội thảo Quốc tế về Xử lý Ngôn ngữ và Tiếng nói tiếng Việt (Vietnamese Language and Speech Processing – VLSP 2025) và đạt thành tích xuất sắc với hai công trình nghiên cứu ứng dụng AI được vinh danh.
Đây là sự kiện học thuật thường niên uy tín nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và trí tuệ nhân tạo tiếng Việt, do Hiệp hội Xử lý Ngôn ngữ và Tiếng nói Việt Nam (VLSP) phối hợp cùng Viện Công nghệ Thông tin – Viện Hàn lâm Khoa học và Công nghệ Việt Nam và các trường đại học lớn tổ chức. Hội thảo quy tụ đông đảo các viện nghiên cứu, trường đại học và doanh nghiệp công nghệ trong và ngoài nước, hướng tới mục tiêu thúc đẩy phát triển các mô hình AI phục vụ cộng đồng người Việt và xây dựng hệ sinh thái tri thức ngôn ngữ Việt toàn diện.
FPT giành hai giải thưởng cao trong cuộc thi thuộc khuôn khổ sự kiện VLSP 2025
Cụ thể, FPT IS – đơn vị thành viên Tập đoàn FPT đã giành hai giải thưởng cao trong cuộc thi thuộc khuôn khổ sự kiện VLSP 2025. Đội ngũ chuyên gia của FPT đạt giải Nhất ở một hạng mục trong cuộc thi Hỏi đáp luật lệ giao thông qua biển báo (LegalQA Challenge) và giải Nhì cuộc thi Tìm kiếm văn bản pháp luật (Deep Retrieval in Legal Documents – DRiLL Challenge). Kết quả này không chỉ cho thấy năng lực chuyên môn sâu của đội ngũ chuyên gia FPT trong lĩnh vực xử lý ngôn ngữ tự nhiên tiếng Việt, mà còn khẳng định vị thế tiên phong của doanh nghiệp Việt trong các sân chơi công nghệ mang tầm quốc tế.
Hai kết quả trên của các kỹ sư FPT được trình bày theo hình thức poster tại khu vực triển lãm học thuật của hội thảo. Đây là hai công trình khoa học đồng thời cũng là nội dung giúp đội ngũ FPT đạt thành tích cao tại các cuộc thi nói trên, thể hiện định hướng nghiên cứu ứng dụng gắn liền với các bài toán thực tế trong quá trình chuyển đổi số của đất nước.
Công trình đầu tiên mang tên “Data Augmentation and Hierarchical Chunking for Deep Retrieval in the Expansive Legal Landscape” (Tăng cường dữ liệu và phân tách phân cấp cho truy xuất thông tin trong kho văn bản pháp luật quy mô lớn) tập trung giải quyết thách thức trong việc tìm kiếm, truy xuất và hiểu nội dung pháp lý từ kho dữ liệu khổng lồ có cấu trúc phức tạp. Nhóm nghiên cứu của FPT đã đề xuất phương pháp kết hợp giữa tăng cường dữ liệu huấn luyện và phân tách phân cấp theo ngữ nghĩa, giúp hệ thống hiểu rõ mối quan hệ giữa các điều khoản, chương mục và văn bản liên quan. Kết quả cho thấy mô hình của FPT đạt hiệu suất truy xuất cao hơn rõ rệt so với các phương pháp truyền thống, đồng thời rút ngắn đáng kể thời gian tìm kiếm. Giải pháp này mở ra tiềm năng ứng dụng lớn trong việc xây dựng các hệ thống trợ lý pháp lý số, công cụ tìm kiếm văn bản hành chính hay nền tảng hỗ trợ ra quyết định trong lĩnh vực tư pháp và quản lý nhà nước – những lĩnh vực đòi hỏi khả năng hiểu ngữ nghĩa và liên kết văn bản phức tạp.
Công trình thứ hai có tên “A Low-Cost Low-Energy Approach to VQA on Traffic Signs Problems” (Giải pháp hỏi – đáp thị giác tiết kiệm năng lượng cho bài toán biển báo giao thông) tập trung nghiên cứu mô hình Visual Question Answering (VQA) – hệ thống kết hợp giữa xử lý ngôn ngữ và thị giác máy tính – nhằm giúp máy tính có thể hiểu và trả lời các câu hỏi liên quan đến hình ảnh biển báo giao thông. Điểm nổi bật của mô hình do FPT phát triển nằm ở khả năng tối ưu năng lượng và chi phí tính toán cùng kiến trúc cho phép xử lý tập trung trên server và truy cập từ thiết bị biên thông qua API. Cách tiếp cận này mang lại ý nghĩa thực tiễn quan trọng trong bối cảnh đô thị thông minh đang phát triển mạnh, đồng thời mở ra khả năng mở rộng ứng dụng sang các lĩnh vực khác như giáo dục, logistics hay an toàn giao thông, nơi đòi hỏi khả năng xử lý hình ảnh và ngôn ngữ tự nhiên trong điều kiện hạn chế tài nguyên.
Theo ông Phạm Quang Nhật Minh – Giám đốc trung tâm nghiên cứu và phát triển trí tuệ nhân tạo, FPT IS, Tập đoàn FPT, việc tham gia VLSP 2025 là cơ hội để đội ngũ chuyên gia AI của FPT cọ xát, cập nhật xu hướng công nghệ mới và giao lưu với cộng đồng nghiên cứu học thuật trong nước. Quan trọng hơn, đây là dịp để FPT thể hiện cam kết đầu tư lâu dài vào công nghệ lõi, đặc biệt là các mô hình xử lý ngôn ngữ tự nhiên và tiếng nói tiếng Việt phục vụ đời sống, quản lý và phát triển kinh tế – xã hội. “Chúng tôi luôn tin rằng, AI chỉ thật sự có giá trị khi được thiết kế và huấn luyện dựa trên dữ liệu và ngữ cảnh bản địa. Những nghiên cứu tại VLSP 2025 là bước tiến nữa trong hành trình của FPT hướng đến mục tiêu phát triển các sản phẩm AI thuần Việt, phục vụ tốt nhất cho người Việt,” ông nhấn mạnh.
Trong bối cảnh trí tuệ nhân tạo toàn cầu đang bước vào kỷ nguyên của các mô hình ngôn ngữ lớn (LLM), việc phát triển các mô hình hiểu sâu tiếng Việt trở nên đặc biệt quan trọng. Với định hướng không ngừng làm dày hệ sinh thái Made by FPT, Tập đoàn FPT đã và đang tiếp tục đầu tư mạnh mẽ vào lĩnh vực nghiên cứu AI tiếng Việt, xây dựng đội ngũ kỹ sư và nhà khoa học dữ liệu quy mô lớn, đồng thời mở rộng hợp tác quốc tế để đưa công nghệ Việt vươn ra thế giới.
Hội thảo VLSP 2025 do Hội Tin học Việt Nam phối hợp cùng các viện nghiên cứu và trường đại học tổ chức, dưới sự bảo trợ của Bộ Khoa học và Công nghệ, tập trung vào các chủ đề như mô hình ngôn ngữ lớn, tìm kiếm ngữ nghĩa, tổng hợp tiếng nói, hỏi – đáp tự động và ứng dụng AI trong các lĩnh vực pháp luật, giao thông và hành chính. Việc FPT ghi dấu ấn tại sự kiện không chỉ khẳng định năng lực nghiên cứu của doanh nghiệp Việt, mà còn thể hiện vai trò của FPT trong việc góp phần phát triển cộng đồng công nghệ, thúc đẩy chuyển đổi số quốc gia và hướng tới một tương lai nơi AI thực sự phục vụ con người – phục vụ Việt Nam.
