lang-vi

Mọi người đang điều hướng bảo mật AI theo thời gian thực — thậm chí cả Google

COO của Google Cloud vừa thừa nhận điều mà mọi nhà phát triển đã biết: chúng ta đều đang tìm hiểu bảo mật AI khi đang làm việc. Nếu Google vẫn đang giải quyết các hàm ý bảo mật của các kiến trúc AI-native, thì áp lực đối với các nhóm nhỏ hơn để có mọi thứ được giải quyết là vô…

Mọi người đang điều hướng bảo mật AI theo thời gian thực — thậm chí cả Google

COO của Google Cloud vừa thừa nhận điều mà mọi nhà phát triển đã biết: chúng ta đều đang tìm hiểu bảo mật AI khi đang làm việc. Francis de Souza, phát biểu phía sau sân khấu tại một sự kiện công nghệ ở Los Angeles, mô tả thời điểm hiện tại là một "giai đoạn chuyển tiếp" — một cách ngoại giao để nói rằng ngay cả những công ty siêu quy mô cũng đang học hỏi khi đang hoạt động. Đối với các nhà phát triển xây dựng với công cụ phát triển AI mà châu Á sử dụng, đây không phải là lý thuyết trừu tượng. Đó là hiện thực mỗi khi bạn kết nối một LLM với dữ liệu sản xuất hoặc triển khai một agent có thể truy vấn các hệ thống nội bộ.

Sự thừa nhận này quan trọng vì nó định hình lại cuộc trò chuyện. Nếu Google vẫn đang giải quyết các hàm ý bảo mật của các kiến trúc AI-native, thì áp lực đối với các nhóm nhỏ hơn để có mọi thứ được giải quyết là vô lý. Thay vào đó, chúng ta cần các nền tảng và thực hành xem xét bảo mật như một mối quan tâm hạng nhất từ ngày đầu tiên — không phải là thứ được gắn thêm sau khi bản demo ấn tượng các nhà đầu tư.

Công cụ phát triển AI là gì?

Công cụ phát triển AI là các nền tảng và framework cho phép các nhà phát triển xây dựng, triển khai và duy trì các ứng dụng được cung cấp bởi các mô hình ngôn ngữ lớn và các hệ thống AI khác. Không giống như các công cụ phát triển truyền thống tập trung vào biên dịch mã và các đường ống triển khai, các công cụ AI-native xử lý các hiện thực phức tạp của việc làm việc với các hệ thống xác suất: quản lý prompt, phiên bản mô hình, tối ưu hóa cửa sổ ngữ cảnh và điều phối các quy trình agent đa bước.

Danh mục này đã phát triển vì mô hình phát triển cũ không ánh xạ rõ ràng lên AI. Bạn không thể kiểm tra đơn vị một phản hồi GPT-4 theo cách bạn kiểm tra một hàm sắp xếp. Bạn không thể kiểm soát phiên bản hành vi của mô hình chỉ bằng git. Và bạn chắc chắn không thể bảo mật một ứng dụng AI bằng cách suy nghĩ dựa trên chu vi giống như cách làm việc cho các ứng dụng web vào năm 2010. De Souza nhấn mạnh sự thay đổi này khi lưu ý rằng bề mặt tấn công hiện bao gồm "các mô hình, các đường ống dữ liệu được sử dụng để huấn luyện các mô hình, các agent, các prompt" — các yếu tố không tồn tại trong hầu hết các mô hình mối đe dọa của công ty hai năm trước.

Các công cụ nền tảng phát triển AI-native tốt nhất nhận ra các nguyên thủy mới này. Chúng cung cấp các trừu tượng để quản lý trạng thái hội thoại, các công cụ để giám sát sử dụng token và độ trễ, và các hàng rào bảo vệ ngăn chặn các mô hình khỏi rò rỉ dữ liệu nhạy cảm hoặc thực hiện các hành động không được phép. Đối với các nhà phát triển châu Á cụ thể, các công cụ này cần xử lý các ngữ cảnh đa ngôn ngữ, hoạt động trong các khung tuân thủ khu vực và tích hợp với các hệ sinh thái SaaS phổ biến ở Đông Nam Á và Đông Á — không chỉ là ngăn xếp Silicon Valley.

Thực tế bảo mật mà Google vừa xác nhận

Thông điệp cốt lõi của De Souza là thẳng thắn: "Bảo mật không phải là thứ bạn có thể gắn thêm sau này." Anh ấy cụ thể cảnh báo về "shadow AI" — các nhân viên tạo các tài khoản ChatGPT hoặc Claude để giải quyết các vấn đề công việc mà không có sự biết của IT. Đây không phải là giả thuyết. Theo cuộc phỏng vấn TechCrunch, thời gian trung bình giữa một vi phạm ban đầu và giai đoạn tấn công tiếp theo đã giảm từ tám giờ xuống còn 22 giây. Sự nén này không để lại chỗ cho các đánh giá bảo mật chậm hoặc các quy trình phê duyệt thủ công.

Điều làm cho bảo mật AI khó hơn là các mối đe dọa có tính chất khác biệt. Bảo mật truyền thống tập trung vào việc ngăn chặn truy cập trái phép vào các hệ thống. Bảo mật AI phải ngăn chặn truy cập trái phép thông qua các hệ thống — các agent có thể truy vấn cơ sở dữ liệu, các mô hình có thể bị jailbreak để tiết lộ dữ liệu huấn luyện, các prompt có thể bị thao túng để bỏ qua logic kinh doanh. De Souza đã chỉ ra một rủi ro không được đánh giá đủ: các agent AI di chuyển qua các hệ thống nội bộ có thể bề mặt "các kho dữ liệu bị quên mà không ai biết tồn tại." Đó không phải là một lỗ hổng bạn có thể vá. Đó là một vấn đề kiến trúc.

Đối với các nhà phát triển làm việc trên các dự án nền tảng AI, điều này có nghĩa là suy nghĩ lại toàn bộ ngăn xếp. Bạn cần khả năng quan sát những gì các mô hình của bạn đang làm, không chỉ những gì mã của bạn đang làm. Bạn cần nhật ký kiểm toán cho mọi prompt và phản hồi. Bạn cần các điều khiển truy cập hiểu được sự khác biệt giữa một con người truy vấn cơ sở dữ liệu và một agent làm điều tương tự thay mặt cho một người dùng. Tư thế bảo mật đa đám mây của Google — mà de Souza nhấn mạnh là cần thiết vì "ngay cả khi các công ty chọn một đám mây duy nhất, họ cũng dựa vào các ứng dụng SaaS" — phản ánh sự phức tạp này. Ranh giới bảo mật của bạn hiện nay là bất cứ nơi nào dữ liệu của bạn chảy, điều này trong một ứng dụng AI là ở khắp mọi nơi.

Công cụ hàng đầu cho các nhà phát triển châu Á

Hệ sinh thái nhà phát triển châu Á có những nhu cầu riêng biệt. Độ trễ quan trọng hơn khi người dùng của bạn được phân tán trên Jakarta, Manila và Thành phố Hồ Chí Minh. Các yêu cầu tuân thủ khác nhau theo quốc gia — các quy tắc cư trú dữ liệu của Singapore không giống như của Việt Nam. Và cấu trúc chi phí của các công cụ AI phương Tây có thể cấm kỵ khi bạn xây dựng cho các thị trường nơi kiếm tiền xảy ra ở mức giá thấp hơn.

Các công cụ hoạt động tốt nhất ở châu Á chia sẻ một vài đặc điểm. Thứ nhất, chúng cung cấp các điểm cuối suy luận khu vực hoặc hợp tác với các nhà cung cấp đám mây địa phương để giảm độ trễ. Thứ hai, chúng cung cấp định giá minh bạch không giả định tài trợ VC không giới hạn. Thứ ba, chúng tích hợp với các công cụ cộng tác mà các nhóm châu Á thực sự sử dụng — Slack phổ biến, nhưng WeChat Work và LINE cũng vậy. Thứ tư, chúng hỗ trợ phát triển đa ngôn ngữ mà không coi tiếng Anh là mặc định và mọi thứ khác là suy nghĩ thứ yếu.

Vibe coding — thực hành mô tả những gì bạn muốn bằng ngôn ngữ tự nhiên và để AI tạo ra việc triển khai — hoạt động đặc biệt tốt cho các nhóm nơi tiếng Anh không phải là ngôn ngữ đầu tiên của mọi người. Khi giao diện là hội thoại thay vì nặng về cú pháp, rào cản để vào giảm. Nhưng điều này chỉ hoạt động nếu nền tảng hiểu ngữ cảnh vượt ra ngoài prompt hiện tại. Bạn cần các công cụ duy trì trạng thái trong suốt một phiên phát triển, ghi nhớ các quyết định kiến trúc và có thể tham chiếu cơ sở mã hiện có của bạn khi tạo mã mới.

Các cân nhắc bảo mật cũng áp dụng ở đây. Nếu bạn đang sử dụng một công cụ AI để tạo mã, bạn cần biết rằng nó không được huấn luyện trên logic độc quyền của bạn và nôn ra nó cho các đối thủ cạnh tranh. Bạn cần các bảo đảm về cư trú dữ liệu nếu bạn đang xử lý thông tin người dùng tuân theo các quy định địa phương. Và bạn cần khả năng kiểm toán những gì AI đề xuất so với những gì thực sự được triển khai — vì khi có thứ gì đó bị hỏng trong sản xuất, "AI bảo tôi làm điều đó" không phải là phân tích nguyên nhân gốc.

Cách chọn công cụ phù hợp

Chọn một công cụ phát triển AI không giống như chọn một trình soạn thảo văn bản. Những cược cao hơn vì công cụ trở thành một phần của hành vi thời gian chạy của ứng dụng của bạn, không chỉ là quy trình làm việc phát triển của bạn. Lời khuyên của De Souza về suy nghĩ nền tảng áp dụng ở đây: "Không có thứ gọi là chiến lược AI mà không có chiến lược dữ liệu và chiến lược bảo mật. Chúng cần phải đi cùng nhau."

Bắt đầu bằng cách ánh xạ luồng dữ liệu của bạn. Dữ liệu nhạy cảm sống ở đâu? Những hệ thống nào cần nói chuyện với nhau? Những yêu cầu tuân thủ nào áp dụng cho ngành và địa lý của bạn? Một công cụ AI hoạt động tuyệt vời cho một công ty SaaS của Mỹ có thể không sử dụng được cho một công ty fintech Singapore vì nó không thể đảm bảo dữ liệu ở lại trong các khu vực APAC. Đừng đánh giá các công cụ trong cách ly — đánh giá chúng như một phần của toàn bộ ngăn xếp của bạn.

Tiếp theo, kiểm tra khóa. Bạn có thể xuất các prompt, mô hình được tinh chỉnh và lịch sử hội thoại của mình nếu bạn cần chuyển đổi nền tảng không? Bạn đang xây dựng trên các tiêu chuẩn mở hay các trừu tượng độc quyền? Cảnh quan AI đang chuyển động đủ nhanh để công cụ bạn chọn hôm nay có thể lỗi thời trong 18 tháng. Bạn cần một chiến lược thoát khỏi không liên quan đến việc viết lại toàn bộ ứng dụng của bạn.

Tìm kiếm các nền tảng cung cấp khả năng quan sát từ đầu. Bạn sẽ có thể xem sử dụng token, độ trễ