Thế giới AI đang trở nên 'vòng lặp'

Tại hội nghị @Scale của Meta, Boris Cherny — người sáng tạo ra Claude Code — lập luận rằng các vòng lặp AI đại diện cho sự thay đổi kiến trúc lớn tiếp theo. Đối với các nhà phát triển châu Á, sự thay đổi này mang theo những hàm ý cụ thể đáng được phân tích.

Share
Editorial illustration: A Möbius strip or twisted loop photographed in stark black and white, catching light along its singl — MonstarX

Thế giới AI đang trở nên 'vòng lặp'

Tại hội nghị @Scale của Meta vào thứ Sáu tuần trước, một người trong khán phòng đã hỏi Boris Cherny — người sáng tạo ra Claude Code — liệu các vòng lặp AI có phải là chu kỳ hype tiếp theo hay là điều gì đó thực sự. Câu trả lời của anh ấy rất nhanh: thực sự, và quan trọng như sự chuyển đổi từ mã được viết bằng tay sang AI tác nhân. Cuộc trao đổi đó đặt tên cho điều mà các nhà phát triển trên toàn thế giới đã im lặng thử nghiệm, và nó định hình lại cách chúng ta nên suy nghĩ về những gì các hệ thống AI thực sự có khả năng làm. Thế giới AI đang trở nên 'vòng lặp', và đối với các nhà phát triển xây dựng ở châu Á, sự thay đổi này mang theo những hàm ý cụ thể đáng được phân tích.

Điều Gì Đã Xảy Ra

Boris Cherny, Trưởng phòng Claude Code tại Anthropic, xuất hiện tại hội nghị @Scale của Meta và lập luận rằng "vòng lặp" đại diện cho sự thay đổi kiến trúc lớn tiếp theo trong cách các hệ thống AI hoạt động. Quá trình anh ấy mô tả đáng được trích dẫn trực tiếp: "Hai năm trước, chúng ta viết mã nguồn bằng tay. Chúng ta bắt đầu chuyển đổi để các tác nhân viết mã. Và bây giờ chúng ta đang chuyển đổi đến điểm mà các tác nhân nhắc nhở các tác nhân khác sau đó viết mã." Anh ấy lập luận rằng bước nhảy từ AI tác nhân sang AI vòng lặp cũng quan trọng như bước nhảy từ mã hóa thủ công sang các tác nhân.

Một vòng lặp thực sự trông như thế nào trong thực tế? Cherny mô tả thiết lập của riêng anh ấy trong bài nói: một tác nhân liên tục quét để tìm cách cải thiện kiến trúc mã, một tác nhân khác tìm kiếm các trừu tượng trùng lặp có thể được thống nhất. Cả hai đều gửi các yêu cầu kéo giống như bất kỳ người đóng góp nào. Vì cơ sở mã luôn thay đổi, không có tác nhân nào dừng lại. Không có đích đến — chỉ là cải thiện liên tục, nền tảng.

Đây không phải là lãnh địa hoàn toàn mới. Các vòng lặp đệ quy đã là một yếu tố cơ bản của khoa học máy tính từ đầu — các hàm gọi chính nó cho đến khi một điều kiện được đáp ứng. Điều khác biệt ở đây là điều kiện dừng không phải là xác định. Một tác nhân phụ quyết định khi nào vòng lặp đã hoàn thành đủ, không phải một quy tắc được mã hóa cứng. Tính không xác định đó là những gì làm cho điều này cảm thấy thực sự mới.

Một triển khai phổ biến đã lưu hành trong các cộng đồng nhà phát triển là Ralph Loop — được đặt tên, một cách tuyệt vời, theo Ralph Wiggum — hoạt động bằng cách tóm tắt mọi thứ mô hình đã đạt được cho đến nay và hỏi liệu mục tiêu đã được đáp ứng. Đó là một cách đơn giản nhưng hiệu quả để ngăn các mô hình AI trôi dạt khi chúng chạy trong thời gian dài, về cơ bản là bật mô hình giữa hành động và tự đánh giá cho đến khi nhiệm vụ hoàn thành.

Cũng có một kết nối với sự thúc đẩy rộng hơn cho nhiều tính toán thời gian kiểm tra — ý tưởng rằng các mô hình có thể tạo ra kết quả tốt hơn bằng cách dành nhiều thời gian suy luận thay vì chỉ mở rộng quy mô các tham số. Các vòng lặp phù hợp gọn gàng vào khung đó: thay vì một lần suy luận lớn, bạn nhận được tinh chỉnh lặp lại liên tục theo thời gian.

Tại Sao Điều Này Quan Trọng Đối Với Châu Á

Hệ sinh thái nhà phát triển của châu Á luôn chuyển động nhanh trong việc áp dụng, nhưng các điều kiện cấu trúc ở đây làm cho mô hình vòng lặp đặc biệt phù hợp. Tài năng kỹ thuật ở Đông Nam Á, Ấn Độ và Đông Á đang phát triển nhanh chóng, nhưng giờ làm việc của kỹ sư cao cấp vẫn đắt tiền và hiếm so với quy mô phần mềm cần được xây dựng. Một tác nhân nền tảng liên tục tái cấu trúc cơ sở mã của bạn, bắt các trừu tượng trùng lặp và gửi các yêu cầu kéo mà không được yêu cầu — đó không phải là bộ nhân năng suất, đó là một sự thay đổi cấu trúc trong những gì một nhóm nhỏ có thể duy trì.

Hãy xem xét một startup năm người ở Jakarta hoặc Thành phố Hồ Chí Minh vận chuyển một sản phẩm fintech. Họ đang xử lý một cơ sở mã phát triển nhanh hơn nhóm của họ có thể xem xét. Nợ kỹ thuật tích lũy không phải vì bất cứ ai bất cẩn, mà vì đơn giản là không có đủ giờ. Một tác nhân tái cấu trúc liên tục chạy ở nền tảng — loại mà Cherny mô tả — giải quyết chính xác ràng buộc đó. Nó không thay thế các kỹ sư; nó xử lý loại công việc mà các kỹ sư luôn hoãn lại.

Cũng có một khía cạnh ngôn ngữ quan trọng đặc biệt đối với châu Á. Phần lớn các công cụ và tài liệu trong hệ sinh thái tác nhân AI là tiếng Anh trước tiên. Các vòng lặp, theo bản chất của chúng, trừu tượng hơn — chúng hoạt động ở cấp độ mã, nơi các rào cản ngôn ngữ quan trọng hơn. Một tác nhân cải thiện kiến trúc TypeScript hoặc Python của bạn không cần phải hiểu Bahasa Indonesia hoặc Tiếng Mandarin để làm công việc của nó. Điều đó làm cho các tác nhân vòng lặp dễ tiếp cận hơn đối với các nhóm phát triển châu Á so với nhiều khả năng AI khác phụ thuộc vào sự hiểu biết ngôn ngữ tự nhiên tinh tế.

Cảnh công nghệ châu Á cũng nhanh hơn hầu hết trong việc thử nghiệm các kiến trúc đa tác nhân, đặc biệt là trong tự động hóa doanh nghiệp. Các công ty xây dựng trên các nền tảng như MonstarX đã suy nghĩ theo các tác nhân phối hợp với nhau, không chỉ là suy luận mô hình đơn. Khái niệm vòng lặp phù hợp tự nhiên vào mô hình tinh thần đó — đó là một bước nhảy khái niệm ít hơn đối với các nhóm đã làm việc với các quy trình tác nhân.

Rủi ro, tất nhiên, là các vòng lặp chạy mà không có đủ giám sát có thể tăng gấp đôi lỗi cũng dễ dàng như chúng tăng gấp đôi cải tiến. Một tác nhân sai về những gì cấu thành một trừu tượng tốt sẽ tiếp tục sai, quy mô, mãi mãi. Thách thức quản trị đó là thực tế, và đó là một điều các nhóm châu Á sẽ cần suy nghĩ một cách cố ý khi họ áp dụng các mô hình này.

Điều Này Có Nghĩa Gì Đối Với Các Nhà Phát Triển

Nếu bạn đang xây dựng với AI ngày hôm nay, các vòng lặp thay đổi mô hình tinh thần của bạn về những gì hệ thống đang làm. Bạn không còn gửi một lời nhắc và chờ đợi một phản hồi. Bạn đang cấu hình một quy trình liên tục — một quy trình có mục tiêu, đưa ra quyết định và tạo ra kết quả trên cơ sở liên tục. Điều đó gần giống với việc thuê một nhà thầu hơn là chạy một truy vấn.

Thực tế, đây là những gì điều đó có nghĩa là cách bạn xây dựng:

  • Phạm vi các tác nhân của bạn chặt chẽ. Các tác nhân của Cherny mỗi cái có một ủy quyền hẹp, được xác định rõ ràng — một cái tìm kiếm cải tiến kiến trúc, một cái khác cho các trừu tượng trùng lặp. Họ không làm mọi thứ. Phạm vi càng chặt chẽ, vòng lặp càng ít có khả năng trôi dạt vào lãnh địa nơi nó gây hại.
  • Xây dựng đánh giá vào vòng lặp. Ralph Loop hoạt động vì nó buộc mô hình kiểm tra tiến trình của chính nó. Bất kỳ vòng lặp nào bạn chạy đều phải có một bước đánh giá được tích hợp — cho dù đó là một tác nhân phụ, một bộ kiểm tra hay một cổng xem xét của con người cho các yêu cầu kéo trên một ngưỡng độ phức tạp nhất định.
  • Coi đầu ra vòng lặp như các yêu cầu kéo của người đóng góp. Các tác nhân của Cherny gửi các yêu cầu kéo. Đó là trừu tượng đúng. Đừng tự động hợp nhất. Xem xét đầu ra vòng lặp theo cách bạn sẽ xem xét công việc của một nhà phát triển trẻ — với sự chú ý đến việc liệu thay đổi có chính xác hay không, không chỉ là liệu nó có biên dịch hay không.
  • Bắt đầu với các vòng lặp chỉ đọc. Trước khi bạn cho phép một tác nhân viết và gửi, hãy chạy nó ở chế độ quan sát. Hãy để nó gắn cờ những gì nó sẽ thay đổi mà không thực sự thay đổi bất cứ điều gì. Điều đó cho bạn một ý tưởng về việc liệu phán đoán của nó có đáng tin cậy hay không trước khi bạn trao quyền truy cập ghi.
  • Giám sát sự trôi dạt theo thời gian. Một vòng lặp chạy trong vài ngày hoặc vài tuần có thể tích lũy những lỗi nhỏ tăng gấp đôi. Thiết lập ghi nhật ký cho phép bạn kiểm toán những gì một vòng lặp đã làm, không chỉ những gì nó đang làm hiện tại.

Công cụ cho điều này vẫn đang trưởng thành. Hầu hết các nhà phát triển ngày hôm nay đang khâu các vòng lặp theo cách thủ công — sử dụng các khung điều phối, các tập lệnh đánh giá tùy chỉnh và rất nhiều kỹ thuật nhắc nhở. Nhưng các nguyên thủy đang trở nên rõ ràng hơn, và các nền tảng hỗ trợ thực thi tác nhân liên tục với quản lý trạng thái thích hợp sẽ trở nên có giá trị đáng kể hơn khi mô hình này lan rộng.

Đối với các nhóm sử dụng MonstarX, việc xây dựng các vòng lặp trở nên đơn giản hơn vì nền tảng đã hỗ trợ các quy trình tác nhân liên tục với quản lý trạng thái tích hợp. Bạn có thể xác định các tác nhân với phạm vi rõ ràng, kết nối chúng với các hệ thống bên ngoài thông qua các kết nối, và để chúng chạy. Điều đó là nơi công nghệ bắt kịp với khái niệm.