ComfyUI đạt định giá $500 triệu khi các nhà sáng tạo tìm kiếm quyền kiểm soát tốt hơn đối với nội dung do AI tạo ra

ComfyUI vừa hoàn thành vòng Series B $30 triệu với định giá $500 triệu, chứng minh rằng các nhà phát triển và nhà sáng tạo không muốn AI hộp đen — họ muốn kiểm soát chính xác. Nền tảng quy trình làm việc dựa trên nút, bắt đầu như một dự án mã nguồn mở vào năm 2023, hiện phục vụ…

Share
Editorial illustration: A network of interconnected control panels and dials arranged in a grid pattern, each displaying dif — MonstarX

ComfyUI vừa hoàn thành vòng Series B $30 triệu với định giá $500 triệu, chứng minh rằng các nhà phát triển và nhà sáng tạo không muốn AI hộp đen — họ muốn kiểm soát chính xác. Nền tảng quy trình làm việc dựa trên nút, bắt đầu như một dự án mã nguồn mở vào năm 2023, hiện phục vụ các chuyên gia sáng tạo cần tinh chỉnh từng bước của việc tạo hình ảnh, video và âm thanh. Đối với các nhà phát triển châu Á xây dựng nền tảng phát triển AI-native hoặc công cụ truyền thông, vòng tài trợ này báo hiệu một sự thay đổi rõ ràng: thị trường đang chuyển từ các giao diện nhắc lệnh đơn giản sang các hệ thống có thể kết hợp, mô-đun hóa tôn trọng chuyên môn của người xây dựng.

Định giá ComfyUI tiết lộ điều gì về kỳ vọng của các nhà phát triển

ComfyUI xuất hiện vào những ngày đầu của các mô hình khuếch tán, khi các công cụ như Midjourney và DALL-E thường xuyên làm hỏng giải phẫu cơ bản — vấn đề bàn tay sáu ngón nổi tiếng. Đồng sáng lập và CEO Yoland Yan cho biết với TechCrunch rằng ngay cả các mô hình được cải thiện ngày nay cũng chỉ đạt được kết quả "60% đến 80%" với các lệnh nhắc đơn giản. 20% còn lại yêu cầu lặp lại, và các công cụ dựa trên lệnh nhắc truyền thống biến quá trình lặp lại đó thành một máy đánh bạc: thay đổi một chi tiết, mất ba chi tiết khác.

Quy trình làm việc dựa trên nút giải quyết vấn đề này bằng cách chia tạo thành các bước rời rạc, có thể kiểm soát. Thay vì tạo lại toàn bộ hình ảnh để sửa phần tử nền, các nhà sáng tạo cô lập nút đó và điều chỉnh các tham số mà không chạm vào tiền cảnh. Cách tiếp cận mô-đun này phản ánh cách các nhà phát triển suy nghĩ về kiến trúc phần mềm — các hàm có thể kết hợp, không phải các tập lệnh nguyên khối.

Định giá $500 triệu, được hỗ trợ bởi Craft Ventures, Pace Capital và Chemistry, xác thực một luận điểm mở rộng ngoài việc tạo phương tiện. Các nhà phát triển trên khắp châu Á đang xây dựng các sản phẩm AI nơi độ chính xác quan trọng: công cụ hình ảnh y tế ở Singapore, tìm kiếm hình ảnh trực quan thương mại điện tử ở Jakarta, nền tảng kết xuất bất động sản ở Bangkok. Những ứng dụng này không thể chịu được tính ngẫu nhiên của các kết quả AI "sáng tạo". Họ cần kiểm soát xác định hành vi mô hình, điều này có nghĩa là họ cần các kiến trúc tiếp lộ quy trình làm việc cơ bản thay vì ẩn nó đằng sau giao diện trò chuyện.

Sự phát triển của ComfyUI từ dự án mã nguồn mở thành công ty định giá nửa tỷ đô la trong chưa đến ba năm cho thấy rằng những người dùng kỹ thuật sẽ trả tiền cho các công cụ tôn trọng chuyên môn của họ. Điều này quan trọng đối với bất kỳ ai xây dựng công cụ phát triển AI ở Đông Nam Á hoặc Đông Á: người dùng của bạn không muốn phép thuật, họ muốn tính rõ ràng và kiểm soát.

Tại sao quy trình làm việc dựa trên nút vượt trội hơn kỹ thuật nhắc lệnh cho các hệ thống sản xuất

Kỹ thuật nhắc lệnh đã chạm đến giới hạn. Bạn có thể dành hàng giờ để tạo bộ hướng dẫn 200 từ hoàn hảo, chỉ để cập nhật mô hình thay đổi hành vi của nó hoàn toàn. Kiến trúc ComfyUI coi các lệnh nhắc như một đầu vào trong số nhiều — cùng với trọng số LoRA, mạng điều khiển, bộ lập lịch và các nút xử lý hậu kỳ. Mỗi thành phần nằm trong một biểu đồ trực quan nơi các phụ thuộc rõ ràng và các thay đổi lan truyền có thể dự đoán được.

Điều này quan trọng đối với các hệ thống sản xuất. Một công ty khởi nghiệp ở Bangkok xây dựng nhiếp ảnh sản phẩm AI không thể tái tạo 10.000 hình ảnh vì OpenAI điều chỉnh thẩm mỹ mặc định của DALL-E. Với quy trình làm việc dựa trên nút, họ kiểm soát phiên bản toàn bộ đường ống: trọng số mô hình, các bước tiền xử lý, các tham số tăng cường. Khi họ cần thay thế một mô hình cơ sở mới, họ thay thế một nút và kiểm tra các tác động hạ lưu trước khi đẩy vào sản xuất.

Cách tiếp cận này cũng cho phép cộng tác. Trong một hệ thống dựa trên lệnh nhắc truyền thống, kiến thức sống trong các tài liệu Notion có tiêu đề "Lệnh nhắc hoạt động (Phiên bản tháng 4 năm 2026)". Trong ComfyUI, chính quy trình làm việc là tài liệu. Một nhà thiết kế cấp dưới có thể mở tệp quy trình làm việc của một cấp trên, xem chính xác nút nào tạo ra những hiệu ứng nào và sửa đổi các tham số mà không phá vỡ chuỗi. Đây là cách các nhóm phần mềm làm việc — được kiểm soát phiên bản, có thể kiểm toán, có thể tái tạo.

Đối với các nhà phát triển châu Á xây dựng các công cụ AI nội bộ, mô hình kiến trúc này cung cấp một bản thiết kế. Thay vì xây dựng thêm một giao diện trò chuyện, hãy cân nhắc tiếp lộ đường ống AI của bạn dưới dạng các khối có thể kết hợp. Cho phép người dùng nhìn thấy các đường may. Vòng tài trợ ComfyUI chứng minh rằng những người dùng kỹ thuật sẽ trả giá cao cho các công cụ coi họ là những người xây dựng, không phải những người tiêu dùng.

Điều này có ý nghĩa gì đối với công cụ phát triển AI ở châu Á

Đông Nam Á và Đông Á đại diện cho các thị trường phát triển nhanh nhất cho các công cụ phát triển AI, nhưng hầu hết các nền tảng vẫn giả định các mô hình phát triển phương Tây: tài liệu bằng tiếng Anh, tích hợp tập trung vào Mỹ, cơ sở hạ tầng được tối ưu hóa cho AWS us-east-1. Thành công của ComfyUI cho thấy rằng các nhà phát triển trên toàn thế giới muốn điều tương tự — kiểm soát, khả năng kết hợp và tính minh bạch — nhưng các nhà xây dựng châu Á phải đối mặt với những ràng buộc độc đáo.

Độ trễ quan trọng hơn khi người dùng của bạn ở Manila hoặc Hà Nội, không phải San Francisco. Quy trình làm việc dựa trên nút yêu cầu các chuyến đi khứ hồi đến các API được lưu trữ ở Mỹ cho mỗi điều chỉnh tham số trở nên không thể sử dụng được. Đây là lý do tại sao các nền tảng như MonstarX tập trung vào cơ sở hạ tầng khu vực và các kiến trúc ưu tiên địa phương. Khi bạn xây dựng một công cụ AI trực quan cho một nền tảng thương mại điện tử Jakarta, bạn cần thời gian phản hồi dưới 200ms và giá cả có thể dự đoán được bằng tiền tệ địa phương.

Thách thức khác là phân mảnh hệ sinh thái. ComfyUI được hưởng lợi từ một cộng đồng mã nguồn mở khổng lồ xuất bản các nút tùy chỉnh, mô hình được đào tạo trước và các mẫu quy trình làm việc. Các nhà phát triển châu Á thường làm việc với các mô hình dành riêng cho khu vực — mô hình ngôn ngữ Thái, nhận dạng giọng nói Việt, tạo ký tự Nhật — không có hỗ trợ cộng đồng tương tự. Các nền tảng chiến thắng ở châu Á sẽ là những nền tảng giúp dễ dàng tích hợp các mô hình địa phương này vào các quy trình làm việc có thể kết hợp mà không yêu cầu người dùng trở thành các kỹ sư cơ sở hạ tầng.

Định giá $500 triệu của ComfyUI cũng báo hiệu rằng các nhà đầu tư hiện nay hiểu được sự khác biệt giữa các sản phẩm AI tiêu dùng và công cụ dành cho nhà phát triển. Cái trước có thể nhận được sự chú ý với các bản demo lóng lẫy, nhưng cái sau yêu cầu độ tin cậy kỹ thuật sâu. Đối với những người sáng lập ở Singapore, Seoul hoặc Bangalore xây dựng các nền tảng AI, đây là sự cho phép đi sâu hơn là rộng: xây dựng cho nhà phát triển hiểu các mô hình khuếch tán, không phải người dùng bình thường chỉ muốn một nút phép thuật.

Cách quy trình làm việc AI mô-đun hóa cho phép lặp lại nhanh hơn

Tốc độ lặp lại xác định liệu sản phẩm AI có thành công hay chết trong giai đoạn beta. Cách tiếp cận dựa trên nút của ComfyUI nén vòng phản hồi: thay đổi một tham số, xem kết quả, điều chỉnh, lặp lại. Các công cụ dựa trên lệnh nhắc truyền thống buộc bạn phải chờ đợi tái tạo đầy đủ ngay cả khi bạn chỉ kiểm tra một biến. Sự khác biệt này tích lũy trong hàng trăm lần lặp lại.

Hãy xem xét một cơ quan thiết kế ở Hong Kong xây dựng các tài sản tiếp thị do AI tạo ra. Với một công cụ dựa trên lệnh nhắc, kiểm tra xem thuật toán tăng cường khác có cải thiện chất lượng in hay không có nghĩa là tái tạo toàn bộ hình ảnh, có thể mất 30 giây và chi phí $0,50 mỗi lần thử. Với quy trình làm việc mô-đun, họ thay thế nút tăng cường, chỉ chạy lại phần bị ảnh hưởng và nhận kết quả trong 5 giây với giá $0,05. Trong một tuần lặp lại, đó là sự khác biệt giữa tiêu hết ngân sách cho thử nghiệm so với chi tiêu cho các tài sản sản xuất.

Kiến trúc này cũng cho phép kiểm tra A/B ở cấp thành phần. Thay vì so sánh hai lệnh nhắc hoàn toàn khác nhau, bạn cô lập các biến: tạo cơ sở tương tự, nút tô màu khác nhau. Thành phần tương tự, LoRA kiểu dáng khác nhau. Đây là cách các kỹ sư suy nghĩ về tối ưu hóa hiệu suất — thay đổi một điều, đo lường delta, đưa ra quyết định. Áp dụng phương pháp này cho tạo AI biến nó từ nghệ thuật thành kỹ thuật.

Đối với các nhà phát triển xây dựng các tính năng AI vào các sản phẩm hiện có, bài học rõ ràng: tiếp lộ nội bộ của đường ống của bạn. Đừng ẩn độ phức tạp đằng sau nút "tạo". Cho phép người dùng xem mô hình nào bạn đang gọi, những tham số nào bạn đang chuyển và nơi họ có thể can thiệp. Thị trường đang thưởng cho các công cụ tôn trọng trí thông minh của người dùng, không phải những công cụ ẩn nó.