Chip Jalapeño của OpenAI: Bước ngoặt lớn nhất của Big Tech rời khỏi Nvidia

OpenAI vừa công bố Jalapeño — một chip suy luận tùy chỉnh được phát triển hợp tác với Broadcom — và đây là tín hiệu rõ ràng nhất cho đến nay rằng sự phụ thuộc của ngành AI vào một nhà cung cấp silicon duy nhất đang suy yếu.

Share
Editorial illustration: A high-performance microchip positioned at the edge of a table or precipice, with dramatic side-ligh — MonstarX

Chip Jalapeño của OpenAI: Bước ngoặt lớn nhất của Big Tech rời khỏi Nvidia

OpenAI vừa công bố Jalapeño — một chip suy luận tùy chỉnh được phát triển hợp tác với Broadcom — và đây là tín hiệu rõ ràng nhất cho đến nay rằng sự phụ thuộc của ngành AI vào một nhà cung cấp silicon duy nhất đang suy yếu. Chip Jalapeño của OpenAI là bước ngoặt lớn nhất rời khỏi Nvidia mà chúng ta từng thấy, và nó tham gia vào danh sách ngày càng dài bao gồm Google, Apple, và SpaceX. Đối với các nhà phát triển và người sáng lập trên khắp châu Á, đây không chỉ là một câu chuyện về chuỗi cung ứng. Đây là một sự tái định hình cơ bản về ai kiểm soát chi phí, tốc độ và khả năng tiếp cận của cơ sở hạ tầng AI — và điều đó có hậu quả trực tiếp đối với cách bạn xây dựng.

Điều Gì Đã Xảy Ra

Nvidia đã thống trị thị trường chip AI trong nhiều năm. Các GPU H100 và hiện tại B200 của nó đã trở thành nền tảng tính toán mặc định cho việc huấn luyện và chạy các mô hình ngôn ngữ lớn, và sự thống trị đó đã mang lại cho công ty sức mạnh định giá phi thường. Danh sách chờ kéo dài hàng tháng. Chi phí tăng vọt. Toàn bộ các vòng tài trợ được im lặng dành riêng chỉ để đảm bảo quyền truy cập GPU.

Chip Jalapeño của OpenAI thay đổi phép tính đó — ít nhất là đối với OpenAI. Theo podcast Equity của TechCrunch, Jalapeño là một chip suy luận tùy chỉnh, không phải chip huấn luyện. Sự phân biệt này rất quan trọng. Huấn luyện một mô hình biên giới là một sự kiện tính toán khổng lồ một lần (hoặc định kỳ). Suy luận — chạy mô hình để trả lời câu hỏi của bạn, tạo mã của bạn, hoặc cung cấp năng lượng cho sản phẩm của bạn — xảy ra hàng tỷ lần mỗi ngày. Suy luận là nơi chi phí hoạt động thực sự nằm, và đó là nơi silicon tùy chỉnh mang lại kết quả nhanh nhất.

Broadcom là đối tác sản xuất ở đây, điều này có ý nghĩa. Broadcom có kinh nghiệm sâu trong thiết kế ASIC tùy chỉnh và đã làm việc với Google trên các Đơn vị Xử lý Tensor (TPU) của nó. OpenAI về cơ bản đang theo cùng một kịch bản: thiết kế một chip được tối ưu hóa cho khối lượng công việc cụ thể của bạn, sản xuất nó quy mô lớn, và ngừng trả phí Nvidia cao cho các khả năng bạn không cần.

Đây không phải là một sự quay trở lại khỏi Nvidia hoàn toàn. OpenAI vẫn sẽ sử dụng phần cứng Nvidia cho các lần chạy huấn luyện và có khả năng cho một số khối lượng công việc suy luận. Nhưng Jalapeño báo hiệu ý định — cùng ý định mà Google thể hiện với TPU, Amazon với Trainium và Inferentia, và Meta với chip MTIA của nó. Thời đại của nền văn hóa GPU hoàn toàn đơn nhất đang kết thúc, và silicon tùy chỉnh đang trở thành rào cản cạnh tranh cho bất kỳ ai hoạt động AI quy mô lớn.

Tại Sao Điều Này Quan Trọng Đối Với Châu Á

Mối quan hệ của châu Á với cơ sở hạ tầng AI rất phức tạp. Một mặt, khu vực này là nơi có một số nhà máy sản xuất bán dẫn tinh vi nhất trên thế giới — TSMC ở Đài Loan, Samsung ở Hàn Quốc, và một hệ sinh thái dày đặc các nhà thiết kế chip và chuyên gia đóng gói trên khắp khu vực. Mặt khác, quyền truy cập vào tính toán AI tiên tiến đã bị hạn chế bởi các biện pháp kiểm soát xuất khẩu, ưu tiên phân bổ ưu tiên cho các siêu quy mô Mỹ, và chi phí thô.