lang-th

ข่าวดีสำหรับ Amazon: Snowflake ลงนามสัญญา 6 พันล้านดอลลาร์กับ AWS สำหรับชิป AI CPU

Snowflake เพิ่งตั้งสัญญา 6 พันล้านดอลลาร์ในระยะ 5 ปีกับ Amazon Web Services สำหรับชิป AI CPU — สัญญาที่มีมูลค่าเกือบเท่ากับทุกสิ่งที่บริษัทยักษ์ข้อมูลคลาวด์ได้ใช้จ่ายกับ AWS ตั้งแต่ปี 2012 ประกาศนี้บ่งชี้ถึงการเปลี่ยนแปลงครั้งใหญ่ในวิธีที่องค์กรต่างๆ คิดเกี่ยวกับโครงสร้างพื้นฐาน AI และเป็นการเปลี่ยนแปลงที่นักพัฒนาทั่วเอเชียควรเข้าใจ แม้ว่าการสนทนาเกี่ยวกับ เครื่องมือพัฒนา AI ในเอเชีย มักจะมุ่งเน้นไปที่ GPU และการฝึกอบรมโมเดล แต่สัญญานี้เน้นให้เห็นว่าจะเกิดอะไรขึ้นต่อไป: งานที่ใช้ CPU อย่างเข้มข้นในการเรียกใช้ AI agents และการทำงานในการผลิตในระดับขนาดใหญ่

สำหรับนักพัฒนาที่สร้างบน แพลตฟอร์มพัฒนา AI-native การเป็นหุ้นส่วนระหว่าง Snowflake และ AWS เผยให้เห็นว่าอุตสาหกรรมกำลังมุ่งหน้าไปที่ไหน เมื่อ AI เปลี่ยนจากสมุดบันทึกการทดลองไปเป็นระบบการผลิตที่จัดการคำขอนับล้านรายต่อวัน ข้อกำหนดของโครงสร้างพื้นฐานจะเปลี่ยนแปลงอย่างมากมาย นี่ไม่ใช่เพียงเรื่องของการฝึกอบรมโมเดลที่ใหญ่ขึ้น — เป็นเรื่องของการเรียกใช้โมเดลเหล่านั้นอย่างมีประสิทธิภาพในแอปพลิเคชันในโลกแห่งความเป็นจริง

สัญญา Snowflake-AWS หมายความว่าอย่างไรสำหรับโครงสร้างพื้นฐาน AI

ข้อตกลง 6 พันล้านดอลลาร์มุ่งเน้นไปที่ชิป Graviton ของ Amazon — CPU ที่ใช้สถาปัตยกรรม ARM ออกแบบมาโดยเฉพาะสำหรับภาระงานคลาวด์ ตามที่ บริษัททั้งสองประกาศ การใช้จ่าย AWS ของ Snowflake เพิ่มขึ้นเป็นสองเท่าเป็น 2 พันล้านดอลลาร์ในปี 2025 เพียงอย่างเดียว ขับเคลื่อนเกือบทั้งหมดโดยภาระงาน AI ผ่านแพลตฟอร์ม Cortex AI

เหตุผลทางเทคนิคมีความสำคัญ: ในขณะที่ GPU มีความเป็นเลิศในการประมวลผลแบบขนานสำหรับการฝึกอบรมและการอนุมาน CPU จัดการชั้นการประสานงาน เมื่อ AI agent ค้นหาฐานข้อมูล ประมวลผลผลลัพธ์ ตัดสินใจ และเรียกใช้เวิร์กโฟลว์ การดำเนินการเหล่านั้นจะทำงานบน CPU เมื่อองค์กรปรับใช้ AI agents มากขึ้น — ระบบที่ทำหน้าที่อย่างอิสระแทนที่จะตอบสนองต่อพรอมต์เท่านั้น — ความต้องการ CPU จะระเบิด

CEO ของ Amazon Andy Jassy อ้างว่าเดือนที่แล้วว่าชิปที่พัฒนาเองของ AWS นำเสนอ "ราคา-ประสิทธิภาพที่ดีกว่า" กว่าข้อเสนอของ Nvidia ไม่ว่าจะเป็นการตลาดหรือความเป็นจริง ข้อความเชิงกลยุทธ์นั้นชัดเจน: ผู้ให้บริการคลาวด์กำลังหลากหลายออกจากการพึ่งพาชิปเดียว สำหรับนักพัฒนาในเอเชียตะวันออกเฉียงใต้ ซึ่งต้นทุนคลาวด์อาจเป็นตัวกำหนดหรือทำลายเศรษฐศาสตร์หน่วยของสตาร์ทอัพ การแข่งขันนี้ทำให้ราคาลดลงและตัวเลือกเพิ่มขึ้น

การเดิมพันของ Snowflake บน Graviton ยังตรวจสอบความถูกต้องของสถาปัตยกรรม ARM สำหรับภาระงาน AI ขององค์กร ในอดีต ชิป x86 จาก Intel และ AMD ครอบงำศูนย์ข้อมูล แต่ประสิทธิภาพการใช้พลังงานและข้อดีด้านต้นทุนของ ARM กำลังปรับปรุงภูมิทัศน์นั้น นักพัฒนาที่สร้างแอปพลิเคชัน AI ควรพิจารณาความเข้ากันได้ ARM ในเชนเครื่องมือของพวกเขา — ลักษณะประสิทธิภาพแตกต่างกันพอที่จะมีความสำคัญในระดับขนาดใหญ่

นักพัฒนาเอเชียควรคิดเกี่ยวกับเครื่องมือพัฒนา AI อย่างไร

สัญญา Snowflake เน้นย้ำความจริงที่กว้างขึ้น: การพัฒนา AI ในปี 2026 ไม่ใช่เรื่องของการเลือกระหว่างเครื่องมือ เป็นเรื่องของการเลือกกลยุทธ์โครงสร้างพื้นฐาน นักพัฒนาเอเชียต้องเผชิญกับข้อจำกัดที่ไม่ซ้ำใคร — ความล่าช้าต่อภูมิภาคคลาวด์ที่ใช้ US เข้มงวดเกี่ยวกับการอยู่อาศัยของข้อมูลในตลาดเช่นอินโดนีเซียและเวียดนาม และข้อจำกัดด้านงบประมาณที่ทำให้ทุกดอลลาร์ของการคำนวณนับได้

เครื่องมือพัฒนา AI ที่ดีที่สุดสำหรับสภาพแวดล้อมนี้มีสามลักษณะ ประการแรก พวกเขาคำนวณความซับซ้อนของโครงสร้างพื้นฐานโดยไม่ซ่อนไว้ทั้งหมด คุณต้องมองเห็นว่าอะไรกำลังทำงานที่ไหน โดยเฉพาะอย่างยิ่งเมื่อแก้ไขปัญหาการผลิตหรือปรับให้เหมาะสมกับต้นทุน ประการที่สอง พวกเขาสนับสนุนรูปแบบการปรับใช้แบบมัลติคลาวด์ การล็อกเข้าไปในระบบนิเวศของผู้ให้บริการรายเดียวอาจใช้ได้กับยูนิคอร์นซิลิคอนวัลลีที่มีทุนไม่จำกัด แต่สตาร์ทอัพเอเชียต้องการความยืดหยุ่น ประการที่สาม พวกเขาให้ความสำคัญกับความเร็วของนักพัฒนามากกว่าตัวเลือกการกำหนดค่า — การจัดส่งอย่างรวดเร็วมีความสำคัญมากกว่าการปรับแต่งพารามิเตอร์ทุกตัว

นี่คือที่ที่แพลตฟอร์มที่สร้างสำหรับการพัฒนา AI-native แตกต่างจากเครื่องมือพัฒนาแบบดั้งเดิม IDE ทั่วไปที่มี AI autocomplete ติดอยู่ไม่ได้แก้ปัญหาการประสานงาน คุณยังคงต้องเชื่อมต่อฐานข้อมูล API การรับรองความถูกต้อง และไปป์ไลน์การปรับใช้ด้วยตนเอง แพลตฟอร์มที่ออกแบบมาตั้งแต่เริ่มต้นสำหรับเวิร์กโฟลว์ AI จัดการการรวมเหล่านี้โดยเนื้อแท้ ให้นักพัฒนาสามารถมุ่งเน้นไปที่ตรรกะทางธุรกิจแทนที่จะเป็นรหัสกาวโครงสร้างพื้นฐาน

การเพิ่มขึ้นของสิ่งที่บางคนเรียกว่า vibe coding — ซึ่งนักพัฒนาอธิบายสิ่งที่พวกเขาต้องการในภาษาธรรมชาติและแพลตฟอร์มสร้างรหัสที่ใช้งานได้ — แสดงถึงการเปลี่ยนแปลงนี้ มันไม่ใช่เรื่องของการแทนที่นักพัฒนา เป็นเรื่องของการกำจัดงาน 80% ที่น่าเบื่อซึ่งทุกโครงการต้องการก่อนที่คุณจะสามารถสร้างส่วน 20% ที่น่าสนใจได้

CPU-First AI: มันหมายความว่าอย่างไรสำหรับภาระงานการผลิต

แพลตฟอร์ม Cortex AI ของ Snowflake แสดงให้เห็นว่าเหตุใดความจุ CPU จึงมีความสำคัญมากกว่าที่นักพัฒนาส่วนใหญ่ตระหนัก เมื่อผู้ใช้ถามคำถามภาษาธรรมชาติเกี่ยวกับข้อมูลของพวกเขา ระบบจะดำเนินการหลายอย่าง: การแยกวิเคราะห์แบบสอบถาม การแปลเป็น SQL การดำเนินการเรียกฐานข้อมูล การประมวลผลผลลัพธ์ การสร้างสรุป และการจัดรูปแบบการตอบสนอง โดยทั่วไปเฉพาะขั้นตอนการสร้างสรุปเท่านั้นที่ทำงานบน GPU — ทุกอย่างอื่นๆ ถูกผูกไว้กับ CPU

คูณด้วยผู้ใช้พร้อมกันหลายพันคน และคุณจะเข้าใจว่าทำไม Snowflake จึงต้องการความจุ CPU มูลค่า 6 พันล้านดอลลาร์ รูปแบบเดียวกันนี้ใช้กับระบบ AI ที่ผลิตได้ใดๆ: แชตบอท เครื่องมือแนะนำ ไปป์ไลน์การประมวลผลเอกสาร หรือเวิร์กโฟลว์อัตโนมัติ GPU จัดการส่วน "สมาร์ท" แต่ CPU จัดการทุกสิ่งรอบๆ มัน

สำหรับนักพัฒนาที่สร้างบนแพลตฟอร์มสมัยใหม่ สถาปัตยกรรมนี้ส่วนใหญ่มองไม่เห็น แพลตฟอร์มจัดการการจัดสรรทรัพยากร ปรับขนาดความจุ CPU และ GPU โดยอัตโนมัติตามรูปแบบภาระงาน แต่การทำความเข้าใจเศรษฐศาสตร์พื้นฐานช่วยให้คุณตัดสินใจออกแบบที่ดีขึ้น หากแอปพลิเคชันของคุณทำการเรียก AI หนึ่งครั้งต่อเซสชันผู้ใช้ ต้นทุน GPU จะครอบงำ หากทำการเรียก API หลายสิบครั้ง แบบสอบถามฐานข้อมูล และการแปลงข้อมูลรอบการเรียก AI ครั้งเดียว ต้นทุน CPU จะครอบงำ

นักพัฒนาเอเชียควรพิจารณาความพร้อมใช้งานระดับภูมิภาคด้วย อินสแตนซ์ AWS Graviton ไม่พร้อมใช้งานอย่างสม่ำเสมอในทุกภูมิภาค และความล่าช้าต่อคลัสเตอร์ GPU ที่ใกล้ที่สุดแตกต่างกันอย่างมีนัยสำคัญ สิงคโปร์นำเสนอการเชื่อมต่อที่ยอดเยี่ยม แต่นักพัฒนาในจาการ์ตา มะนิลา หรือกรุงเทพอาจเห็นความล่าช้า 50-100ms เพิ่มเติม สำหรับแอปพลิเคชันแบบโต้ตอบ ความล่าช้านั้นจะรวมกับการเดินทางไปกลับทุกครั้ง

การเลือกเครื่องมือพัฒนา AI สำหรับตลาดเอเชีย

ภูมิทัศน์คลาวด์ที่แตกแยกในเอเชียต้องการกลยุทธ์เครื่องมือที่แตกต่างจากที่นักพัฒนาในสหรัฐอเมริกาอาจใช้ กฎหมายการอยู่อาศัยของข้อมูลในอินโดนีเซียต้องให้ข้อมูลบางอย่างอยู่ในประเทศ สภาพแวดล้อมด้านกฎระเบียบของจีนสร้างข้อจำกัดที่ไม่ซ้ำใคร ความไวต่อราคาของอินเดียหมายความว่าทุกรูปีของต้นทุนการคำนวณมีความสำคัญ

เริ่มต้นด้วยการตรวจสอบข้อกำหนดโครงสร้างพื้นฐานของคุณ คุณต้องการการเข้าถึง GPU สำหรับการฝึกอบรม หรือเพียงเพื่อการอนุมาน คุณสามารถแบตช์คำขอการอนุมานเพื่อตัดจำหน่าย GPU ต้นทุนในผู้ใช้หลายคนได้หรือไม่ โมเดลที่ถูกทำให้เป็นปริมาณที่ทำงานบน CPU จะตรงตามข้อกำหนดประสิทธิภาพของคุณในส่วนของต้นทุนหรือไม่ คำถามเหล่านี้กำหนดความต้องการเครื่องมือของคุณมากกว่ารายการตรวจสอบคุณสมบัติ

ต่อไป ประเมินรูปแบบการรวม แพลตฟอร์มที่ดีที่สุดมีตัวเชื่อมต่อที่สร้างไว้ล่วงหน้าสำหรับบริการทั่วไป — ฐานข้อมูล ผู้ให้บริการการรับรองความถูกต้อง เกตเวย์การชำระเงิน ระบบการส่งข้อความ การสร้างการรวมเหล่านี้จากศูนย์ใช้เวลาหลายสัปดาห์ของเวลาพัฒนาและนำเสนอภาระการบำรุงรักษา แพลตฟอร์มที่จัดการการเชื่อมต่อนี้โดยเนื้อแท้ให้คุณจัดส่งได้เร็วขึ้นและทำซ้ำได้อย่างมั่นใจมากขึ้น

สุดท้าย พิจารณารูปแบบการปรับใช้ เครื่องมือบางตัวต้องให้คุณจัดการคลัสเตอร์ Kubernetes รีจิสตรีคอนเทนเนอร์ และไปป์ไลน์ CI/CD บางตัวคำนวณทั้งหมดนั้น ให้คุณปรับใช้ด้วยคำสั่งเดียว ไม่มีวิธีการใดที่ดีกว่าโดยสากล — มันขึ้นอยู่กับความเชี่ยวชาญของทีมของคุณและข้อกำหนดของแอปพลิเคชันของคุณ แต่สำหรับทีมเล็กๆ ที่สร้างแอปพลิเคชัน AI แพลตฟอร์มที่จัดการโดยทั่วไปนำเสนอความเร็วที่ดีกว่าโซลูชันที่โฮสต์เอง

ผลกระทบที่กว้างขึ้นต่อการแข่งขันคลาวด์

สัญญา Snowflake-AWS