ราคาถูก เร็ว และรู้ใจวัฒนธรรม วิดีโอ AI ของ Avataar สร้างมาสำหรับขนาดของอินเดีย

วิดีโอคลิป 720p ยาว 5 วินาทีในเวลา 45 วินาที ราคา $0.005 ต่อวินาที นั่นไม่ใช่ข้อผิดพลาดในการปัดเศษ — นั่นคือโมเดล Varya ใหม่ของ Avataar AI ราคาถูก เร็ว และรู้ใจวัฒนธรรม วิดีโอ AI ของ Avataar แสดงถึงหลักฐานว่าเอเชียกำลังพัฒนาโครงสร้างพื้นฐาน AI ที่ปรับให้เหมาะสมกับตลาดของตัวเอง

Share
Editorial illustration: A film camera or video production rig positioned against a map or architectural blueprint of India,  — MonstarX

ราคาถูก เร็ว และรู้ใจวัฒนธรรม วิดีโอ AI ของ Avataar สร้างมาสำหรับขนาดของอินเดีย

วิดีโอคลิป 720p ยาว 5 วินาทีในเวลา 45 วินาที ราคา $0.005 ต่อวินาที นั่นไม่ใช่ข้อผิดพลาดในการปัดเศษ — นั่นคือโมเดล Varya ใหม่ของ Avataar AI และมันคือตัวเลขที่ควรทำให้นักพัฒนาและผู้ก่อตั้งทุกคนที่สร้างสรรค์ในเอเชียหยุดและประเมินใหม่ ราคาถูก เร็ว และรู้ใจวัฒนธรรม วิดีโอ AI ของ Avataar แสดงถึงสิ่งที่มีความสำคัญมากกว่าการเปิดตัวผลิตภัณฑ์เพียงอย่างเดียว: มันเป็นหลักฐานว่าเอเชียกำลังพัฒนาโครงสร้างพื้นฐาน AI ที่ปรับให้เหมาะสมกับตลาดของตัวเอง ตามเงื่อนไขของตัวเอง

เกิดอะไรขึ้น

Avataar AI — ได้รับการสนับสนุนจาก Peak XV และมุ่งเน้นไปที่เครื่องมือวิดีโอสำหรับอีคอมเมิร์ส — ได้เปิดตัว Varya 1.0 ซึ่งบริษัทเรียกว่าโมเดลวิดีโอที่ถูกกลั่นตัวแรกของอินเดีย บริษัทไม่ได้สร้างมันตั้งแต่ต้น มันเริ่มต้นด้วย Wan 2.2 โมเดลการสร้างวิดีโอที่เปิดให้สาธารณะของ Alibaba และใช้เทคนิคที่เรียกว่า model distillation — การบีบอัดความสามารถที่เรียนรู้ของโมเดลให้เป็นเวอร์ชันที่เบากว่าและเร็วกว่า ปรับให้เหมาะสมสำหรับกรณีการใช้งานเฉพาะของ Avataar

ผลลัพธ์ของการกลั่นตัวนั้นน่าทึ่ง ในขณะที่ Wan 2.2 ต้องการ 50 ขั้นตอนการอนุมาน เพื่อสร้างวิดีโอ Varya ทำงานได้ในเพียง 4 ขั้นตอน บน GPU NVIDIA H200 นั่นแปลว่าการสร้างคลิป 720p ยาว 5 วินาทีในเวลา 45 วินาที เมื่อเทียบกับ 1,230 วินาทีสำหรับโมเดลฐาน — การปรับปรุงความเร็ว 10 เท่า ตามรายงานของ TechCrunch Avataar วางแผนที่จะเรียกเก็บ ₹0.48 (ประมาณ $0.005) ต่อวินาทีของวิดีโอบนบริการที่โฮสต์ของตัวเอง โมเดลเช่น Veo, Kling, Luma และ Runway มักจะเรียกเก็บ $0.10 หรือมากกว่าต่อวินาที — ทำให้ Varya มี ข้อได้เปรียบด้านราคาประมาณ 20 เท่า

Avataar เป็นหนึ่งใน 12 สตาร์ทอัพที่ได้รับเลือกสำหรับ India AI Mission ซึ่งเป็นโครงการที่ได้รับการสนับสนุนจากรัฐบาลอินเดีย มูลค่าประมาณ 1.2 พันล้านดอลลาร์ ซึ่งให้สตาร์ทอัพที่มีคุณสมบัติเข้าถึงการคำนวณ GPU ที่ได้รับอุดหนุนเพื่อแลกกับการเปิดตัวโมเดลของพวกเขาต่อสาธารณะ อุดหนุนนั้นเป็นส่วนที่มีความหมายของเรื่องราว: มันลดอุปสรรคในการสร้างและเปิดตัว AI ระดับมูลนิธิในประเทศที่ต้นทุนการคำนวณเคยเป็นเพดานของความทะเยาะทะยาน

แต่เรื่องราวด้านเทคนิคและราคาเป็นเพียงครึ่งหนึ่งของมัน Varya ได้รับการฝึกอบรมอย่างชัดเจนเพื่อให้เข้าใจบริบทท้องถิ่น — การรู้จำเทศกาลอินเดีย สไตล์เสื้อผ้าระดับภูมิภาค และอาหารท้องถิ่น นั่นไม่ใช่หมายเหตุด้านการตลาด การสร้างพื้นฐานวัฒนธรรมในโมเดลวิดีโอสร้างสรรค์เปลี่ยนคุณภาพของผลลัพธ์สำหรับกรณีการใช้งานอีคอมเมิร์สอินเดียในวิธีที่โมเดลที่ฝึกอบรมแบบทั่วไปของตะวันตกไม่สามารถจำลองได้

ทำไมมันถึงสำคัญสำหรับเอเชีย

ผลลัพธ์โมเดล AI ของอินเดียล้าหลังสหรัฐอเมริกา ยุโรป และจีน การเปิดตัวที่เกิดขึ้นในประเทศส่วนใหญ่เป็นโมเดลภาษาขนาดใหญ่หรือโมเดลเสียง — การสร้างวิดีโอยังคงถูกครอบงำโดยผู้เล่นตะวันตกและจีน Varya เปลี่ยนสมดุลนั้น และผลกระทบขยายออกไปไกลกว่าพรมแดนของอินเดีย

เอเชียไม่ใช่ตลาดที่เป็นเอกภาพ มันเป็นชุดรวมของวัฒนธรรมที่มีบริบทสูง — แต่ละอันมีภาษาภาพที่แตกต่างกัน เทศกาล ระบบแฟชั่น และพฤติกรรมผู้บริโภค — วางซ้อนทับบนเศรษฐกิจที่มีความไวต่อราคา มุ่งเน้นไปที่มือถือ โมเดล AI วิดีโอที่เรียกเก็บ $0.10 ต่อวินาทีเป็นผลิตภัณฑ์ที่สมเหตุสมผลในซานฟรานซิสโก ในมุมไบ จาการ์ตา โฮจิมินห์ซิตี้ หรือมะนิลา มันเป็นสิ่งที่ไม่สามารถเริ่มต้นได้สำหรับธุรกิจส่วนใหญ่ที่จะได้รับประโยชน์จากวิดีโอที่สร้างโดย AI ในระดับ

ราคา $0.005 ต่อวินาทีของ Varya เปลี่ยนเศรษฐศาสตร์หน่วยสำหรับกรณีการใช้งานที่ใหญ่โตมาก: วิดีโอสาธิตผลิตภัณฑ์สำหรับแบรนด์ D2C, สร้างสรรค์โฆษณาที่เป็นท้องถิ่นสำหรับเทศกาลระดับภูมิภาค, เนื้อหารูปแบบสั้นสำหรับแพลตฟอร์มการค้าสังคม นี่ไม่ใช่แอปพลิเคชันที่เป็นช่องว่าง — พวกเขาแสดงถึงแกนกลางของวิธีที่ผู้บริโภคหลายร้อยล้านคนในเอเชียค้นพบและซื้อผลิตภัณฑ์ออนไลน์

วิธีการกลั่นตัวที่ Avataar ใช้ยังคุ้มค่าที่จะสังเกตเป็นแม่แบบเชิงกลยุทธ์ แทนที่จะใช้เวลาหลายปีและหลายร้อยล้านดอลลาร์ในการฝึกอบรมโมเดลมูลนิธิตั้งแต่ต้น Avataar เริ่มต้นด้วยฐานน้ำหนักเปิดที่แข็งแกร่ง (Wan 2.2 จาก Alibaba) และใช้การกลั่นตัวเฉพาะโดเมน นี่คือเล่นหนังสือที่สามารถทำซ้ำได้ นักพัฒนาและสตาร์ทอัพทั่วเอเชียตะวันออกเฉียงใต้ เอเชียใต้ และเอเชียตะวันออกสามารถใช้วิธีการเดียวกัน — ใช้โมเดลน้ำหนักเปิดที่มีความสามารถ กลั่นตัวสำหรับบริบทวัฒนธรรมหรือเชิงพาณิชย์เฉพาะ และเปิดตัวสิ่งที่มีประสิทธิภาพดีกว่าทางเลือกทั่วไปสำหรับกรณีการใช้งานนั้นในเศษส่วนของต้นทุน

โมเดล India AI Mission — การคำนวณที่ได้รับอุดหนุนเพื่อแลกกับการเปิดตัวโมเดลสาธารณะ — ยังเป็นการทดลองนโยบายที่คุ้มค่าที่จะดู หากมันเร่งความเร็วของการพัฒนาโมเดลท้องถิ่น รัฐบาลเอเชียอื่น ๆ อาจตามมาด้วยโปรแกรมที่คล้ายกัน สำหรับนักพัฒนาในภูมิภาค นั่นอาจหมายถึงโครงสร้างพื้นฐานที่เข้าถึงได้มากขึ้นสำหรับการสร้างผลิตภัณฑ์ที่เป็น AI-native ในช่วงไม่กี่ปีข้างหน้า

นี่หมายถึงอะไรสำหรับนักพัฒนา

หากคุณกำลังสร้างผลิตภัณฑ์ในเอเชียที่เกี่ยวข้องกับวิดีโอ — หรือที่ อาจ เกี่ยวข้องกับวิดีโอหากต้นทุนสมเหตุสมผล — สถาปัตยกรรมและโมเดลราคาของ Varya สมควรได้รับความสนใจอย่างจริงจัง นี่คือวิธีคิดเกี่ยวกับมันในทางปฏิบัติ

เล่นหนังสือการกลั่นตัวนั้นสามารถเข้าถึงได้แล้ว วิธีการของ Avataar — ใช้ Wan 2.2 ใช้การกลั่นตัว ปรับให้เหมาะสมสำหรับโดเมนเฉพาะ — ไม่ใช่เวทมนตร์กรรมสิทธิ์ เทคนิคพื้นฐาน (consistency distillation, step reduction) ได้รับการบันทึกไว้อย่างดีในวรรณกรรมการวิจัย สิ่งที่ Avataar ทำคือใช้วินัยวิศวกรรมและความรู้เกี่ยวกับโดเมนกับปัญหาที่สำคัญสำหรับตลาดของพวกเขา หากคุณกำลังสร้างในแนวตั้งเฉพาะ — การถ่ายภาพทางการแพทย์ การเดินผ่านอสังหาริมทรัพย์ การลองแฟชั่น การส่งอาหาร — วิธีการเดียวกันสามารถให้ผลโมเดลที่เร็วกว่า ถูกกว่า และแม่นยำกว่าสำหรับกรณีการใช้งานของคุณมากกว่าทางเลือกทั่วไปใด ๆ

การสร้างพื้นฐานวัฒนธรรมเป็นคูน้อย ไม่ใช่คุณสมบัติ ความจริงที่ว่า Varya รู้จักการตกแต่ง Diwali, ผ้าสไหล หรือ thali ไม่ใช่รายการช่องทำเครื่องหมาย มันหมายความว่าผลลัพธ์ที่สร้างขึ้นมีความสอดคล้องกันตามบริบทสำหรับผู้ชมชาวอินเดียในวิธีที่สำคัญสำหรับการแปลง ความเชื่อ และการรับรู้แบรนด์ สำหรับนักพัฒนาที่สร้างสรรค์ในเอเชียตะวันออกเฉียงใต้ นี่ชี้ไปที่ช่องว่าง: ไม่มีโมเดลที่เทียบเท่ากันที่ได้รับการฝึกอบรมเกี่ยวกับวัฒนธรรมภาพของ เช่น การเฉลิมฉลองอีด ในอินโดนีเซีย หรือสงกรานต์ในประเทศไทย ช่องว่างนั้นเป็นโอกาส

ราคาเปลี่ยนสิ่งที่คุณสามารถสร้างได้ ที่ $0.005 ต่อวินาที การสร้างวิดีโอผลิตภัณฑ์ 100 รายการยาว 10 วินาทีแต่ละรายการมีค่าใช้จ่าย $5 ที่ $0.10 ต่อวินาที ชุดเดียวกันมีค่าใช้จ่าย $100 นั่นไม่ใช่เพียงความแตกต่างของต้นทุน — มันคือความแตกต่างระหว่างคุณสมบัติที่ประหยัดในระดับและคุณสมบัติที่ไม่ใช่ เมื่อประเมินความสามารถ AI ใดที่จะรวมเข้ากับผลิตภัณฑ์ ราคาในระดับนี้เปิดกรณีการใช้งานที่ไม่อยู่ในตารางสำหรับทีมที่ bootstrap หรือสตาร์ทอัพในช่วงเริ่มต้น

สำหรับทีมที่สร้างบนแพลตฟอร์มเช่น MonstarX แพลตฟอร์มการพัฒนา AI-native ของเอเชีย การเกิดขึ้นของโมเดลที่ปรับให้เหมาะสมตามภูมิภาคเช่น Varya แสดงถึงการเปลี่ยนแปลงโครงสร้างพื้นฐานประเภทนั้นที่ทำให้หมวดหมู่ผลิตภัณฑ์ใหม่เป็นไปได้ เมื่อต้นทุนของการสร้างวิดีโอลดลง 20 เท่าและความแม่นยำทางวัฒนธรรมปรับปรุงพร้อมกัน คำถามจะหยุดเป็น "เราสามารถจ่ายเงินเพื่อทำเช่นนี้ได้หรือไม่?" และเริ่มต้นเป็น "เราควรสร้างอะไรก่อน?"

ดู API ราคาบริการที่โฮสต์ของ Avataar แนะนำโมเดลการกระจายที่เป็น API-first เมื่อ Varya พร้อมใช้งานผ่าน API มันจะกลายเป็นบล็อกการสร้าง — สิ่งที่คุณสามารถเรียกจากไปป์ไลน์ผลิตภัณฑ์ของคุณ ระบบการสร้างเนื้อหาของคุณ หรือแบ็กเอนด์อีคอมเมิร์สของคุณ คำถามการรวมที่ใช้งานได้จริงสำหรับนักพัฒนาคือตรงไปตรงมา: ที่ใดในสแต็กของคุณที่การสร้างวิดีโอในปัจจุบันสร้างคอขวดหรือเพดานต้นทุน และโปรไฟล์เวลาแฝงของ Varya (45 วินาทีสำหรับ 5 วินาทีของวิดีโอ) เหมาะสมกับกรณีการใช้งานของคุณหรือไม่