lang-bn

OpenAI-র জালাপেনো চিপ: বিগ টেক-র Nvidia থেকে সবচেয়ে সাহসী পদক্ষেপ

OpenAI সবেমাত্র জালাপেনো প্রকাশ করেছে — Broadcom-র সাথে অংশীদারিত্বে তৈরি একটি কাস্টম ইনফারেন্স চিপ — এবং এটি স্পষ্ট সংকেত যে AI শিল্পের একক সিলিকন সরবরাহকারীর উপর নির্ভরতা ভাঙছে। OpenAI-র জালাপেনো চিপ বিগ টেক-র Nvidia থেকে সবচেয়ে সাহসী পদক্ষেপ যা আমরা দেখেছি, এবং এটি Google, Apple এবং SpaceX সহ ক্রমবর্ধমান তালিকায় যোগ দিয়েছে। এশিয়া জুড়ে ডেভেলপার এবং প্রতিষ্ঠাতাদের জন্য, এটি শুধু একটি সাপ্লাই-চেইন গল্প নয়। এটি AI অবকাঠামোর খরচ, গতি এবং অ্যাক্সেসযোগ্যতা নিয়ন্ত্রণ করে এমন বিষয়ের একটি মৌলিক পুনর্গঠন — এবং এটি আপনি কীভাবে তৈরি করেন তার জন্য সরাসরি পরিণতি রয়েছে।

কী ঘটেছে

Nvidia বছরের পর বছর AI চিপ বাজারে আধিপত্য বিস্তার করেছে। এর H100 এবং এখন B200 GPU গুলি বড় ভাষা মডেল প্রশিক্ষণ এবং চালানোর জন্য ডিফল্ট কম্পিউট সাবস্ট্রেট হয়ে উঠেছে, এবং সেই আধিপত্য কোম্পানিকে অসাধারণ মূল্য নির্ধারণ ক্ষমতা দিয়েছে। অপেক্ষার তালিকা মাসের পর মাস বিস্তৃত হয়েছে। খরচ বৃদ্ধি পেয়েছে। সম্পূর্ণ তহবিল রাউন্ড নীরবে GPU অ্যাক্সেস সুরক্ষিত করার জন্য বরাদ্দ করা হয়েছে।

OpenAI-র জালাপেনো চিপ সেই হিসাব পরিবর্তন করে — অন্তত OpenAI নিজের জন্য। TechCrunch-র Equity পডকাস্ট অনুযায়ী, জালাপেনো একটি কাস্টম ইনফারেন্স চিপ, প্রশিক্ষণ চিপ নয়। এই পার্থক্য অত্যন্ত গুরুত্বপূর্ণ। একটি ফ্রন্টিয়ার মডেল প্রশিক্ষণ একটি একক (বা পর্যায়ক্রমিক) বিশাল কম্পিউট ইভেন্ট। ইনফারেন্স — আপনার প্রশ্নের উত্তর দিতে, আপনার কোড তৈরি করতে বা আপনার পণ্য চালাতে মডেল চালানো — প্রতিদিন বিলিয়ন বার ঘটে। ইনফারেন্স হল যেখানে প্রকৃত অপারেশনাল খরচ থাকে, এবং এটি যেখানে কাস্টম সিলিকন সবচেয়ে দ্রুত ফলপ্রসূ হয়।

Broadcom এখানে উৎপাদন অংশীদার, যা বোধগম্য। Broadcom-র কাস্টম ASIC ডিজাইনে গভীর অভিজ্ঞতা রয়েছে এবং ইতিমধ্যে Google-র Tensor Processing Units (TPU)-র সাথে কাজ করে। OpenAI মূলত একই খেলা অনুসরণ করছে: আপনার নির্দিষ্ট কর্মভারের জন্য অপ্টিমাইজ করা একটি চিপ ডিজাইন করুন, এটি স্কেলে উৎপাদন করুন এবং আপনার প্রয়োজন নেই এমন ক্ষমতার জন্য Nvidia প্রিমিয়াম দিতে বন্ধ করুন।

এটি সম্পূর্ণভাবে Nvidia থেকে একটি পিভট নয়। OpenAI এখনও প্রশিক্ষণ চালানোর জন্য Nvidia হার্ডওয়্যার ব্যবহার করবে এবং সম্ভবত নির্দিষ্ট ইনফারেন্স কর্মভারের জন্য। কিন্তু জালাপেনো অভিপ্রায় সংকেত দেয় — একই অভিপ্রায় Google TPU-র সাথে, Amazon Trainium এবং Inferentia-র সাথে, এবং Meta তার MTIA চিপের সাথে দেখিয়েছে। মোট GPU একচেটিয়াতার যুগ শেষ হচ্ছে, এবং কাস্টম সিলিকন স্কেলে AI পরিচালনা করে এমন যে কাউকে প্রতিযোগিতামূলক সুবিধা হয়ে উঠছে।

এশিয়ার জন্য কেন এটি গুরুত্বপূর্ণ

AI অবকাঠামোর সাথে এশিয়ার সম্পর্ক জটিল। একদিকে, অঞ্চলটি বিশ্বের সবচেয়ে পরিশীলিত সেমিকন্ডাক্টর উৎপাদনের আবাসস্থল — তাইওয়ানে TSMC, দক্ষিণ কোরিয়ায় Samsung এবং অঞ্চল জুড়ে চিপ ডিজাইনার এবং প্যাকেজিং বিশেষজ্ঞদের একটি ঘন ইকোসিস্টেম। অন্যদিকে, অত্যাধুনিক AI কম্পিউটে অ্যাক্সেস রপ্তানি নিয়ন্ত্রণ, US হাইপারস্কেলারদের অনুকূল বরাদ্দ অগ্রাধিকার এবং কাঁচা খরচ দ্বারা সীমাবদ্ধ হয়েছে।

কাস্টম চিপ প্রবণতা এশিয়া প্রযুক্তিতে ইতিমধ্যে চলমান একটি বিভাজন ত্বরান্বিত করে। চীনা AI ল্যাব — Baidu, Alibaba DAMO, Huawei-র HiSilicon — পছন্দ নয়, প্রয়োজনের বাইরে কাস্টম AI সিলিকন তৈরি করছে, কারণ US রপ্তানি বিধিনিষেধ উচ্চ-প্রান্তের Nvidia GPU-তে অ্যাক্সেস বন্ধ করেছে। সেই বাধ্যতামূলক বিনিয়োগ এখন দূরদর্শী দেখাচ্ছে। Huawei-র Ascend চিপ, Nvidia-র বর্তমান কর্মক্ষমতা ব্যবধান যাই হোক না কেন, প্রাতিষ্ঠানিক জ্ঞান প্রতিনিধিত্ব করে যা সময়ের সাথে যৌগিক হয়।

দক্ষিণ-পূর্ব এশিয়ার প্রতিষ্ঠাতা এবং ডেভেলপারদের জন্য, প্রভাবগুলি আরও তাৎক্ষণিক এবং ব্যবহারিক। ক্লাউড ইনফারেন্স খরচ এমন বাজারে AI-নেটিভ পণ্য তৈরি করে এমন স্টার্টআপগুলির জন্য একটি বাস্তব সীমাবদ্ধতা যেখানে গড় ব্যবহারকারী প্রতি রাজস্ব US বা ইউরোপের চেয়ে কম। যদি OpenAI-র জালাপেনো চিপ অর্থপূর্ণভাবে সস্তা ইনফারেন্স প্রদান করে — এবং কাস্টম ASIC সাধারণত করে, কারণ তারা সাধারণ-উদ্দেশ্য GPU আর্কিটেকচারের ওভারহেড দূর করে — সেই খরচ হ্রাস ডাউনস্ট্রিমে প্রবাহিত হয়। API মূল্য নির্ধারণ হ্রাস পায়। পাতলা-মার্জিন AI পণ্য কার্যকর হয়ে ওঠে। দক্ষিণ-পূর্ব এশিয়ায় AI-চালিত অ্যাপ্লিকেশনের সম্বোধনযোগ্য বাজার প্রসারিত হয়।

এশিয়ার সার্বভৌম AI উচ্চাকাঙ্ক্ষার জন্য এখানে একটি কৌশলগত পাঠও রয়েছে। Singapore, Japan, South Korea এবং India-র মতো দেশগুলি সবাই জাতীয় AI অবকাঠামোতে বিনিয়োগ করছে। জালাপেনো ঘোষণা একটি ডেটা পয়েন্ট যে কাস্টম সিলিকন গুরুতর AI খেলোয়াড়রা যে পথ নেয়। অঞ্চলে সরকার এবং সার্বভৌম সম্পদ তহবিল যারা এখনও বিশুদ্ধভাবে Nvidia ক্লাস্টার কেনার কথা চিন্তা করছে তাদের এটি ঘনিষ্ঠভাবে দেখা উচিত।

গভীর পরিবর্তন লিভারেজ সম্পর্কে। যখন প্রতিটি AI কোম্পানি একই Nvidia হার্ডওয়্যারে চলে, Nvidia শর্ত নির্ধারণ করে। চিপ ল্যান্ডস্কেপ বৈচিত্র্যময় হওয়ার সাথে সাথে — জালাপেনো সহ OpenAI, TPU সহ Google, Trainium সহ Amazon — আলোচনার শক্তি বিতরণ করা হয়। এটি কম্পিউট কেনা সবার জন্য ভাল, এশিয়ান ডেভেলপার সহ যারা ঐতিহাসিকভাবে বিক্রেতার বাজারে মূল্য গ্রহণকারী হয়েছে।

ডেভেলপারদের জন্য এর অর্থ কী

বেশিরভাগ ডেভেলপার সরাসরি জালাপেনোর সাথে যোগাযোগ করবে না। আপনি ক্লাউড কনসোলে জালাপেনো ইনস্ট্যান্স প্রদান করবেন না। আপনি যা অনুভব করবেন তা হল ডাউনস্ট্রিম প্রভাব: দ্রুত ইনফারেন্স লেটেন্সি, কম API খরচ এবং — সময়ের সাথে — নতুন মডেল ক্ষমতা যা শুধুমাত্র অর্থনৈতিকভাবে সম্ভব হয় যখন ইনফারেন্স যথেষ্ট সস্তা হয়।

কিন্তু যদি আপনি AI-নেটিভ পণ্য তৈরি করছেন তবে চিন্তা করার মতো আরও কাঠামোগত প্রভাব রয়েছে।

ইনফারেন্স অপ্টিমাইজেশন এখন একটি প্রথম-শ্রেণীর ইঞ্জিনিয়ারিং উদ্বেগ। যেহেতু AI কোম্পানিগুলি কাস্টম ইনফারেন্স সিলিকন তৈরি করছে, তারা এটিতে চলে এমন সফ্টওয়্যার স্ট্যাকও বিকাশ করছে। OpenAI, Google এবং Amazon সবাই ইনফারেন্স অপ্টিমাইজেশনে ব্যাপকভাবে বিনিয়োগ করছে — কোয়ান্টাইজেশন, অনুমানমূলক ডিকোডিং, ব্যাচিং কৌশল, KV ক্যাশ ম্যানেজমেন্ট। যে ডেভেলপাররা এই ধারণাগুলি বোঝে তারা তাদের স্ট্যাকের নীচে যে অবকাঠামো থাকুক না কেন তা থেকে কর্মক্ষমতা বের করার জন্য আরও ভাল অবস্থানে থাকবে। আপনার চিপ ডিজাইন করার প্রয়োজন নেই, কিন্তু আপনার ইনফারেন্স লেটেন্সি কেন পরিবর্তিত হয় এবং এটি কীভাবে কমাতে হয় তা বুঝতে হবে।

মডেল-প্রদানকারী লক-ইন একটি বাস্তব ঝুঁকি, এবং এটি আকার পরিবর্তন করছে। যদি OpenAI-র ইনফারেন্স জালাপেনোতে চলে এবং Google-র TPU-তে চলে, তাদের API-র কর্মক্ষমতা এবং খরচ প্রোফাইল এমনভাবে বিভিন্ন হবে যা বিশুদ্ধভাবে মডেল গুণমান সম্পর্কে নয়। একটি API যা 30% সস্তা কারণ এটি কাস্টম সিলিকনে চলে তা একটি ভাড়া করা GPU ক্ষমতায় 30% বেশি ব্যয়বহুল একটির চেয়ে একটি ভিন্ন পণ্য। বহু-মডেল সিস্টেম তৈরি করা স্থপতিদের এটি বিবেচনা করতে হবে।

বিমূর্তকরণ স্তর এর চেয়ে বেশি গুরুত্বপূর্ণ। যখন অবকাঠামো বৈচিত্র্যময় হয়, এর উপরে একটি পরিষ্কার বিমূর্তকরণ স্তরের মূল্য বৃদ্ধি পায়। প্ল্যাটফর্মগুলি যা আপনাকে মডেল প্রদানকারী স্যুইপ করতে, প্রদানকারী জুড়ে API খরচ পরিচালনা করতে এবং একটি একক ইনফারেন্স ব্যাকএন্ডে ঢালাই না করে তৈরি করতে দেয় তা শুধুমাত্র সুবিধাজনক নয় বরং সত্যিকারের উপযোগী হয়ে ওঠে। MonstarX-এ তৈরি করা — এশিয়ার AI-নেটিভ ডেভেলপমেন্ট প্ল্যাটফর্ম — মানে আপনার অ্যাপ্লিকেশন লজিক যে মডেলটি কল করছে তা জালাপেনোতে, একটি TPU-তে বা একটি H100 ক্লাস্টারে চলছে কিনা তা নিয়ে চিন্তা করতে হবে না। অবকাঠামো পরিবর্তন আপনার কোডের নীচে ঘটে।

AI পণ্যের জন্য খরচ মডেলিং আরও পরিশীলিত হতে হবে। এখন, অনেক প্রতিষ্ঠাতা ইনফারেন্স খরচকে একটি নির্ধারিত ইনপুট হিসাবে বিবেচনা করে। কাস্টম সিলিকন কিছু প্রদানকারীর জন্য ইনফারেন্স খরচ হ্রাস করার সাথে সাথে অন্যরা সাধারণ-উদ্দেশ্য GPU-তে থাকে, খরচ ল্যান্ডস্কেপ আরও গতিশীল হয়ে উঠবে। দিন এক থেকে আপনার আর্কিটেকচারে খরচ পর্যবেক্ষণ তৈরি করুন। প্রদানকারী এবং মডেল দ্বারা প্রতি-টোকেন খরচ বা প্রতি-অনুরোধ খরচ ট্র্যাক করুন। আজ যা সবচেয়ে সস্তা তা ছয় মাসে সবচেয়ে সস্তা নাও হতে পারে, এবং ডেল্টা স্কেলে গুরুত্বপূর্ণ হবে।

এশিয়ার ডেভেলপারদের জন্য বিশেষভাবে, ব্যবহারিক পরামর্শ হল আর্কিটেকচার স্তরে প্রদানকারী-অজ্ঞেয় থাকা। কাস্টম চিপ তরঙ্গ API মূল্য নির্ধারণে সম্পূর্ণভাবে প্রকাশ পেতে 18-36 মাস সময় নেবে, কিন্তু যে কোম্পানিগুলি এখন নমনীয়তা তৈরি করে তারা স্কেলে খরচ সীমাবদ্ধ করতে সক্ষম হবে।