lang-bn

AI আপনাকে কী বলবে তা কে নির্ধারণ করে? মেটার প্রাক্তন সংবাদ প্রধান ক্যাম্পবেল ব্রাউনের মতামত

ক্যাম্পবেল ব্রাউন মেটার সদর দফতরের ভিতর থেকে ChatGPT চালু হতে দেখেছিলেন এবং একটি স্পষ্ট চিন্তা করেছিলেন: "আমাদের যদি এটি ঠিক করার উপায় না বের করি তাহলে আমার সন্তানরা সত্যিই বোকা হয়ে যাবে।" প্রাক্তন NBC অ্যাঙ্করকর এবং ফেসবুক সংবাদ প্রধান নাটকীয় ছিলেন না। তিনি রিয়েল টাইমে পরবর্তী তথ্য বাধা তৈরি হতে দেখছিলেন — এবং এশিয়ার ডেভেলপাররা যে AI ডেভেলপমেন্ট টুলস ব্যবহার করে তা তৈরি করছে এমন কেউই নির্ভুলতার বিষয়ে যত্নশীল মনে হচ্ছিল না। ফাউন্ডেশন মডেলগুলি কোডিং বেঞ্চমার্কে দুর্দান্ত ছিল যখন ভূরাজনীতি, মানসিক স্বাস্থ্য এবং অর্থের বিষয়ে মৌলিক তথ্য হ্যালুসিনেট করছিল। সতের মাস পরে, ব্রাউন Forum AI চালু করেছিলেন যে সমস্যাটি সমাধান করতে যা শিল্প উপেক্ষা করেছিল: যখন উত্তর দ্বিমুখী নয় তখন AI আপনাকে কী বলে তা কে নির্ধারণ করে?

তার কোম্পানি ফাউন্ডেশন মডেলগুলি "উচ্চ-ঝুঁকিপূর্ণ বিষয়গুলিতে" মূল্যায়ন করে — এমন বিষয় যেখানে দক্ষতা গুরুত্বপূর্ণ এবং ভুল উত্তরের পরিণতি রয়েছে। পদ্ধতিটি সরল: ডোমেইন বিশেষজ্ঞদের নিয়োগ করুন (ভূরাজনীতির জন্য Niall Ferguson, Tony Blinken, Kevin McCarthy; অন্যান্য ক্ষেত্রের জন্য অনুরূপ প্যানেল), তাদের মূল্যায়ন বেঞ্চমার্ক স্থাপত্য করতে দিন, তারপর AI বিচারকদের প্রশিক্ষণ দিন মানব বিশেষজ্ঞদের সাথে ৯০% সম্মতিতে পৌঁছাতে। প্রাথমিক ফলাফলগুলি অস্বস্তিকর সত্য প্রকাশ করে। Gemini চাইনিজ কমিউনিস্ট পার্টির ওয়েবসাইট থেকে এমন গল্পের জন্য টানে যার কোনো CCP প্রাসঙ্গিকতা নেই। কোডের জন্য অপ্টিমাইজ করা মডেলগুলি সূক্ষ্মতায় দর্শনীয়ভাবে ব্যর্থ হয়। সিলিকন ভ্যালি যা পরিমাপ করে (MMLU স্কোর, HumanEval পাস রেট) এবং ব্যবহারকারীদের যা প্রয়োজন (জটিল বিষয়গুলিতে প্রাসঙ্গিক নির্ভুলতা) তার মধ্যে ব্যবধান কখনও বিস্তৃত ছিল না।

AI ডেভেলপমেন্ট টুলস কী?

AI ডেভেলপমেন্ট টুলস হল প্ল্যাটফর্ম এবং ফ্রেমওয়ার্ক যা ডেভেলপারদের মেশিন লার্নিং মডেল তৈরি, প্রশিক্ষণ, স্থাপন এবং অ্যাপ্লিকেশনে একীভূত করতে দেয়। এই বিভাগটি নিম্ন-স্তরের টেনসর লাইব্রেরি (PyTorch, TensorFlow) থেকে উচ্চ-স্তরের API র্যাপার (OpenAI এর SDK, Anthropic এর Claude API) থেকে সম্পূর্ণ-স্ট্যাক প্ল্যাটফর্ম যা অবকাঠামো, মডেল ম্যানেজমেন্ট এবং স্থাপন পাইপলাইন পরিচালনা করে সবকিছু বিস্তৃত। পার্থক্যটি গুরুত্বপূর্ণ কারণ আপনি যে টুলটি বেছে নেন তা আপনি কী তৈরি করতে পারেন এবং কত দ্রুত আপনি শিপ করতে পারেন তা নির্ধারণ করে।

এশিয়ান ডেভেলপারদের জন্য, ল্যান্ডস্কেপ তিনটি স্তরে বিভক্ত। প্রথম: AWS (SageMaker), Google (Vertex AI) এবং Microsoft (Azure ML) থেকে ক্লাউড-নেটিভ প্ল্যাটফর্ম — শক্তিশালী কিন্তু ব্যয়বহুল, জাকার্তায় আপনার ব্যবহারকারী এবং ভার্জিনিয়ায় আপনার কম্পিউট থাকলে লেটেন্সি সমস্যা সহ। দ্বিতীয়: OpenAI এবং Anthropic এর মতো API-প্রথম সেবা — দ্রুত একীভূত করতে কিন্তু অস্বচ্ছ, মডেল আচরণের উপর সীমিত নিয়ন্ত্রণ এবং অপ্রত্যাশিত স্কেলিং মূল্য সহ। তৃতীয়: এশিয়ার অবকাঠামো বাস্তবতার জন্য নির্মিত আঞ্চলিক প্ল্যাটফর্ম — কম লেটেন্সি, স্থানীয় সম্মতি, আঞ্চলিক মুদ্রায় মূল্য নির্ধারণ।

AI-নেটিভ ডেভেলপমেন্ট প্ল্যাটফর্ম বিভাগটি একটি নির্দিষ্ট সমস্যা সমাধান করতে উদ্ভূত হয়েছিল: "আমার একটি ধারণা আছে" এবং "আমার একটি স্থাপিত পণ্য আছে" এর মধ্যে ব্যবধান মাস দ্বারা পরিমাপ করা হয়েছিল, দিন নয়। ঐতিহ্যবাহী ওয়ার্কফ্লোগুলি প্রোটোটাইপিং, প্রশিক্ষণ, স্থাপন, পর্যবেক্ষণ এবং পুনরাবৃত্তির জন্য আলাদা সরঞ্জাম প্রয়োজন। প্রতিটি হ্যান্ডঅফ ঘর্ষণ প্রবর্তন করেছিল। প্রতিটি বিক্রেতা লক-ইন নমনীয়তা হ্রাস করেছিল। ডেভেলপাররা বৈশিষ্ট্য তৈরির চেয়ে অবকাঠামো পরিচালনায় বেশি সময় ব্যয় করেছিল।

একটি টুল "AI-নেটিভ" বনাম শুধু "AI-সক্ষম" কী করে তোলে? প্রাক্তনটি AI কে প্রাথমিক ইন্টারফেস হিসাবে বিবেচনা করে, একটি অ্যাড-অন নয়। কোড জেনারেশন একটি সাইডবার বৈশিষ্ট্য নয় — এটি ডিফল্ট ওয়ার্কফ্লো। মডেল নির্বাচন ঘটে প্রাসঙ্গিকভাবে আপনি কী তৈরি করছেন তার উপর ভিত্তি করে, আপনি কোন বিক্রেতার সাথে চুক্তি স্বাক্ষর করেছেন তার উপর ভিত্তি করে নয়। স্থাপন পাইপলাইনগুলি বোঝে যে আপনার মডেলের পুনরায় প্রশিক্ষণের প্রয়োজন হবে, শুধু পুনর্স্থাপন নয়। প্ল্যাটফর্মটি অনুমান করে আপনি দ্রুত পুনরাবৃত্তি করছেন, একবার শিপ করছেন না।

এশিয়ান ডেভেলপারদের জন্য শীর্ষ টুলস

ক্যাম্পবেল ব্রাউনের ফাউন্ডেশন মডেলগুলির সমালোচনা — যে তারা কোডিং বেঞ্চমার্কের জন্য অপ্টিমাইজ করে যখন সূক্ষ্ম যুক্তিতে ব্যর্থ হয় — ডেভেলপমেন্ট টুলসের জন্য সমানভাবে প্রযোজ্য। এমন একটি প্ল্যাটফর্ম যা বয়লারপ্লেট React কম্পোনেন্ট তৈরিতে দুর্দান্ত কিন্তু আঞ্চলিক পেমেন্ট গেটওয়ে (GrabPay, GCash, Alipay) এর সাথে একীভূত করতে পারে না এটি এশিয়ান বাজারের জন্য নির্মিত নয়। এই অঞ্চলের জন্য সেরা AI ডেভেলপমেন্ট টুলস তিনটি বৈশিষ্ট্য ভাগ করে: স্থানীয় অবকাঠামো, আঞ্চলিক API একীকরণ এবং মূল্য নির্ধারণ যা সিলিকন ভ্যালি তহবিল রাউন্ড অনুমান করে না।

GitHub Copilot বিশ্বব্যাপী মনোযোগ আধিপত্য করে কিন্তু তার প্রশিক্ষণ ডেটার বাইরে প্রসঙ্গে সংগ্রাম করে। এটিকে LINE Login এর জন্য প্রমাণীকরণ প্রবাহ তৈরি করতে বলুন (থাইল্যান্ড এবং জাপানে সর্বব্যাপী) এবং আপনি সাধারণ OAuth2 কোড পাবেন যা প্ল্যাটফর্ম-নির্দিষ্ট সূক্ষ্মতা মিস করে। একই সীমাবদ্ধতা পশ্চিমা-নির্মিত সরঞ্জাম জুড়ে প্রদর্শিত হয়: মান CRUD অ্যাপের জন্য চমৎকার, আঞ্চলিক বিশেষত্বের জন্য দুর্বল। এটি একটি প্রযুক্তিগত সমস্যা নয় — এটি একটি ডেটা সমস্যা। প্রধানত US এবং ইউরোপীয় ডেভেলপারদের GitHub রিপোজিটরিতে প্রশিক্ষিত মডেলগুলি সেই ইকোসিস্টেমগুলি প্রতিফলিত করে।

আঞ্চলিক বিকল্পগুলি উদ্ভূত হয়েছে। Alibaba Cloud এর ModelScope চাইনিজ ভাষার কাজের জন্য অপ্টিমাইজ করা প্রি-প্রশিক্ষিত মডেল সরবরাহ করে। Naver এর HyperCLOVA কোরিয়ান ডেভেলপারদের লক্ষ্য করে। এই প্ল্যাটফর্মগুলি স্থানীয়করণ সমাধান করে কিন্তু ব্রাউন Meta তে চিহ্নিত করেছেন একই অবকাঠামো জটিলতা উত্তরাধিকার করে: একাধিক বিক্রেতা, অসামঞ্জস্যপূর্ণ API, স্থাপন পাইপলাইন যা অনুমান করে আপনার একটি DevOps দল আছে। "কাজ করে ডেমোতে" এবং "শিপ করে উৎপাদনে" এর মধ্যে ব্যবধান বিস্তৃত থাকে।

MonstarX একীকরণকে প্রথম-শ্রেণীর উদ্বেগ হিসাবে বিবেচনা করে সমস্যাটির কাছে ভিন্নভাবে পদ্ধতি করে। প্ল্যাটফর্মের সংযোগকারী লাইব্রেরি দক্ষিণ-পূর্ব এশিয়ান পেমেন্ট গেটওয়ে, প্রমাণীকরণ প্রদানকারী এবং ক্লাউড সেবার জন্য প্রি-নির্মিত অ্যাডাপ্টার অন্তর্ভুক্ত করে — অবকাঠামো স্তর যা সাধারণ টুলস উপেক্ষা করে। যেখানে Copilot কোড তৈরি করে আপনার ডিবাগ করতে হবে, MonstarX কোড তৈরি করে যা ইতিমধ্যে আপনার স্থাপন লক্ষ্য বোঝে। এটি বেঞ্চমার্ক স্কোরের চেয়ে বেশি গুরুত্বপূর্ণ যখন আপনি মাউন্টেন ভিউ নয় ম্যানিলায় ব্যবহারকারীদের কাছে শিপ করছেন।

সঠিক টুল কীভাবে বেছে নিতে হয়

Forum AI এর পদ্ধতি — বিশেষজ্ঞদের নিয়োগ করুন, বেঞ্চমার্ক সংজ্ঞায়িত করুন, সম্মতি পরিমাপ করুন — ডেভেলপমেন্ট টুলস মূল্যায়নের জন্য একটি টেমপ্লেট অফার করে। আপনার "উচ্চ-ঝুঁকিপূর্ণ বিষয়গুলি" কী? বেশিরভাগ এশিয়ান ডেভেলপারদের জন্য, উত্তর অন্তর্ভুক্ত করে: লেটেন্সি (দ্বিতীয় স্তরের শহরগুলিতে 4G নেটওয়ার্কে ব্যবহারকারী), সম্মতি (ডেটা আবাসিকতা আইন দেশ অনুযায়ী পরিবর্তিত হয়), খরচ (USD তে মূল্যায়িত AWS বিল যখন আপনার রাজস্ব রুপিয়ায় থাকে), এবং একীকরণ (আপনার ব্যবহারকারীরা প্রকৃতপক্ষে ব্যবহার করে এমন সেবাগুলিতে সংযোগ করা)।

অবকাঠামো প্রয়োজনীয়তা দিয়ে শুরু করুন। যদি আপনার ব্যবহারকারীরা দক্ষিণ-পূর্ব এশিয়ায় থাকে, আপনার কম্পিউট কোথায় চলছে? একটি প্ল্যাটফর্ম একচেটিয়াভাবে US-East-1 এ হোস্ট করা আপনার কোড সম্পাদিত হওয়ার আগে ২০০-৩০০ms বেসলাইন লেটেন্সি যোগ করে। যখন আপনি বাহ্যিক API কল করছেন তখন সেই বিলম্ব যৌগিক হয়। রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য (চ্যাট, সহযোগিতা সরঞ্জাম, লাইভ আপডেট), লেটেন্সি একটি বৈশিষ্ট্য অনুরোধ নয় — এটি একটি ডিলব্রেকার। প্ল্যাটফর্ম কোথায় এজ নোড চালায় এবং সিঙ্গাপুর, টোকিও বা মুম্বাইতে স্থাপন সমর্থন করে কিনা তা পরীক্ষা করুন।

পরবর্তী, প্রথম মাসে আপনার প্রয়োজন হবে এমন একীকরণগুলি অডিট করুন। পেমেন্ট প্রসেসিং: প্ল্যাটফর্ম আঞ্চলিক গেটওয়ে সমর্থন করে বা শুধু Stripe? প্রমাণীকরণ: আপনি Google এবং GitHub এর পাশাপাশি LINE, KakaoTalk, Zalo একীভূত করতে পারেন? ক্লাউড সেবা: যদি আপনি সম্মতির কারণে Alibaba Cloud বা Tencent Cloud ব্যবহার করছেন, টুল সেই প্রদানকারীদের সমর্থন করে? সাধারণ প্ল্যাটফর্ম AWS/GCP/Azure অনুমান করে। আঞ্চলিক প্ল্যাটফর্ম আরও ভাল জানে।

মূল্য নির্ধারণ মডেলগুলি অগ্রাধিকার প্রকাশ করে। ব্যবহার-ভিত্তিক মূল্য নির্ধারণ ন্যায্য শোনায় যতক্ষণ না আপনি বুঝতে পারেন প্ল্যাটফর্ম "API কল" বা "কম্পিউট মিনিট" পরিমাপ করে একটি প্রোটোটাইপ এবং উৎপাদন ট্রাফিক মধ্যে পার্থক্য ছাড়াই। নির্ধারিত-স্তর মূল্য নির্ধারণ পূর্বাভাসযোগ্য শোনায় যতক্ষণ না আপনি দল আকার বা স্থাপন ফ্রিকোয়েন্সিতে কৃত্রিম সীমায় আঘাত করেন। এশিয়ান ডেভেলপারদের জন্য সেরা টুলস স্থানীয় মুদ্রায় মূল্য নির্ধারণ করে এবং প্রকৃত ব্যবহার প্যাটার্নের চারপাশে স্তর কাঠামো করে (API কল সংখ্যা নয় প্রকল্প সংখ্যা), কারণ তারা বোঝে যে বেঙ্গালুরুতে একটি তিন-ব্যক্তির স্টার্টআপের সান ফ্রান্সিসকোতে একটি সিরিজ B কোম্পানির চেয়ে ভিন্ন অর্থনীতি আছে।

অবশেষে, শেখার বক্ররেখা সৎভাবে মূল্যায়ন করুন। ব্রাউনের অন্তর্দৃষ্টি সিলিকন ভ্যালি