কেন কোহেরের প্রাক্তন এআই গবেষণা নেতৃত্ব স্কেলিং রেসের বিরুদ্ধে বাজি ধরছে

October 22, 2025

Write by : Tushar.KP


এআই ল্যাবগুলি ডেটা সেন্টার তৈরির জন্য দৌড়াচ্ছে৷ ম্যানহাটনের মতো বড়, প্রতিটি বিলিয়ন ডলার খরচ করে এবং একটি ছোট শহরের মতো শক্তি খরচ করে। প্রচেষ্টাটি “স্কেলিং”-এ একটি গভীর বিশ্বাস দ্বারা চালিত হয় – এই ধারণা যে বিদ্যমান AI প্রশিক্ষণ পদ্ধতিতে আরও কম্পিউটিং শক্তি যোগ করা শেষ পর্যন্ত সমস্ত ধরণের কাজ সম্পাদন করতে সক্ষম সুপার ইন্টেলিজেন্ট সিস্টেমগুলি তৈরি করবে।

কিন্তু এআই গবেষকদের একটি ক্রমবর্ধমান কোরাস বলছেন যে বৃহৎ ভাষার মডেলগুলির স্কেলিং তার সীমাতে পৌঁছেছে এবং এআই কর্মক্ষমতা উন্নত করার জন্য অন্যান্য অগ্রগতির প্রয়োজন হতে পারে।

এটাই বাজি সারা হুকার, কোহেরের প্রাক্তন এআই রিসার্চের ভিপি এবং একজন গুগল ব্রেইন প্রাক্তন ছাত্র, তার নতুন স্টার্টআপ নিয়ে নিচ্ছেন, দত্তক ল্যাবসতিনি সহকর্মী Cohere এবং Google অভিজ্ঞ সুদীপ রায়ের সাথে কোম্পানীটির সহ-প্রতিষ্ঠা করেন, এবং এটি এই ধারণার উপর নির্মিত যে LLM স্কেল করা AI মডেলগুলির থেকে আরও বেশি পারফরম্যান্স চেপে নেওয়ার একটি অদক্ষ উপায় হয়ে উঠেছে৷ হুকার, যিনি আগস্ট মাসে কোহের ছেড়েছিলেন, শান্তভাবে ঘোষণা করা হয় স্টার্টআপ এই মাসে আরও ব্যাপকভাবে নিয়োগ শুরু করবে।

টেকক্রাঞ্চের সাথে একটি সাক্ষাত্কারে, হুকার বলেছেন যে অ্যাডাপশন ল্যাবস এমন AI সিস্টেম তৈরি করছে যা ক্রমাগত মানিয়ে নিতে পারে এবং তাদের বাস্তব-বিশ্বের অভিজ্ঞতা থেকে শিখতে পারে এবং এটি অত্যন্ত দক্ষতার সাথে করতে পারে। তিনি এই পদ্ধতির পিছনের পদ্ধতিগুলি বা সংস্থাটি এলএলএম বা অন্য স্থাপত্যের উপর নির্ভর করে কিনা সে সম্পর্কে বিশদ ভাগ করতে অস্বীকার করেছিলেন।

“এখন একটি টার্নিং পয়েন্ট আছে যেখানে এটি খুব স্পষ্ট যে এই মডেলগুলিকে স্কেলিং করার ফর্মুলা – স্কেলিং-পিলড পন্থা, যা আকর্ষণীয় কিন্তু অত্যন্ত বিরক্তিকর – এমন বুদ্ধি তৈরি করেনি যা বিশ্বের সাথে নেভিগেট করতে বা ইন্টারঅ্যাক্ট করতে সক্ষম হয়,” হুকার বলেছিলেন।

মানিয়ে নেওয়া হল “শিক্ষার হৃদয়,” হুকারের মতে। উদাহরণস্বরূপ, আপনি যখন আপনার ডাইনিং রুমের টেবিলের পাশ দিয়ে হেঁটে যান তখন আপনার পায়ের আঙুলটি স্টাব করুন এবং আপনি পরের বার এটির চারপাশে আরও সাবধানে পা রাখতে শিখবেন। AI ল্যাবগুলি রিইনফোর্সমেন্ট লার্নিং (RL) এর মাধ্যমে এই ধারণাটি ক্যাপচার করার চেষ্টা করেছে, যা AI মডেলগুলিকে নিয়ন্ত্রিত সেটিংসে তাদের ভুল থেকে শিখতে দেয়৷ যাইহোক, আজকের আরএল পদ্ধতিগুলি AI মডেলগুলিকে উত্পাদনে সাহায্য করে না – যার অর্থ সিস্টেমগুলি ইতিমধ্যে গ্রাহকদের দ্বারা ব্যবহৃত হচ্ছে – বাস্তব সময়ে তাদের ভুলগুলি থেকে শিখতে৷ তারা শুধু তাদের পায়ের আঙ্গুল stubb রাখা.

কিছু AI ল্যাব এন্টারপ্রাইজগুলিকে তাদের কাস্টম প্রয়োজনের সাথে তাদের AI মডেলগুলিকে সূক্ষ্ম-টিউন করতে সহায়তা করার জন্য পরামর্শ পরিষেবা অফার করে, তবে এটি একটি মূল্যে আসে। ওপেনএআই গ্রাহকদের প্রয়োজন বলে জানা গেছে 10 মিলিয়ন ডলারের উপরে খরচ কোম্পানীর সাথে ফাইন-টিউনিং এর পরামর্শমূলক পরিষেবা প্রদানের জন্য।

টেকক্রাঞ্চ ইভেন্ট

সান ফ্রান্সিসকো
,
অক্টোবর 27-29, 2025

হুকার বলেন, “আমাদের হাতে গোনা কয়েকটি ফ্রন্টিয়ার ল্যাব রয়েছে যেগুলো এআই মডেলের এই সেটটি নির্ধারণ করে যা সবাইকে একইভাবে পরিবেশন করা হয় এবং সেগুলো মানিয়ে নেওয়ার জন্য খুবই ব্যয়বহুল,” বলেছেন হুকার। “এবং আসলে, আমি মনে করি এটি আর সত্য হওয়ার দরকার নেই, এবং AI সিস্টেমগুলি খুব দক্ষতার সাথে একটি পরিবেশ থেকে শিখতে পারে৷ এটি প্রমাণ করা যে AI কে নিয়ন্ত্রণ করতে এবং গঠন করতে পারে তার গতিশীলতা সম্পূর্ণরূপে বদলে দেবে এবং সত্যিই, এই মডেলগুলি দিনের শেষে কাকে পরিবেশন করে।”

অ্যাডাপশন ল্যাবস হল সাম্প্রতিকতম লক্ষণ যে এলএলএম স্কেল করার ক্ষেত্রে শিল্পের বিশ্বাস ক্ষুণ্ন হচ্ছে। এমআইটি গবেষকদের সাম্প্রতিক একটি গবেষণাপত্রে পাওয়া গেছে বিশ্বের সবচেয়ে বড় এআই মডেল শীঘ্রই হ্রাসকারী রিটার্ন দেখাতে পারে। সান ফ্রান্সিসকোর কম্পনগুলিও বদলে যাচ্ছে বলে মনে হচ্ছে। এআই বিশ্বের প্রিয় পডকাস্টার, দ্বারকেশ প্যাটেল, সম্প্রতি বিখ্যাত এআই গবেষকদের সাথে কিছু অস্বাভাবিকভাবে সন্দেহজনক কথোপকথনের আয়োজন করেছেন।

রিচার্ড সাটন, একজন টুরিং পুরস্কার বিজয়ী যাকে “আরএল-এর পিতা” হিসেবে গণ্য করা হয়, সেপ্টেম্বরে প্যাটেলকে বলেছিলেন যে এলএলএম সত্যিই স্কেল করতে পারে না কারণ তারা বাস্তব জগতের অভিজ্ঞতা থেকে শিক্ষা নেয় না। এই মাসে, প্রাথমিক ওপেনএআই কর্মচারী আন্দ্রেজ কার্পাথি প্যাটেলকে বলেছিলেন তিনি রিজার্ভেশন ছিল এআই মডেল উন্নত করতে RL এর দীর্ঘমেয়াদী সম্ভাবনা সম্পর্কে।

এই ধরনের ভয় অভূতপূর্ব নয়। 2024 সালের শেষের দিকে, কিছু এআই গবেষকরা উদ্বেগ প্রকাশ করেছেন যে প্রিট্রেইনিং এর মাধ্যমে AI মডেলগুলিকে স্কেল করা — যেখানে AI মডেলগুলি ডেটাসেটের স্তূপ থেকে প্যাটার্ন শিখে — হ্রাসকারী রিটার্নকে আঘাত করছিল। তখন পর্যন্ত, ওপেনএআই এবং গুগল তাদের মডেল উন্নত করার জন্য প্রি-ট্রেনিং ছিল গোপন সস।

যারা pretraining স্কেলিং উদ্বেগ এখন ডেটাতে প্রদর্শিত হচ্ছেকিন্তু AI শিল্প মডেলগুলি উন্নত করার অন্যান্য উপায় খুঁজে পেয়েছে। 2025 সালে, এআই রিজনিং মডেলগুলির আশেপাশে অগ্রগতি, যা উত্তর দেওয়ার আগে সমস্যার সমাধান করতে অতিরিক্ত সময় এবং কম্পিউটেশনাল রিসোর্স নেয়, এআই মডেলগুলির ক্ষমতাকে আরও এগিয়ে নিয়ে গেছে।

AI ল্যাবগুলি নিশ্চিত যে RL এবং AI যুক্তির মডেলগুলিকে স্কেল করা নতুন সীমান্ত। ওপেনএআই গবেষকরা এর আগে টেকক্রাঞ্চকে বলেছিলেন তারা তাদের প্রথম এআই যুক্তি মডেল তৈরি করেছেo1, কারণ তারা ভেবেছিল এটি ভালভাবে বৃদ্ধি পাবে। সম্প্রতি মেটা ও পিরিওডিক ল্যাবসের গবেষকরা ড একটি কাগজ প্রকাশ করেছে কিভাবে RL পারফরম্যান্সকে আরও স্কেল করতে পারে তা অন্বেষণ করা – একটি গবেষণা যা রিপোর্ট করা হয়েছে 4 মিলিয়ন ডলারের বেশি খরচ, কতটা ব্যয়বহুল বর্তমান পন্থা অবশেষ।

বিপরীতে, অভিযোজন ল্যাবগুলির লক্ষ্য পরবর্তী অগ্রগতি খুঁজে বের করা এবং প্রমাণ করা যে অভিজ্ঞতা থেকে শেখা অনেক সস্তা হতে পারে। স্টার্টআপটি এই পতনের শুরুতে $20 মিলিয়ন থেকে $40 মিলিয়ন বীজ রাউন্ড বাড়াতে আলোচনায় ছিল, তিনজন বিনিয়োগকারীর মতে যারা এর পিচ ডেক পর্যালোচনা করেছে। তারা বলে যে রাউন্ডটি বন্ধ হয়ে গেছে, যদিও চূড়ান্ত পরিমাণ অস্পষ্ট। হুকার মন্তব্য করতে রাজি হননি।

“আমরা খুব উচ্চাভিলাষী হতে সেট আপ করছি,” হুকার বলেন, তার বিনিয়োগকারীদের সম্পর্কে জিজ্ঞাসা করা হলে.

হুকার এর আগে কোহের ল্যাবসের নেতৃত্ব দিয়েছিলেন, যেখানে তিনি এন্টারপ্রাইজ ব্যবহারের ক্ষেত্রে ছোট এআই মডেলকে প্রশিক্ষণ দিয়েছিলেন। কমপ্যাক্ট এআই সিস্টেমগুলি এখন নিয়মিতভাবে কোডিং, গণিত এবং যুক্তির মানদণ্ডে তাদের বৃহত্তর সমকক্ষগুলিকে ছাড়িয়ে যায় – একটি প্রবণতা হুকার চালিয়ে যেতে চায়৷

তিনি বিশ্বব্যাপী AI গবেষণার অ্যাক্সেস প্রসারিত করার জন্য একটি খ্যাতিও তৈরি করেছেন, আফ্রিকার মতো নিম্ন প্রতিনিধিত্বশীল অঞ্চল থেকে গবেষণা প্রতিভা নিয়োগ করেছেন। অ্যাডাপশন ল্যাবস শীঘ্রই একটি সান ফ্রান্সিসকো অফিস খুলবে, হুকার বলেছেন যে তিনি বিশ্বব্যাপী ভাড়া করার পরিকল্পনা করছেন।

যদি হুকার এবং অ্যাডাপশন ল্যাবগুলি স্কেলিং এর সীমাবদ্ধতা সম্পর্কে সঠিক হয় তবে এর প্রভাবগুলি বিশাল হতে পারে। LLM স্কেল করার জন্য ইতিমধ্যেই বিলিয়ন বিলিয়ন বিনিয়োগ করা হয়েছে, এই ধারণার সাথে যে বড় মডেলগুলি সাধারণ বুদ্ধিমত্তার দিকে নিয়ে যাবে৷ কিন্তু এটা সম্ভব যে সত্যিকারের অভিযোজিত শিক্ষা শুধুমাত্র আরও শক্তিশালী নয় – বরং অনেক বেশি দক্ষ প্রমাণ করতে পারে।

মেরিনা টেমকিন প্রতিবেদনে অবদান রেখেছেন।





Source link

More

Scroll to Top