ওয়ার্ল্ড ল্যাবসস্টার্টআপটি এআই পাইওনিয়ার দ্বারা প্রতিষ্ঠিত ফেই-ফেই লি, তার প্রথম বাণিজ্যিক বিশ্বের মডেল পণ্য চালু করা হয়. মার্বেল এখন ফ্রিমিয়াম এবং প্রদত্ত স্তরের মাধ্যমে উপলব্ধ যা ব্যবহারকারীদের পাঠ্য প্রম্পট, ফটো, ভিডিও, 3D লেআউট বা প্যানোরামাগুলি সম্পাদনাযোগ্য, ডাউনলোডযোগ্য 3D পরিবেশে পরিণত করতে দেয়৷
জেনারেটিভ ওয়ার্ল্ড মডেলের প্রবর্তন, প্রথম সীমিত বিটাতে প্রকাশিত দুই মাস আগে প্রিভিউ, ওয়ার্ল্ড ল্যাবসের এক বছর পর আসে চুরি থেকে বেরিয়ে এসেছে $230 মিলিয়ন তহবিল সহ, এবং স্টার্টআপটিকে বিশ্ব মডেল তৈরির প্রতিযোগীদের থেকে এগিয়ে রাখে। বিশ্ব মডেল হল AI সিস্টেম যা পরিবেশের অভ্যন্তরীণ উপস্থাপনা তৈরি করে এবং ভবিষ্যতের ফলাফলের পূর্বাভাস দিতে এবং কর্মের পরিকল্পনা করতে ব্যবহার করা যেতে পারে।
স্টার্টআপের মতো ডেকার্ট এবং ওডিসি বিনামূল্যে ডেমো প্রকাশ করেছে, এবং গুগলের জিনি এখনও সীমিত গবেষণা পূর্বরূপ. মার্বেল এর থেকে আলাদা — এমনকি ওয়ার্ল্ড ল্যাবসের নিজস্ব রিয়েল-টাইম মডেল, আরটিএফএম — কারণ এটি আপনার অন্বেষণের সময় উড়তে থাকা বিশ্ব তৈরি করার পরিবর্তে অবিরাম, ডাউনলোডযোগ্য 3D পরিবেশ তৈরি করে৷ কোম্পানি বলেছে, এর ফলে কম মরফিং বা অসামঞ্জস্যতা দেখা দেয় এবং ব্যবহারকারীদের বিশ্বকে গাউসিয়ান স্প্ল্যাট, মেশ বা ভিডিও হিসেবে রপ্তানি করতে দেয়।
মার্বেল হল এটির প্রথম মডেল যা এআই-নেটিভ এডিটিং টুল এবং একটি হাইব্রিড 3D এডিটর অফার করে যা ব্যবহারকারীদের এআই ভিজ্যুয়াল বিশদগুলি পূরণ করার আগে স্থানিক কাঠামোগুলিকে ব্লক করতে দেয়।

“এটি মডেলের একটি একেবারে নতুন বিভাগ যা 3D ওয়ার্ল্ড তৈরি করছে, এবং এটি এমন কিছু যা সময়ের সাথে সাথে আরও ভাল হতে চলেছে৷ এটি এমন কিছু যা আমরা ইতিমধ্যেই অনেক উন্নতি করেছি,” জাস্টিন জনসন, ওয়ার্ল্ড ল্যাবসের সহ-প্রতিষ্ঠাতা, টেকক্রাঞ্চকে বলেছেন৷
গত ডিসেম্বরে, ওয়ার্ল্ড ল্যাব দেখিয়েছে কিভাবে এর প্রথম দিকের মডেলগুলো একটি একক চিত্রের উপর ভিত্তি করে ইন্টারেক্টিভ 3D দৃশ্য তৈরি করতে পারে। চিত্তাকর্ষক হলেও, কিছুটা কার্টুনিশ দৃশ্যগুলি সম্পূর্ণরূপে অন্বেষণযোগ্য ছিল না কারণ আন্দোলনগুলি একটি ছোট এলাকায় সীমাবদ্ধ ছিল এবং মাঝে মাঝে রেন্ডারিং ত্রুটি ছিল।
বিটা প্রিভিউয়ের আমার ট্রায়ালে, আমি দেখতে পেয়েছি মার্বেল একা ইমেজ প্রম্পট থেকে চিত্তাকর্ষক জগত তৈরি করেছে — গেমের মতো পরিবেশ থেকে শুরু করে আমার বসার ঘরের ফটোরিয়ালিস্টিক সংস্করণ পর্যন্ত। দৃশ্যগুলি প্রান্তে রূপান্তরিত করা হয়েছে, যদিও আজকের লঞ্চে এটি দৃশ্যত উন্নত করা হয়েছে। এটি বলেছিল, আমি একটি একক প্রম্পট ব্যবহার করে বিটাতে যে বিশ্ব তৈরি করেছি তা আরও ভাল লাগছিল এবং এখন একই প্রম্পটের চেয়ে আমার অভিপ্রায়ের সাথে আরও বেশি মিলিত হয়েছে।
টেকক্রাঞ্চ ইভেন্ট
সান ফ্রান্সিসকো
,
অক্টোবর 13-15, 2026
আমি এখনও সম্পাদনা বৈশিষ্ট্যগুলি পরীক্ষা করিনি, যদিও জনসন বলেছেন যে তারা মার্বেলকে নিকট-মেয়াদী গেমিং, ভিএফএক্স এবং ভার্চুয়াল রিয়েলিটি (ভিআর) প্রকল্পগুলির জন্য ব্যবহারিক করে তোলে।
“আগামী মার্বেল জন্য আমাদের প্রধান থিম এক সৃজনশীল নিয়ন্ত্রণ,” জনসন বলেন. “কোনও কিছু তৈরি করার জন্য সর্বদা একটি দ্রুত পথ থাকা উচিত, তবে আপনি আরও গভীরে ডুব দিতে এবং আপনি যে জিনিসগুলি তৈরি করছেন তার উপর অনেক নিয়ন্ত্রণ পেতে সক্ষম হওয়া উচিত। আপনি চান না যে মেশিনটি কেবল চাকাটি নিয়ে যাক এবং সেই সমস্ত সৃজনশীলতাকে আপনার কাছ থেকে সরিয়ে ফেলুক।”

মার্বেলের সৃজনশীল নিয়ন্ত্রণ শুরু হয় ইনপুট নমনীয়তার সাথে। বিটা শুধুমাত্র একক ছবি গ্রহণ করে, মডেলটিকে 360-ডিগ্রি ভিউয়ের জন্য অদেখা বিশদ আবিষ্কার করতে বাধ্য করে। সম্পূর্ণ লঞ্চের সাথে, ব্যবহারকারীরা এখন বিভিন্ন কোণ থেকে একটি স্থান দেখানোর জন্য একাধিক ছবি বা ছোট ক্লিপ আপলোড করতে পারে এবং মডেলটি মোটামুটি বাস্তবসম্মত ডিজিটাল যমজ তৈরি করতে পারে।
তারপরে আমাদের কাছে রয়েছে চিসেল, একটি পরীক্ষামূলক 3D সম্পাদক যা ব্যবহারকারীদের মোটা স্থানিক লেআউটগুলি (দেয়াল, বাক্স বা প্লেনগুলি মনে করুন) ব্লক করতে দেয় এবং তারপরে ভিজ্যুয়াল শৈলীকে গাইড করার জন্য পাঠ্য প্রম্পট যোগ করতে দেয়৷ মার্বেল বিশ্ব তৈরি করে, স্টাইল থেকে কাঠামোকে ডিকপলিং করে — যেভাবে HTML একটি ওয়েবসাইটের কাঠামো প্রদান করে এবং CSS রঙ যোগ করে। টেক্সট-ভিত্তিক সম্পাদনার বিপরীতে, চিসেল আপনাকে সরাসরি বস্তুগুলি পরিচালনা করতে দেয়।

“আমি শুধু সেখানে যেতে পারি এবং 3D ব্লকটি ধরতে পারি যা পালঙ্কের প্রতিনিধিত্ব করে এবং এটিকে অন্য কোথাও সরিয়ে দিতে পারি,” জনসন বলেছিলেন।
আরেকটি নতুন বৈশিষ্ট্য যা আপনাকে আরও সম্পাদনা নিয়ন্ত্রণ দেয় তা হল একটি বিশ্ব প্রসারিত করার ক্ষমতা।
“একবার আপনি একটি বিশ্ব তৈরি করলে, আপনি এটি একবার পর্যন্ত প্রসারিত করতে পারেন,” জনসন বলেছিলেন। “যখন আপনি বিশ্বের এমন একটি অংশে যান যা বিচ্ছিন্ন হতে শুরু করে, আপনি মূলত মডেলটিকে সেখানে প্রসারিত করতে বা আপনি বর্তমানে যেখানে আছেন তার আশেপাশে আরও বিশ্ব তৈরি করতে বলতে পারেন এবং তারপরে এটি সেই অঞ্চলে আরও বিশদ যোগ করতে পারে।”
যে ব্যবহারকারীরা অত্যন্ত বড় স্পেস তৈরি করতে চান তারা “কম্পোজার মোড” এর সাথে একাধিক বিশ্ব একত্রিত করতে পারেন। জনসন আমার জন্য এটি ইতিমধ্যেই তৈরি করা দুটি জগত দিয়ে দেখিয়েছেন – একটি আঙ্গুরের চেয়ার সহ পনির দিয়ে তৈরি একটি ঘর, এবং অন্যটি মহাকাশে একটি ভবিষ্যত সভা কক্ষ।
স্থানিক বুদ্ধিমত্তার পথ

মার্বেল চারটি সাবস্ক্রিপশন স্তরের মাধ্যমে উপলব্ধ: বিনামূল্যে (টেক্সট, চিত্র, বা প্যানোরামা থেকে চার প্রজন্ম), স্ট্যান্ডার্ড ($20/মাস, 12 প্রজন্ম প্লাস মাল্টি-ইমেজ/ভিডিও ইনপুট এবং উন্নত সম্পাদনা), প্রো ($35/মাস, দৃশ্য সম্প্রসারণ এবং বাণিজ্যিক অধিকার সহ 25 প্রজন্ম), এবং সর্বোচ্চ ($95/মাস, সমস্ত প্রজন্মের বৈশিষ্ট্য এবং 7)।
জনসন মনে করেন মার্বেলের প্রাথমিক ব্যবহারের ক্ষেত্রে গেমিং, ফিল্মের ভিজ্যুয়াল ইফেক্ট এবং ভার্চুয়াল রিয়েলিটি হবে।
গেম ডেভেলপারদের প্রযুক্তি সম্পর্কে মিশ্র অনুভূতি রয়েছে। একটি সাম্প্রতিক গেম ডেভেলপারস কনফারেন্স সার্ভে এক তৃতীয়াংশ উত্তরদাতারা বিশ্বাস করেন যে জেনারেটিভ এআই গেমস শিল্পে নেতিবাচক প্রভাব ফেলে – আগের বছরের সমীক্ষার চেয়ে 12% বেশি। বুদ্ধিবৃত্তিক সম্পত্তি চুরি, শক্তি খরচ এবং AI-উত্পাদিত সামগ্রী থেকে গুণমান হ্রাস সম্প্রচারিত শীর্ষ উদ্বেগের মধ্যে ছিল। এবং গত বছর, ক তারযুক্ত তদন্তে দেখা গেছে অ্যাক্টিভিশন ব্লিজার্ডের মতো গেম স্টুডিওগুলি কোণ কাটা এবং অ্যাট্রিশনের বিরুদ্ধে লড়াই করতে AI ব্যবহার করছে।
গেমিং-এ, জনসন ডেভেলপারদের মার্বেল ব্যবহার করে ব্যাকগ্রাউন্ড এনভায়রনমেন্ট এবং অ্যাম্বিয়েন্ট স্পেস তৈরি করতে দেখেন এবং তারপর ইন্টারেক্টিভ উপাদান, যুক্তি এবং কোড যোগ করতে ইউনিটি বা অবাস্তব ইঞ্জিনের মতো গেম ইঞ্জিনে সেই সম্পদগুলি আমদানি করে।
“এটি গেমিংয়ের জন্য পুরো বিদ্যমান পাইপলাইনটি প্রতিস্থাপন করার জন্য ডিজাইন করা হয়নি, তবে আপনাকে কেবল এমন সম্পদ দেওয়ার জন্য যা আপনি সেই পাইপলাইনে ড্রপ করতে পারেন,” তিনি বলেছিলেন।
VFX কাজের জন্য, মার্বেল অসামঞ্জস্যতা এবং দুর্বল ক্যামেরা নিয়ন্ত্রণকে পাশ কাটিয়ে দেয় যা জনসন অনুসারে AI ভিডিও জেনারেটরকে আঘাত করে। এর 3D সম্পদ শিল্পীদের মঞ্চের দৃশ্য এবং ফ্রেম-নিখুঁত নির্ভুলতার সাথে ক্যামেরার গতিবিধি নিয়ন্ত্রণ করতে দেয়, তিনি বলেন।
যদিও জনসন বলেছিলেন যে ওয়ার্ল্ড ল্যাবস এখন ভার্চুয়াল রিয়েলিটি (ভিআর) অ্যাপ্লিকেশনগুলিতে ফোকাস করছে না, তিনি উল্লেখ করেছেন যে শিল্পটি “কন্টেন্টের জন্য ক্ষুধার্ত” এবং উত্তেজিত লঞ্চ সম্পর্কে। মার্বেল ইতিমধ্যেই ভিশন প্রো এবং কোয়েস্ট 3 ভিআর হেডসেটের সাথে সামঞ্জস্যপূর্ণ, এবং প্রতিটি উত্পন্ন বিশ্ব আজ VR-এ দেখা যেতে পারে।
রোবোটিক্সের জন্য মার্বেলের সম্ভাব্য ব্যবহারের ক্ষেত্রেও থাকতে পারে। জনসন উল্লেখ করেছেন যে ইমেজ এবং ভিডিও জেনারেশনের বিপরীতে, রোবোটিক্সের প্রশিক্ষণ ডেটার একটি বড় সংগ্রহস্থলের সুবিধা নেই। কিন্তু মার্বেলের মতো জেনারেটরের সাহায্যে প্রশিক্ষণের পরিবেশ অনুকরণ করা সহজ হয়ে যায়।
অনুযায়ী ক সাম্প্রতিক ইশতেহার ফেই-ফেই লি, ওয়ার্ল্ড ল্যাবসের সিইও এবং সহ-প্রতিষ্ঠাতা দ্বারা, মার্বেল “সত্যিই স্থানিকভাবে বুদ্ধিমান বিশ্ব মডেল” তৈরির প্রথম পদক্ষেপের প্রতিনিধিত্ব করে।
লি বিশ্বাস করেন “বিশ্ব মডেলের পরবর্তী প্রজন্ম মেশিনগুলিকে সম্পূর্ণ নতুন স্তরে স্থানিক বুদ্ধিমত্তা অর্জন করতে সক্ষম করবে।” যদি বড় ভাষার মডেলগুলি মেশিনগুলিকে পড়তে এবং লিখতে শেখাতে পারে, লি আশা করেন মার্বেলের মতো সিস্টেমগুলি তাদের দেখতে এবং তৈরি করতে শেখাতে পারে। তিনি বলেছেন যে জিনিসগুলি কীভাবে বিদ্যমান এবং ত্রিমাত্রিক স্থানগুলিতে ইন্টারঅ্যাক্ট করে তা বোঝার ক্ষমতা অবশেষে মেশিনগুলিকে গেমিং এবং রোবোটিক্স এবং এমনকি বিজ্ঞান এবং ওষুধের বাইরেও সাফল্য আনতে সহায়তা করতে পারে।
“আমাদের সত্যিকারের বুদ্ধিমান মেশিনের স্বপ্ন স্থানিক বুদ্ধিমত্তা ছাড়া সম্পূর্ণ হবে না,” লি লিখেছেন।
একটি সংবেদনশীল টিপ বা গোপন নথি পেয়েছেন? আমরা এআই ইন্ডাস্ট্রির অভ্যন্তরীণ কর্মকাণ্ড সম্পর্কে রিপোর্ট করছি — যে কোম্পানিগুলি এর ভবিষ্যৎ গঠন করছে তাদের সিদ্ধান্তের দ্বারা প্রভাবিত ব্যক্তিদের কাছে। রেবেকা বেলানের কাছে পৌঁছান rebecca.bellan@techcrunch.com অথবা রাসেল ব্র্যান্ডম russell.brandom@techcrunch.com-এ। নিরাপদ যোগাযোগের জন্য, আপনি @rebeccabellan.491 এ সিগন্যালের মাধ্যমে তাদের সাথে যোগাযোগ করতে পারেন এবং রাসেলব্র্যান্ডম.49.





