যখন Microsoft Corp. 2019 সালে OpenAI-তে $1 বিলিয়ন বিনিয়োগ করেছে, এটি কৃত্রিম বুদ্ধিমত্তা গবেষণা স্টার্টআপের জন্য একটি বিশাল, অত্যাধুনিক সুপার কম্পিউটার তৈরি করতে সম্মত হয়েছে। একমাত্র সমস্যা: মাইক্রোসফ্টের কাছে ওপেনএআই-এর প্রয়োজনীয় কিছু ছিল না এবং পুরোপুরি নিশ্চিত ছিল না যে এটি ব্রেক না করেই তার Azure ক্লাউড পরিষেবাতে বড় কিছু তৈরি করতে পারে।
OpenAI একটি ক্রমবর্ধমান বড় সেট প্রশিক্ষণের চেষ্টা করছিল কৃত্রিম বুদ্ধিমত্তা প্রোগ্রামগুলিকে মডেল বলা হয়, যেগুলি বেশি পরিমাণে ডেটা গ্রহণ করছিল এবং আরও বেশি করে প্যারামিটার শিখছিল, এআই সিস্টেমকে প্রশিক্ষণ এবং পুনঃপ্রশিক্ষণের মাধ্যমে ভেরিয়েবলগুলিকে মসৃণ করতে দেয়। এর মানে হল OpenAI শক্তিশালী অ্যাক্সেসের প্রয়োজন ক্লাউড কম্পিউটিং দীর্ঘমেয়াদী সেবা।
সেই চ্যালেঞ্জ মোকাবেলায় মাইক্রোসফট হাজার হাজার এনভিডিয়া কর্পোরেশন নিয়োগ করেছে। কে-এর A100 গ্রাফিক্স চিপস — AI মডেলের প্রশিক্ষণের জন্য ওয়ার্কহরস –কে একসাথে স্ট্রিং করার উপায় খুঁজে বের করতে হয়েছিল এবং পাওয়ার বিভ্রাট রোধ করতে র্যাকে সার্ভারের অবস্থান পরিবর্তন করতে হয়েছিল। স্কট গুথ্রি, মাইক্রোসফ্টের এক্সিকিউটিভ ভাইস প্রেসিডেন্ট WHO ক্লাউড এবং এআই প্রকল্পের জন্য একটি নির্দিষ্ট খরচ দেবে না, তবে বলেছে “এটি সম্ভবত কয়েকশ মিলিয়ন ডলারের চেয়ে বড়”।
Azure AI ইনফ্রাস্ট্রাকচারের মাইক্রোসফটের জেনারেল ম্যানেজার নিধি চ্যাপেল বলেন, “আমরা একটি সিস্টেম আর্কিটেকচার তৈরি করেছি যা খুব বড় পরিসরে কাজ করতে পারে এবং নির্ভরযোগ্য হতে পারে। এটিই ChatGPT-কে সম্ভব করেছে।” অনেক, আরো অনেক হতে যাচ্ছে.
প্রযুক্তিটি OpenAI-কে ChatGPT প্রকাশ করতে দেয়, ভাইরাল চ্যাটবট যা নভেম্বরে জনসাধারণের কাছে যাওয়ার কয়েক দিনের মধ্যে 1 মিলিয়নেরও বেশি ব্যবহারকারীকে আকৃষ্ট করেছিল এবং এখন বিলিয়নেয়ার হেজ ফান্ডের প্রতিষ্ঠাতা কেন গ্রিফিন দ্বারা পরিচালিত অন্যান্য কোম্পানির ব্যবসায়িক মডেলগুলিকে খাওয়াচ্ছে৷ পুলিং ফর – ডেলিভারি পরিষেবা৷ Instacart Inc. ChatGPT-এর মতো জেনারেটিভ এআই টুলগুলি ব্যবসা এবং ভোক্তাদের কাছ থেকে আগ্রহ বাড়ায়, ক্লাউড পরিষেবা প্রদানকারীদের উপর আরও চাপ পড়বে যেমন মাইক্রোসফট, আমাজন, com inc এবং বর্ণমালা কালি গুগল তাদের ডেটা সেন্টারগুলি প্রয়োজনীয় বিশাল কম্পিউটিং শক্তি সরবরাহ করতে পারে তা নিশ্চিত করতে।
এখন মাইক্রোসফট ওপেনএআই-এর জন্য তৈরি করা সম্পদের একই সেট ব্যবহার করে নতুন সহ নিজস্ব বৃহৎ কৃত্রিম বুদ্ধিমত্তার মডেলগুলিকে প্রশিক্ষণ ও চালানোর জন্য বিং অনুসন্ধান বটটি গত মাসে চালু করা হয়েছিল। এটি অন্যান্য গ্রাহকদের কাছে সিস্টেম বিক্রি করে। সফ্টওয়্যার জায়ান্টটি ইতিমধ্যেই পরবর্তী প্রজন্মের AI সুপারকম্পিউটারগুলিতে কাজ করছে, OpenAI এর সাথে একটি সম্প্রসারিত চুক্তির অংশ যেখানে মাইক্রোসফ্ট তার বিনিয়োগে $10 বিলিয়ন যোগ করেছে।
গুথরি বলেছেন, “আমরা তাদের একটি কাস্টম জিনিস তৈরি করিনি – এটি একটি কাস্টম জিনিস হিসাবে শুরু হয়েছিল, তবে আমরা এটিকে সর্বদা একটি সাধারণ উপায়ে তৈরি করেছি যাতে যে কেউ একটি বড় ভাষার মডেলকে প্রশিক্ষণ দিতে চায় তারা একই উন্নতি করতে পারে।” সুবিধা নিন।” একটি সাক্ষাৎকারে “এটা সত্যিই সাহায্য করেছে আমরা বিস্তৃতভাবে বলতে গেলে, AI এর জন্য আরও ভাল ক্লাউড হয়ে উঠুন।”
স্কেলে এআই মডেলের প্রশিক্ষণের জন্য একটি একক অবস্থানে সংযুক্ত গ্রাফিক্স প্রসেসিং ইউনিটগুলির একটি বড় পুল প্রয়োজন যেমন AI সুপার কম্পিউটার মাইক্রোসফ্ট অ্যাসেম্বল করা। একবার একটি মডেল ব্যবহার করা হলে, ব্যবহারকারীদের জিজ্ঞাসা করা সমস্ত প্রশ্নের উত্তর দেওয়ার জন্য – যাকে অনুমান বলা হয় – একটি সামান্য ভিন্ন সেট আপ প্রয়োজন৷ মাইক্রোসফ্টও অনুমান করার জন্য গ্রাফিক্স চিপ স্থাপন করে, কিন্তু সেই প্রসেসরগুলি — তাদের শত শত — ভৌগলিকভাবে কোম্পানির 60 টিরও বেশি অঞ্চল ডেটা সেন্টার জুড়ে ছড়িয়ে রয়েছে৷ এখন সংস্থাটি সর্বশেষ যুক্ত করছে এনভিডিয়া গ্রাফিক্স চিপ — H100 — AI ওয়ার্কলোডের জন্য এবং Nvidia-এর InfiniBand নেটওয়ার্কিং প্রযুক্তির সর্বশেষ সংস্করণ যাতে আরও দ্রুত ডেটা শেয়ার করা যায়, মাইক্রোসফট সোমবার একটি ব্লগ পোস্টে বলেছে।
নতুন বিং বর্তমানে প্রিভিউতে রয়েছে এবং মাইক্রোসফ্ট ধীরে ধীরে অপেক্ষা তালিকা থেকে আরও ব্যবহারকারী যোগ করছে। গুথরির দল প্রায় দুই ডজন কর্মচারীর সাথে একটি দৈনিক মিটিং করে, যাদেরকে তারা “পিট ক্রু” বলে ডাকা হয়েছে যান্ত্রিকদের গ্রুপের পরে যারা রেসের মধ্যে রেসের গাড়িগুলি সুর করে। গ্রুপের কাজ হল কীভাবে দ্রুত বিপুল পরিমাণ কম্পিউটিং ক্ষমতা অনলাইনে আনতে হয় তা বের করা, পাশাপাশি সমস্যা দেখা দেওয়ার সাথে সাথে সমাধান করা।
“এটা অনেকটা হাড্ডাহাড্ডি ধরণের জিনিস যেখানে এটির মতো, ‘আরে, কারো কাছে একটি দুর্দান্ত ধারণা আছে, আসুন আজ এটিকে টেবিলে রাখি, এবং এটি নিয়ে আলোচনা করি এবং এটি বের করি, ঠিক আছে, আমরা কি এখানে আছি? আমি কি কয়েকের জন্য শেভ করতে পারি? মিনিট?” আমরা কয়েক ঘন্টা শেভ করতে পারি? কিছু দিন?’ গুথরি বলেন।
একটি ক্লাউড পরিষেবা হাজার হাজার বিভিন্ন অংশ এবং বস্তুর উপর নির্ভর করে – সার্ভারের পৃথক টুকরো, পাইপ, ভবনের জন্য কংক্রিট, বিভিন্ন ধাতু এবং খনিজ – এবং যে কোনও একটি উপাদানের বিলম্ব বা সংক্ষিপ্ত সরবরাহ, তা যতই ছোট হোক না কেন, সাধারণ৷ না, এটি হতে পারে৷ সবকিছু নষ্ট করে। , সম্প্রতি, পিট ক্রুদের তারের ট্রে-র ঘাটতির সাথে লড়াই করতে হয়েছে – ঝুড়ির মতো কনট্রাপশন যা মেশিন থেকে আসা তারগুলি ধরে রাখে। তাই তারা একটি নতুন কেবল ট্রে ডিজাইন করেছে যা মাইক্রোসফ্ট নিজেরাই তৈরি করতে পারে বা কেনার জন্য কোথাও খুঁজে পেতে পারে। গুথরি বলেছেন যে তারা বিশ্বজুড়ে বিদ্যমান ডেটা সেন্টারগুলিতে যতটা সম্ভব সার্ভারকে স্কুইশ করার উপায় নিয়েও কাজ করেছে যাতে তাদের নতুন বিল্ডিংয়ের জন্য অপেক্ষা করতে না হয়।
ওপেনএআই বা মাইক্রোসফ্ট যখন একটি বড় এআই মডেলকে প্রশিক্ষণ দিচ্ছে, তখন কাজটি একবারে করা হয়। এটি সমস্ত GPU গুলি জুড়ে বিভক্ত এবং কিছু সময়ে, ইউনিটগুলি তাদের করা কাজ ভাগ করে নেওয়ার জন্য একে অপরের সাথে কথা বলতে হবে। এআই সুপার কম্পিউটারের জন্য, মাইক্রোসফ্টকে নিশ্চিত করতে হয়েছিল যে সমস্ত চিপগুলির মধ্যে যোগাযোগ পরিচালনা করে এমন নেটওয়ার্কিং গিয়ারটি লোড পরিচালনা করতে পারে এবং এটিকে এমন সফ্টওয়্যার বিকাশ করতে হয়েছিল যা GPU এবং নেটওয়ার্কিং সরঞ্জামগুলির সর্বোত্তম ব্যবহার করে। সংস্থাটি এখন এমন সফ্টওয়্যার নিয়ে এসেছে যা এটিকে ট্রিলিয়ন প্যারামিটার সহ মডেলগুলিকে প্রশিক্ষণ দিতে দেয়৷
যেহেতু মেশিনগুলি একসাথে জ্বলে, মাইক্রোসফ্টকে সেগুলি কোথায় রাখা হয়েছিল এবং কোথায় পাওয়ার সাপ্লাইগুলি অবস্থিত তা নিয়ে ভাবতে হয়েছিল। অন্যথায় আপনি একই সময়ে রান্নাঘরে মাইক্রোওয়েভ, টোস্টার এবং ভ্যাকুয়াম ক্লিনার চালু করলে কী ঘটে তার একটি ডেটা সেন্টার সংস্করণের সাথে শেষ হবে, গুথরি বলেছিলেন।
অ্যাজিউর গ্লোবাল ইনফ্রাস্ট্রাকচারের ডিরেক্টর অ্যালিস্টার স্পিয়ার্স বলেন, কোম্পানীকে নিশ্চিত করতে হবে যে এটি শীতল আবহাওয়ায় বাষ্পীভবন, বাইরের বাতাস এবং গরম আবহাওয়ায় উচ্চ প্রযুক্তির সোয়াম্প কুলার ব্যবহার করে সেই সমস্ত মেশিন এবং চিপগুলিকে ঠান্ডা করতে পারে।
গুথরি বলেছেন যে মাইক্রোসফ্ট অপ্টিমাইজ করা সার্ভার এবং চিপ ডিজাইন এবং যে কোনও গতি লাভ, দক্ষতা এবং খরচ-সঞ্চয় কমানোর জন্য তার সাপ্লাই চেইন অপ্টিমাইজ করার উপায়গুলিতে কাজ চালিয়ে যাবে।
“এই মুহূর্তে যে মডেলটি বিশ্বকে দোলা দিচ্ছে সেটি একটি সুপার কম্পিউটারে তৈরি করা হয়েছে যা আমরা কয়েক বছর আগে তৈরি করা শুরু করেছি৷ নতুন মডেলগুলি তৈরি করা হবে একটি নতুন সুপার কম্পিউটারে যা আমরা এখন প্রশিক্ষণ দিচ্ছি, যা অনেক বড় এবং আরও বেশি পরিমার্জন করতে সক্ষম হবে৷ ,” সে বলেছিল.