شرکت مایکروسافت با سرمایهگذاری دهها میلیارد دلاری، از نسل جدید مراکز داده اختصاصی هوش مصنوعی خود در نقاط مختلف جهان رونمایی کرد؛ پروژهای که با هدف پشتیبانی از مدلهای پیشرفته هوش مصنوعی و خدمات ابری طراحی شده و بزرگترین نمونه آن در ویسکانسین آمریکا به بهرهبرداری رسیده است.
این هفته، شرکت مایکروسافت از مجموعهای از سرمایهگذاریهای زیرساختی و مراکز داده هدفمند خود رونمایی کرد که قرار است در سراسر جهان، نیروی محرکه پذیرش فناوری هوش مصنوعی و خدمات ابری باشند. نقطه عطف این برنامه، معرفی مرکز داده Fairwater در ایالت ویسکانسین آمریکا بود؛ مجموعهای که قرار است در اوایل سال آینده میلادی به بهرهبرداری برسد و نهتنها بزرگترین و پیچیدهترین کارخانه هوش مصنوعی مایکروسافت تا به امروز است، بلکه در زمینی بنا میشود که زمانی برای کارخانه بزرگ و ناکام شرکت «فاکسکان» در نظر گرفته شده بود. این اقدام نمادین، نشاندهنده گذار از تولید صنعتی سنتی به عصر کارخانههای دیجیتال است. علاوه بر این مرکز، چندین مرکز داده مشابه دیگر نیز در نقاط مختلف ایالات متحده در دست ساخت قرار دارند و این راهبرد جهانی، توسعه مراکزی در نروژ و بریتانیا را نیز شامل میشود. این پروژهها با سرمایهگذاری دهها میلیارد دلاری و صدها هزار تراشه پیشرفته، به شبکه جهانی ابری مایکروسافت با بیش از ۴۰۰ مرکز داده متصل خواهند شد.
یک مرکز داده هوش مصنوعی، برخلاف مراکز داده ابری سنتی که میزبان وبسایتها و برنامههای تجاری هستند، به طور خاص برای آموزش و اجرای مدلهای عظیم هوش مصنوعی طراحی شده و به عنوان یک ابررایانه یکپارچه و غولپیکر عمل میکند. برای درک مقیاس مرکز Fairwater در ویسکانسین، کافی است تصور کنید که این مجموعه در زمینی به وسعت ۳۱۵ هکتار احداث شده و سه ساختمان عظیم آن مجموعاً ۱.۲ میلیون فوت مربع مساحت دارند. در ساخت این سازه از حجم مصالحی معادل ۲۶.۵ میلیون پوند فولاد سازهای و ۱۲۰ مایل کابل زیرزمینی ولتاژ متوسط استفاده شده است. این مراکز، قدرت پردازشی لازم برای محصولات مایکروسافت مانند اوپنایآی و کوپایلت را فراهم میآورند.
قلب تپنده این مراکز، فرآیند آموزش مدلهای هوش مصنوعی است. این مدلها برای یادگیری، به همکاری هماهنگ هزاران رایانه متکی هستند که با استفاده از پردازندههای گرافیکی، محاسبات ریاضی پیچیده را به صورت موازی انجام میدهند. دادهها به شکل واحدهای کوچک اطلاعاتی به نام «توکن» به سیستم وارد میشوند و هوش مصنوعی با پردازش تریلیونها توکن، یاد میگیرد که الگوها را تشخیص دهد و پاسخهای دقیقتری تولید کند. این فرآیند تکرارشونده، شبیه به تمرین یک تیم ورزشی است که آنقدر یک حرکت را تکرار میکند تا در آن به تسلط کامل برسد. هدف اصلی در این میان، فعال نگه داشتن مداوم تراشهها است، زیرا هرگونه تأخیر در شبکه، کل فرآیند را کند میکند.
برای رسیدن به این هدف، زیرساخت این مراکز به شکلی کاملاً تخصصی طراحی شده است. هسته مرکزی آن از هزاران شتابدهنده هوش مصنوعی تشکیل شده که در کنار پردازندههای مرکزی و حافظه، بر روی بردهای سرور نصب شدهاند. این سرورها در رکها قرار گرفته و هر رک به سایر رکها متصل است تا خوشهای یکپارچه و عظیم شکل بگیرد. مرکز داده ویسکانسین از سرورهای پیشرفته انویدیا GB۲۰۰ بهره میبرد و هر رک آن شامل ۷۲ پردازنده گرافیکی انویدیا Blackwell است که قادر به پردازش ۸۶۵ هزار توکن در ثانیه است.
یکی از چالشهای اصلی در چنین مقیاسی، طراحی شبکه ارتباطی است. برای اینکه هزاران پردازنده بتوانند بدون تأخیر با یکدیگر صحبت کنند، مایکروسافت از شبکههای فوق سریع با سرعت ۸۰۰ گیگابیت بر ثانیه استفاده کرده است. همچنین برای کاهش تأخیر ناشی از فاصله فیزیکی، رکها در یک ساختار دو طبقه منحصربهفرد چیده شدهاند تا علاوه بر رکهای مجاور، به رکهای بالا و پایین خود نیز متصل باشند و مسیر ارتباطی کوتاهتر شود.
با توجه به گرمای زیادی که این حجم از پردازش تولید میکند، خنکسازی با هوا دیگر پاسخگو نیست. به همین دلیل، این مراکز از سیستمهای خنککننده مایع پیشرفته بهره میبرند. در این سیستم، مایع سرد از طریق لولههایی مستقیماً به داخل سرورها پمپاژ میشود و پس از جذب گرما، برای خنک شدن به بیرون منتقل شده و دوباره به چرخه بازمیگردد. این حلقه بسته باعث میشود که مصرف آب به حداقل برسد و بیش از ۹۰٪ ظرفیت این مراکز با این روش پایدار خنک میشوند.
چنین حجم پردازشی نیازمند زیرساخت ذخیرهسازی عظیمی است. سیستمهای ذخیرهسازی مرکز داده ویسکانسین به اندازه طول پنج زمین فوتبال وسعت دارند و هر حساب ذخیرهسازی آن میتواند بیش از ۲ میلیون تراکنش خواندن/نوشتن در ثانیه را پشتیبانی کند. این ظرفیت فوقالعاده تضمین میکند که دادههای مورد نیاز برای آموزش مدلها همیشه و بدون وقفه در دسترس پردازندهها باشند.
این مراکز داده به صورت جزیرههایی مجزا عمل نمیکنند، بلکه بخشی از یک شبکه جهانی هستند که از طریق شبکه گسترده مایکروسافت به یکدیگر متصل شدهاند. این اتصال به مشتریان اجازه میدهد تا از قدرت پردازشی چندین مرکز به صورت همزمان بهرهمند شوند و در عمل، یک ابررایانه توزیعشده و جهانی در اختیار داشته باشند؛ رویکردی که مفهوم ابررایانهها را از محدودیتهای یک ساختمان فیزیکی فراتر میبرد.

