
گوگل کلود با معرفی تراشه Ironwood و ماشینهای Axion سرعت و کارایی زیرساخت هوش مصنوعی را در مقیاس بزرگ افزایش میدهد.
به گزارش تجارت نیوز، در تازهترین اطلاعرسانی گوگل کلود (Google Cloud)، از در دسترس قرار گرفتن رسمی نسل هفتم TPU، با نام Ironwood TPU و نیز مجموعه جدیدی از ماشینهای مجازی مبتنی بر معماری Arm، با نام Axion CPU، رونمایی شد. این محصولات با وعده ارتقای قابل توجه در عملکرد، کارایی انرژی، و کاهش هزینهها، قرار است زیرساختهای هوش مصنوعی مقیاس بزرگ را متحول کنند.
Ironwood، «قدرت خام» برای آموزش و استفاده از مدلها
Ironwood بهطور خاص برای بارهای کاری سنگین طراحی شده است؛ از آموزش مدلهای عظیم تا یادگیری تقویتی پیچیده و نیز سرو مدلهای هوش مصنوعی با تاخیر بسیار کم.
گوگل اعلام کرده که این TPU در مقایسه با TPU v5p ده برابر عملکرد پیک دارد، و نسبت به TPU v6e (با نام «Trillium») بیش از چهار برابر عملکرد بهتر در هر چیپ برای آموزش و استنتاج فراهم میکند.
یکی از ویژگیهای برجسته Ironwood توانمندی آن در تشکیل «سوپرپاد» است: اتصال هزاران چیپ به هم با شبکهای فوقپیشرفته (Inter-Chip Interconnect) با پهنای باند بسیار بالا، که اجازه میدهد تا ۹٬۲۱۶ چیپ در یک پاد واحد بهصورت هماهنگ کار کنند.
در مقیاس کامل، این سیستم قادر است قدرت محاسباتی بیسابقهای را ارائه دهد؛ مناسب برای مدلهایی با میلیاردها پارامتر و کارهای استنتاج (inference) بسیار سنگین. پاسخ اولیه بازار به Ironwood بسیار مثبت بوده است؛ بهعنوان مثال شرکت Anthropic قصد دارد بر اساس این زیرساخت، تا میلیونها TPU را برای ارائه مدلهای خود در مقیاس گسترده استفاده کند.
همچنین شرکتهای فعال در حوزههای تولید تصویر و ویدیو یا مدلهای چندرسانهای میگویند Ironwood میتواند تولید محتوای با کیفیتتر و با فریمریت و دقت بالاتر را ممکن کند.
Axion، کامپیوتر عمومی با بهرهوری و صرفه اقتصادی
در کنار شتابدهنده تخصصی TPU، گوگل کلود مجموعه جدیدی از ماشینهای مجازی مبتنی بر Axion را نیز معرفی کرده است. این CPU های سفارشی بر پایه معماری Arm طراحی شدهاند تا برای کارهای عمومیتر، مانند سرویسهای وب، پایگاه داده، پردازش دستهای، آمادهسازی داده، مورد استفاده قرار گیرند. از جمله گزینههای فعلی میتوان به ماشین مجازی N4A (در حالت پیشنمایش) اشاره کرد که نسبت قیمت به کارایی آن تا دو برابر بهتر از ماشینهای مبتنی بر x86 نسل فعلی است.
در آینده نیز نسخه bare-metal با نام C4A metal در دسترس قرار میگیرد؛ این نمونه برای محیطهایی با نیازهای خاص مانند توسعه نرمافزار نیتیو ARM، شبیهسازی، یا بارهای کاری حساس به پیکربندی سختافزاری مناسب است.
سه گزینه اصلی در پورتفولیوی Axion شامل N4A، C4A، و C4A metal هستند؛ این تنوع به کاربران کمک میکند بدون صرف هزینههای زیاد یا قربانی کردن عملکرد، زیرساخت خود را با توجه به نیاز دقیق انتخاب کنند.
به طور مشخص، Axion بهعنوان ستون فقرات عملیاتی برای بارهای کاری روزمره، مانند آمادهسازی داده، میزبانی سرویسها، پردازش دادههای انبوه عمل میکند؛ در حالی که Ironwood مسئولیت سنگین آموزش یا ارائه مدلهای هوش مصنوعی را بر عهده دارد.
رویکرد سطح سیستمی: همطراحی سختافزار و نرمافزار
گوگل کلود تاکید کرده که Ironwood و Axion تنها سختافزار نیستند، بلکه بخشی از سیستمی گسترده بهنام AI Hypercomputer هستند؛ سیستمی که محاسبات، شبکه، ذخیرهسازی و نرمافزار را با هم هماهنگ میکند تا کارایی، مقیاسپذیری و بهرهوری انرژی را به نهایت برساند.
در لایه نرمافزاری، امکاناتی مانند ادغام با Google Kubernetes Engine برای زمانبندی هوشمند و مدیریت خوشهها، پشتیبانی از چارچوبهای متنباز برای مدلهای زبان بزرگ مثل MaxText، و نیز تسهیل اجرای استنتاج با استفاده از ترکیب GPU و TPU یا بهطور مستقل در vLLM و استفاده از GKE Inference Gateway برای توزیع بار، دیده میشود.
این همطراحی سختافزار-نرمافزار باعث میشود مشتریان بتوانند از مزایای Ironwood به عنوان یک شتابدهنده بسیار قدرتمند بهره ببرند، بدون اینکه پیچیدگیهای فنی توسعه یا نگهداری زیرساخت به آنها تحمیل شود.
چشمانداز: تحول در زیرساختهای هوش مصنوعی
با عرضه Ironwood و Axion، Google Cloud خود را برای عصر جدیدی آماده کرده است؛ عصری که در آن نه فقط آموزش مدلهای عظیم، بلکه ارائه سریع، پاسخگو و مقرون به صرفه آنها به کاربران در مقیاس بزرگ اهمیت دارد. ترکیب این دو نوع زیرساخت، شتابدهنده تخصصی و محاسبات عمومی کمهزینه، انعطاف و توان عملیاتی گسترده برای شرکتها و توسعهدهندگان فراهم میآورد. این تغییر میتواند تاثیر زیادی بر صنعت هوش مصنوعی بگذارد: شرکتها میتوانند با هزینه کمتر، مقیاس بزرگتری را پوشش دهند؛ مدلهای پیچیدهتر و کاربردیتر تولید کنند؛ و در نهایت، تجربه کاربری بهتری برای سرویسها و محصولات مبتنی بر هوش مصنوعی فراهم آورند.