۵ رویداد مهم هوش مصنوعی در سال ۲۰۲۴ کدامند؟

انتظار می‌رود که هوش مصنوعی در سال ۲۰۲۴ رویداد‌های مهمی را پشت سر بگذارد. در این گزارش به بررسی پنج رویداد مهم می‌پردازیم.

تاریخ انتشار: ۱۵:۴۰ - ۱۵ دی ۱۴۰۲

سال ۲۰۲۳ یک نقطه عطف در تکامل فناوری بود و هوش مصنوعی مولد به جریان اصلی آن تبدیل شد. با آغاز سال ۲۰۲۴ انتظار می‌رود که چشم‌انداز هوش مصنوعی مولد به سرعت در حال تکامل یافتن باشد و مجموعه‌ای از رویداد‌ها را پشت سر بگذارد که تغییر فناوری و کاربرد‌های آن را نوید می‌دهند.

به گزارش ایسنا، این رویداد‌ها از پیشرفت در مدل‌های هوش مصنوعی چندوجهی گرفته تا ظهور مدل‌های زبانی کوچک، نه تنها چشم‌انداز فناوری را شکل می‌دهند، بلکه تعاملات، خلاقیت و درک پتانسیل هوش مصنوعی را دوباره تعریف می‌کنند.

در این گزارش، برترین رویداد‌های هوش مصنوعی مولد در سال ۲۰۲۴ را بررسی می‌کنیم.

۱. ظهور مدل‌های هوش مصنوعی چندوجهی

چت‌بات GPT۲ شرکت «OpenAI»، «لاما ۲» (LLama ۲) شرکت متا و هوش مصنوعی شرکت «میسترال ای‌آی» (Mistral AI) همگی نمونه‌هایی از پیشرفت در مدل‌های زبانی بزرگ بودند. این فناوری با کمک مدل‌های هوش مصنوعی چندوجهی، فراتر از متن حرکت می‌کند و به کاربران امکان می‌دهد تا محتوا را براساس متن، صدا، تصویر و ویدیو برای ایجاد محتوای جدید ترکیب کنند و مطابقت دهند. این روش شامل ترکیب داده‌هایی مانند تصویر، متن و گفتار با الگوریتم‌های پیشرفته برای پیش‌بینی و ایجاد نتایج است.

انتظار می‌رود در سال ۲۰۲۴، هوش مصنوعی چندوجهی به طور قابل توجهی تکامل یابد و تغییراتی را در قابلیت‌های هوش مصنوعی مولد ایجاد کند. این مدل‌ها فراتر از عملکرد‌های تک‌حالته سنتی پیش می‌روند و داده‌های متنوعی مانند تصویر، زبان و صدا را در خود جای می‌دهند. هوش مصنوعی در نتیجه انتقال یافتن به مدل‌های چندوجهی، شهودی‌تر و پویاتر می‌شود.

چت‌بات «GPT۴-۷» در حال حاضر میان مشترکین «ChatGPT Plus» به دلیل قابلیت‌های چندوجهی خود محبوب است. در سال ۲۰۲۴ می‌توان انتظار ظهور مدل‌های منبع باز مانند «LLava» را داشت.

۲. مدل‌های زبانی کوچک توانا و قوی

اگر سال ۲۰۲۳ سال مدل‌های زبان بزرگ بود، سال ۲۰۲۴ شاهد قدرت‌نمایی مدل‌های زبانی کوچک است. مدل‌های زبانی بزرگ با مجموعه بزرگی از داده‌ها مانند «کامن کرال» (Common Crawl) و «دِ پیل» (The Pile) آموزش می‌بینند. داده‌های این مجموعه‌ها از میلیارد‌ها وبسایت در دسترس عموم استخراج شده‌اند. اگرچه داده‌های مورد استفاده در آموزش مدل‌های زبانی بزرگ برای تولید محتوای معنادار و پیش‌بینی کلمه بعدی واقعا سودمند هستند، اما ماهیت آن‌ها از محتوای عمومی اینترنت حاصل می‌شود.

از سوی دیگر، مدل‌های زبانی کوچک با مجموعه داده‌های محدودتری آموزش داده می‌شوند. با وجود این، آن‌ها از منابع باکیفیت مانند کتاب‌های درسی، مجلات و محتوای معتبر تشکیل شده‌اند. این مدل‌ها از نظر تعداد پارامتر‌ها و همچنین نیاز‌های ذخیره‌سازی و حافظه کوچک‌تر هستند و این موجب می‌شود که آن‌ها با سخت‌افزار‌های کم‌قدرت و ارزان‌تری کار کنند. مدل‌های زبانی کوچک با وجود این که کسری از اندازه مدل‌های زبانی بزرگ را دارند، اما کیفیت محتوای آن‌ها با برخی از همتایان بزرگ‌تر قابل مقایسه است.

مدل‌های «PHI-۲» و «میسترال ۷بی» (Mistral ۷ B) شرکت مایکروسافت، دو مدل زبانی کوچک امیدوارکننده هستند که قدرت نسل بعدی برنامه‌های کاربردی هوش مصنوعی را تامین می‌کنند.

۳. ظهور عوامل خودمختار

عوامل خودمختار یک راهبرد نوآورانه برای ساخت مدل‌های هوش مصنوعی مولد هستند. این عوامل، برنامه‌های نرم‌افزاری مستقلی هستند که برای دستیابی به یک هدف خاص طراحی شده‌اند. هنگام در نظر گرفتن هوش مصنوعی مولد، توانایی عوامل مستقل برای تولید محتوای عاری از مداخله انسانی بر محدودیت‌های مرتبط با مهندسی مرسوم غلبه می‌کند.

الگوریتم‌های پیشرفته و روش‌های یادگیری ماشینی برای توسعه عوامل مستقل استفاده می‌شوند. این عوامل از داده‌ها برای یادگیری، سازگاری با موقعیت‌های جدید و تصمیم‌گیری با دخالت اندک انسان استفاده می‌کنند. به عنوان مثال، OpenAI مدل‌هایی را ابداع کرده است که از عوامل مستقل استفاده موثری می‌کنند و نشان‌دهنده پیشرفت قابل توجه در زمینه هوش مصنوعی هستند.

هوش مصنوعی چندوجهی که ترکیبی از روش‌های گوناگون هوش مصنوعی مانند پردازش زبان طبیعی، بینایی رایانه‌ای و یادگیری ماشینی است، اهمیت بسیاری در توسعه عوامل مستقل دارد. هوش مصنوعی چندوجهی می‌تواند با تحلیل داده‌های گوناگون به طور هم‌زمان و اعمال مفاهیم کنونی پیش‌بینی کند، اقداماتی را انجام دهد و تعامل مناسب‌تری داشته باشد.

چارچوب‌هایی مانند «لنگ‌چین» (LangChain) و «لاماایندکس» (LlamaIndex) برخی از مدل‌های محبوبی هستند که برای ساخت عوامل براساس مدل‌های زبانی بزرگ استفاده می‌شوند. در سال ۲۰۲۴ شاهد ظهور چارچوب‌های جدیدی خواهیم بود که از هوش مصنوعی چندوجهی بهره می‌برند.

۴. مدل‌های منبع باز قابل قیاس با مدل‌های انحصاری

انتظار می‌رود که در سال ۲۰۲۴، مدل‌های هوش مصنوعی باز و مولد به طور قابل توجهی تکامل پیدا کنند و برخی از پیش‌بینی‌ها نشان می‌دهند که آن‌ها با مدل‌های انحصاری قابل مقایسه خواهند بود. از سوی دیگر، مقایسه بین مدل‌های باز و انحصاری پیچیده است و به عوامل گوناگونی از جمله موارد استفاده خاص، منابع توسعه و داده‌های مورد استفاده برای آموزش مدل‌ها بستگی دارد.

مدل‌های «لاما ۲، ۷۰بی» (Llama ۲، ۷۰ B)، «فالکون ۱۸۰بی» (Falcon ۱۸۰۰ B) و «میسترال ۸ایکس۷بی» (Mixtral ۸ X ۷ B) شرکت میسترال ای‌آی در سال ۲۰۲۳ بسیار محبوب شدند و عملکرد آن‌ها با مدل‌های انحصاری مانند «GPT ۳.۵»، «کلاد ۲» (Claude ۲) و «ژوراسیک» (Jurrasic) قابل مقایسه بود.

در آینده، شکاف بین مدل‌های باز و مدل‌های انحصاری کاهش می‌یابد و یک گزینه عالی را برای میزبانی مدل‌های هوش مصنوعی در محیط‌های ترکیبی یا داخلی به شرکت‌ها ارائه می‌کند.

مدل‌های بعدی متا، میسترال ای‌آی و احتمالا شرکت‌های جدید در سال ۲۰۲۴ به عنوان جایگزین‌های مناسبی برای مدل‌های انحصاری موجود به عنوان واسط برنامه‌نویسی کاربردی ارائه خواهند شد.

۵. «ابر بومی» کلید رسیدن به هوش مصنوعی مولد

پلتفرم «کوبرنتیز» (Kubernetes) در حال حاضر یک محیط ترجیحی برای میزبانی مدل‌های هوش مصنوعی مولد است. انتظار می‌رود شرکت‌های مهمی مانند «هاگینگ فیس» (Hugging Face)، گوگل و OpenAI از زیرساخت‌های «ابر بومی» (Cloud Native) که توسط کوبرنتیز پشتیبانی می‌شوند، برای ارائه پلتفرم‌های هوش مصنوعی مولد استفاده کنند.

مدل‌هایی مانند «تکست جنریشن اینفرنس» (Text Generation Inference) شرکت هاگینگ فیس، «ری سرو» (Ray Serve) شرکت «انی‌اسکیل» (AnyScale) و «vLLM» در حال حاضر از اجرای زیرساخت‌های مورد نظر پشتیبانی می‌کنند. در سال ۲۰۲۴ شاهد بلوغ چارچوب‌ها، مدل‌ها و پلتفرم‌هایی خواهیم بود که در کوبرنتیز اجرا می‌شوند تا کل چرخه عمر مدل‌های پایه را مدیریت کنند. کاربران می‌توانند مدل‌های تولیدی را تحت پیش‌آموزش، تنظیم دقیق، استقرار و مقیاس‌بندی کارآمد قرار دهند.

از میان اخبار