EnCompass برنامههای عامل هوش مصنوعی را با بازگشت و تلاشهای متعدد اجرا میکند و بهترین مجموعه خروجیهای تولید شده توسط LLM را پیدا میکند.
محققان سیستم EnCompass را معرفی کردهاند، سیستمی پیشگام که برای بهبود چشمگیر عملکرد عوامل هوش مصنوعی که بر مدلهای زبانی بزرگ (LLM) تکیه دارند طراحی شده است. برخلاف روشهای سنتی که یک دستور واحد اجرا و هر خروجیای را قبول میکنند، EnCompass یک رویکرد سیستماتیک "جستجو با بازگشت" را پیادهسازی میکند.
این سیستم با تلقی هر برنامه عامل هوش مصنوعی به عنوان درختی از مسیرهای اجرای ممکن کار میکند. در هر نقطه تصمیمگیری که LLM خروجی تولید میکند، EnCompass کیفیت نتیجه را ارزیابی میکند. اگر خروجی از آستانه اطمینان پایینتر باشد، سیستم به طور خودکار به آخرین نقطه تصمیمگیری بازمیگردد و با استراتژی جایگزینی تلاش مجدد میکند.
توسعهدهنده ارشد توضیح داد: "آن را مانند یک GPS تصور کنید که هنگام شناسایی ترافیک مسیر شما را تغییر میدهد. به جای دنبال کردن کورکورانه یک مسیر، EnCompass به طور مداوم ارزیابی مجدد میکند و مسیر بهینه را به بهترین پاسخ ممکن پیدا میکند."
در آزمونهای مقایسهای، EnCompass بهبودهای قابل توجهی نسبت به سیستمهای عامل پایه نشان داد، به ویژه در وظایفی که نیاز به استدلال چند مرحلهای، تولید کد و پرس و جوهای تحقیقاتی پیچیده دارند.