EnCompass برنامه‌های عامل هوش مصنوعی را با بازگشت و تلاش‌های متعدد اجرا می‌کند و بهترین مجموعه خروجی‌های تولید شده توسط LLM را پیدا می‌کند.

محققان سیستم EnCompass را معرفی کرده‌اند، سیستمی پیشگام که برای بهبود چشمگیر عملکرد عوامل هوش مصنوعی که بر مدل‌های زبانی بزرگ (LLM) تکیه دارند طراحی شده است. برخلاف روش‌های سنتی که یک دستور واحد اجرا و هر خروجی‌ای را قبول می‌کنند، EnCompass یک رویکرد سیستماتیک "جستجو با بازگشت" را پیاده‌سازی می‌کند.

این سیستم با تلقی هر برنامه عامل هوش مصنوعی به عنوان درختی از مسیرهای اجرای ممکن کار می‌کند. در هر نقطه تصمیم‌گیری که LLM خروجی تولید می‌کند، EnCompass کیفیت نتیجه را ارزیابی می‌کند. اگر خروجی از آستانه اطمینان پایین‌تر باشد، سیستم به طور خودکار به آخرین نقطه تصمیم‌گیری بازمی‌گردد و با استراتژی جایگزینی تلاش مجدد می‌کند.

توسعه‌دهنده ارشد توضیح داد: "آن را مانند یک GPS تصور کنید که هنگام شناسایی ترافیک مسیر شما را تغییر می‌دهد. به جای دنبال کردن کورکورانه یک مسیر، EnCompass به طور مداوم ارزیابی مجدد می‌کند و مسیر بهینه را به بهترین پاسخ ممکن پیدا می‌کند."

در آزمون‌های مقایسه‌ای، EnCompass بهبودهای قابل توجهی نسبت به سیستم‌های عامل پایه نشان داد، به ویژه در وظایفی که نیاز به استدلال چند مرحله‌ای، تولید کد و پرس و جوهای تحقیقاتی پیچیده دارند.