Az AI-ügynökök korántsem olyan okosak, mint hisszük

A Scale AI friss kutatása alaposan megkérdőjelezi azt az optimizmust, amellyel a vállalatok az AI-ügynököket a munkafolyamataikba integrálják. Az új benchmark eredményei szerint ezek az eszközök rendszeresen alulteljesítenek, amikor valódi, professzionális munkastandardokat kell teljesíteniük.

A vizsgálat komplex, többlépéses feladatokon mérte az AI-ügynökök teljesítményét – olyanokkal, amelyek tipikusan előfordulnak egy irodai vagy elemzői munkakörben. Az eredmény lesújtó: az ügynökök döntő többsége nem érte el azt a szintet, amelyet egy képzett munkavállaló rutinszerűen produkál. A hibák nem véletlenszerűek, hanem szisztematikusak – az eszközök különösen a kontextusfüggő döntéshozatalnál és a hosszabb munkafolyamatok kezelésénél vallanak kudarcot.

HR-szempontból ez az adat figyelmeztetés. Sok szervezet már most AI-ügynökökre tervezi átcsoportosítani kapacitásokat, és ez a döntés komoly tehetségmenedzsment-kockázatot hordoz. Ha az eszközök nem teljesítik az elvárásokat, a leépített vagy át nem képzett munkatársak hiányozni fognak. A HR-vezetőknek most kell kritikusan megvizsgálniuk, hogy a belső AI-adottságfelmérések valódi teljesítményen vagy marketingígéreteken alapulnak-e.