Rádió7

A Google DeepMind és a Boston Dynamics együttműködésének köszönhetően jelentős mérföldkőhöz érkezett az ipari robotika. A legújabb Gemini Robotics-ER 1.6 mesterséges intelligencia modell integrálásával a négylábú Spot robotok már képesek a gyárakban és raktárakban található analóg hőmérők, összetett mérőórák és folyadékszintek precíz leolvasására, valamint a betekintő ablakokon keresztüli vizuális ellenőrzésekre. Ez a technológiai ugrás az úgynevezett megtestesült következtetés területén hoz áttörést, ahol a gépeknek közvetlenül a fizikai valóságban kell komplex feladatokat megtervezniük és végrehajtaniuk.

A fejlődés kulcsa az úgynevezett „ügynöki látás” (agentic vision), amely a vizuális elemzést a kódlefuttatás képességével kombinálja, virtuális jegyzetfelületet hozva létre a képek vizsgálatához. Ennek köszönhetően az új modell elképesztő, 98%-os pontosságot ér el a műszerek értelmezésében, ami radikális javulás az elődmodell 23%-os, vagy a korábbi Gemini 3.0 Flash 67%-os eredményéhez képest. A rendszer ráadásul fejlett többnézetes következtetéssel dolgozik, azaz egyszerre több kamera képét szintetizálva térképezi fel a környezetét, miközben a zsúfolt terekben is drasztikusan csökkentették a téves észlelések, vagyis a hallucinációk számát.

A fokozott hatékonyság mellett a DeepMind az eddigi legbiztonságosabb robotikai modelljeként jellemezte az új szoftvert. A Gemini Robotics-ER 1.6 szigorúan betartja a fizikai biztonsági korlátokat, és sokkal pontosabban méri fel az emberi sérülések kockázatát a különféle munkafolyamatok során. Bár a robotok eddig a szigorúan szabályozott, monoton gyártósorokon voltak a leghatékonyabbak, ez az MI-alapú megújulás lehetővé teszi, hogy a jövőben önállóbb, rugalmasabb munkásként, kevésbé kontrollált és kiszámíthatatlan valós ipari környezetben is biztonságosan dolgozhassanak.

Kapcsolat