Inovatori din Michigan revoluționează AI cu Sapient Intelligence
William Chen și Guan Wang, doi tineri inovatori din Michigan, refuză o ofertă de milioane de dolari de la Elon Musk pentru a-și dezvolta propriul proiect de inteligență artificială. Cei doi, fondatorii Sapient Intelligence, s-au cunoscut în liceu și au decis să urmărească aceleași “metagoals” ambițioase.
Chen a spus pentru revistă: “Într-o zi, vom avea un AI mai inteligent decât oamenii. Dacă nu o facem noi, o va face altcineva. Sperăm că vom fi primii care să reușim asta.”
Modelul de Raționament Ierarhic (HRM) dezvoltat de Sapient Intelligence a depășit sistemele de la OpenAI, Anthropic și DeepSeek într-o serie de teste de raționament abstract. Cu o arhitectură inovatoare, diferită de transformatoarele tradiționale, HRM folosește o structură recurentă în două părți, imită raționamentul uman și este planificată extinderea companiei în Statele Unite.
După liceu, Chen și Wang au studiat la Universitatea Tsinghua din Beijing, unde, cu sprijinul facultății, au dezvoltat OpenChat. Acest model de limbaj a atras atenția pentru capacitatea sa de a se îmbunătăți prin îmbunătățirea învățării prin întărire, câștigând recunoaștere în mediul academic.
Inovare și Recunoaștere în Modele AI
Succesul OpenChat a determinat oferta atractivă de la xAI al lui Elon Musk, pe care studenții au refuzat-o. Această decizie le-a permis să dezvolte mai departe HRM, un model care se remarcă în sarcinile de raționament abstract.
Prototipul HRM cu doar 27 de milioane de parametri a depășit în performanță sistemele majore existente, reușind să rezolve provocări complexe precum puzzle-urile Sudoku avansate și benchmark-ul ARC-AGI. “A fost uimitor,” a spus Chen. “Doar cu o schimbare în arhitectură, modelul a obținut o adâncime de raționament considerabilă.”
Arhitectura Revoluționară a AI-ului
Diferit de transformatoarele tradiționale care se bazează pe predicții statistice, HRM imită raționamentul uman printr-o structură recurentă în două părți. Aceasta combină raționamentul deliberat cu reacții reflexive rapide. “Nu este vorba de ghicit,” a explicat Chen. “Este raționament.”
Modelul HRM are mai puține halucinații decât modelele de limbaj obișnuite și se evidențiază în domenii precum prognoza meteo, tranzacționarea cantitativă și monitorizarea medicală. Sapient Intelligence intenționează să se extindă și să deschidă un birou în SUA curând, demonstrând un angajament puternic pentru inovație și progres în inteligența artificială.