20Aug

Sistemul de viziune artificială MIT își dă seama la ce privește singur

Viziunea robotică este deja destul de bună, presupunând că este utilizată în limitele înguste ale aplicației pentru care a fost proiectată. Este în regulă pentru mașinile care efectuează o mișcare specifică din nou și din nou, cum ar fi ridicarea unui obiect de pe o linie de asamblare și plasarea acestuia într-un coș. Cu toate acestea, pentru ca roboții să devină suficient de utili pentru a nu doar să împacheteze cutii în depozite, ci să ne ajute de fapt în propriile case, ei vor trebui să nu mai fie atât de miopi. Și aici intervine sistemul „DON” al MIT.

DON sau „Dense Object Nets” este o formă nouă de viziune artificială dezvoltată la MIT Computer Science and Artificial Intelligence Laboratory (CSAIL). Acesta generează o „foaie de parcurs vizuală” -- practic, colecții de puncte de date vizuale aranjate ca coordonate. Sistemul va uni, de asemenea, fiecare dintre aceste seturi de coordonate individuale într-un set de coordonate mai mare, în același mod în care telefonul poate combina numeroase fotografii într-o singură imagine panoramică. Acest lucru permite sistemului să înțeleagă mai bine și mai intuitiv forma obiectului și modul în care funcționează în contextul mediului înconjurător.

„La cel mai gros nivel, cel mai înalt nivel, ceea ce ai obține de la sistemul tău de viziune computerizată este detectarea obiectelor”, a declarat pentru Engadget studentul doctorand Lucas Manuelli, autorul lucrării. „Următorul cel mai bun nivel ar fi etichetarea pixelilor. Deci, asta ar spune, bine, toți acești pixeli sunt o parte a unei persoane sau o parte a drumului sau a trotuarului. Primele două niveluri sunt cam mult din ceea ce ar folosi sistemele de mașini cu conducere autonomă.”

„Dar dacă încerci de fapt să interacționezi cu un obiect într-un anumit mod, cum ar fi să apuci un pantof într-un anumit mod sau ia o cană, a continuat el, „apoi doar dacă ai o căsuță de delimitare sau doar toți acești pixeli corespund cănii, nu-i așa. suficient. Sistemul nostru este într-adevăr despre intrarea la nivelul mai fin de detalii în cadrul obiectului... acest tip de informații este necesar pentru a efectua sarcini de manipulare mai avansate.”

Adică, sistemul DON va permite unui robot să privească o ceașcă de cafea, să se orienteze corect spre mâner și realizați că partea de jos a cănii trebuie să rămână îndreptată în jos atunci când robotul ridică ceașca pentru a evita vărsarea acesteia continuturi. În plus, sistemul va permite unui robot să aleagă un anumit obiect dintr-o grămadă de obiecte similare.

„Multe abordări ale manipulării nu pot identifica părți specifice ale unui obiect prin numeroasele orientări pe care obiectul le poate întâlni”, a scris Manuelli în studiu. „De exemplu, algoritmii existenți ar fi incapabili să apuce o cană de mâner, mai ales dacă cana ar putea fi în mai multe orientări, cum ar fi în poziție verticală sau pe o parte.”

Sistemul se bazează pe un senzor RGB-D care are o cameră combinată cu adâncime RGB. Cel mai bine, sistemul se antrenează singur. Nu este nevoie să alimentezi AI cu sute și mii de imagini ale unui obiect către DON pentru a-l învăța. Dacă doriți ca sistemul să recunoască o cizmă maro, pur și simplu puneți robotul într-o cameră cu o cizmă maro pentru puțin timp. Sistemul va încercui automat cizma, făcând fotografii de referință pe care le folosește pentru a genera punctele de coordonate, apoi se antrenează pe baza a ceea ce este văzut. Întregul proces durează mai puțin de o oră.

„În fabrici, roboții au adesea nevoie de alimentatoare complexe de piese pentru a funcționa în mod fiabil”, a scris Manuelli. „Dar un sistem ca acesta care poate înțelege orientările obiectelor ar putea doar să facă o fotografie și să poată înțelege și ajusta obiectul în consecință.”

Tehnologia este încă în fază incipientă, așa că nu vă ține respirația pentru ca servitoarele robot să vă golească mașina de spălat vase în curând. Dar, în cele din urmă, Manuelli speră ca aceste mașini, cu vederea și coordonarea lor îmbunătățite, să devină un membru al gospodăriei tale (de produse).

Imagini: MIT CSAIL