24Aug

Meta sdílí model umělé inteligence, který dokáže detekovat objekty, které předtím neviděl

Umělá inteligence obvykle potřebuje být trénována na existujícím materiálu, aby detekovala objekty, ale Meta má způsob, jak pomocí technologie rozpoznat předměty bez pomoci. Gigant sociálních sítí má zveřejněno model umělé inteligence „Segment Anything“, který dokáže detekovat objekty na obrázcích a videích, i když nebyly součástí tréninkové sady. Položky můžete vybrat kliknutím na ně nebo pomocí textových výzev ve volném formátu. Tak jako Reutersvysvětluje, můžete zadat slovo „kočka“ a sledovat, jak AI zvýrazňuje všechny kočkovité šelmy na dané fotografii.

Model může také pracovat v tandemu s jinými modely. Může pomoci rekonstruovat objekt ve 3D pomocí jediného obrázku nebo kreslit z pohledů z náhlavní soupravy pro smíšenou realitu. Segment Anything může efektivně omezit potřebu dalšího školení AI.

Jak model AI, tak datový soubor bude možné stáhnout s nekomerční licencí. To znamená, že jej tvůrci nemohou použít pro produkty. Jde především o výzkum a rozšíření přístupu k technologii. Právě teď Meta používá podobnou technologii k moderování zakázaného obsahu, doporučování příspěvků a označování fotografií.

Vývojáři uznávají, že stávající model je chybný. Může postrádat jemnější detaily a není tak přesný při zjišťování hranic jako některé modely. A zatímco Segment Anything dokáže zpracovat výzvy v reálném čase, zasekne se, když je zapojeno náročné zpracování obrazu. Některé specializovanější nástroje umělé inteligence tento model ve svých oborech pravděpodobně překonávají, říká Meta.

Tuto AI neuvidíte v robotech nebo jiných zařízeních, kde je rychlá a přesná detekce objektů (obvykle) vitální. Modely jako tento však mohou stále pomoci v situacích, kdy je nepraktické spoléhat se výhradně na trénovací data. Sociální síť by mohla tuto technologii využít k udržení kroku s rychle rostoucím objemem obsahu. Když nic jiného, ​​ukazuje to, že Meta chce zobecnit počítačové vidění.

Meta není cizí sdílení objevů AI, jako je např překladatel pro nespisovné jazyky. Díky tomu je na společnost vyvíjen tlak, aby ukázala, že je v této kategorii stejně velkou velmocí jako technologická těžká váha jako Google a Microsoft. Už se to plánuje generativní AI „osoby“ pro své sociální aplikace a vynálezy, jako je Segment Anything, ukazují, že má několik vlastních výhod.