Apples utvecklade nya självkörande teknik för att upptäcka små hinder med LiDAR

Apple har hållit sin självkörande forskning hemlig i flera år, men nu har företaget publicerat några av sina autonoma tekniker för körningsprogramvara som förbättrar hinderupptäckten.

Publicerad den 17 november på det modererade vetenskapliga förtryckslageret arXiv av Apples artificiella intelligens- och maskininlärningsexperter Yin Zhou och Oncel Tuzel, beskrivs i uppsatsen att detektera små hinder med avkänningsmetoden Light Detection and Ranging (LiDAR).

Istället för att förlita sig på handgjorda funktionsrepresentationer (till exempel en fågelperspektivprojektion) föreslår Apples forskare en ny utbildningsbar djup arkitektur för punktmolnbaserad 3D-upptäckt. Det kallas VoxelNet och kan fungera direkt på glesa 3D-punkter och fånga in 3D-forminformation effektivt.

Tidig experiment med VoxelNet-teknik har visat att den överträffar toppmoderna LiDAR-baserade 3D-detekteringsmetoder med stor marginal. På mer utmanande uppgifter, som 3D-upptäckt av fotgängare och cyklister, visade VoxelNet-metoden uppmuntrande resultat, vilket visade att det ger en bättre 3D-representation och upptäckt.

Gröna 3D-rutor anger potentiella hinder som upptäcks med LiDAR

Förmågan att exakt upptäcka objekt i 3D-punktmoln är avgörande för att undvika hinder.

Från tidningen:

VoxelNet delar upp ett punktmoln i lika fördelade 3D-voxlar och omvandlar en grupp av punkter inom varje voxel till en enhetlig funktionsrepresentation genom det nyinförda voxel-funktionskodningsskiktet (VFE). På detta sätt kodas punktmoln som en beskrivande volumetrisk representation, som sedan är ansluten till en RPN för att generera detektioner.

Experiment på KITTI-bildetekteringsstocken visar att VoxelNet överträffar de senaste LiDAR-baserade 3D-detekteringsmetoderna med stor marginal. Dessutom lär sig vårt nätverk en effektiv diskriminerande representation av objekt med olika geometrier, vilket leder till uppmuntrande resultat i 3D-upptäckt av fotgängare och cyklister, baserat på endast LiDAR.

VoxelNet-arkitekturen, illustrerad ovanpå inlägget, har ett inlärningsnätverk som tar ett råpunktsmoln som inmatning, och delar sedan utrymmet till voxels och omvandlar punkter inom varje voxel till en vektorrepresentation som karakteriserar forminformationen.

Det är jättebra att Apple börjar öppna sig när det gäller sin autonoma körforskning, som sägs vara inriktad på åldrande marknaden och företagets interna campusbusservice.

IPhone-tillverkaren har tydligen gjort en stor investering i autonom körning och har ”ett stort projekt pågår” i det utrymmet, enligt VD Tim Cook.