Chefen för Apples talgrupp förklarar hur Siri lär sig nya språk

Hur exakt lär sig Siri ett nytt språk? I dagens intervju med Reuters erbjöd Apples talgruppschef Alex Acero en bakom kulisserna en titt på hur Siri lär sig nya språk, en process som involverar manusskrivning, fångar röster i flera accenter och dialekter och använder maskininlärning och konstgjord intelligens för att bygga och utveckla nya språkmodeller över tid. Systemet kräver ett team av personer med uppgift att läsa passager av manuellt transkriberad text.

Innan Apple faktiskt uppdaterar, lanserar Apple först Dictation-stöd för ett nytt språk.

Siri talar för närvarande 21 språk i 36 länder. Som jämförelse stöder Microsofts Cortana åtta språk skräddarsydda för tretton länder, Google Assistant talar fyra språk medan Amazons Alexa bara fungerar på engelska och tyska.

Att lära Siri ett nytt språk innebär följande steg:

  • Människor läser anpassade texttexter i en rad accenter och dialekter
  • Inspelningar transkriberas för hand så att Siri vet exakt vad den ska lära sig
  • De fångar också ljud i en rad röster
  • En ny språkmodell byggs upp som försöker förutsäga ordsekvenser

Apple rullar ut Dictation-stöd för det nya språket innan det läggs till i Siri - det är därför Diction-funktionen stöder fler språk än Siri (den kommande programvaruuppdateringen macOS Sierra 10.12.4, till exempel, möjliggör Dictation-stöd för Shanghainese, en kinesisk dialekt som talas bara runt staden).

Diktation låter Apple fånga anonyma ljudinspelningar, komplett med bakgrundsbrus och mumlade ord. Ljudet transkriberas manuellt av människor, en process som Acero hävdar hjälper till att sänka talfrekvensen till halva.

Det är först efter att tillräckligt med data har samlats in att Apple uppmanar en skådespelare att spela in röster för Siri. När ett nytt Siri-språk är redo för prime time släpps det med svar på vad Apple uppskattar kommer att vara de vanligaste frågorna.

Apples har investerat stora summor i konstgjord intelligens och maskininlärning för att hjälpa språkmodellerna att utvecklas över tiden när Siri lär sig mer om vad användare frågar.

De uppdaterar Siri varannan vecka med fler tweaks, sa Acero.

Prenumerera på iDownloadBlog på YouTube

Ett möjligt problem med Apples strategi, enligt Charles Jolley, skapare av en intelligent assistent vid namn Ozlo, är att du inte kan anställa tillräckligt med författare för att komma med det system du behöver på alla språk.

Andra personliga assistenter, inklusive Google Now och Microsoft Cortana, mildrar skalningsfrågan genom att syntetisera svaren, något Siri inte är så bra på.

Viv, en startup som grundades av Siris ursprungliga skapare som Samsung förvärvade förra året, arbetar med just det. "Det enda sättet att hoppa över dagens begränsade funktionsversioner är att öppna systemet och låta världen lära dem."

Även om Siri nu talar fler språk än hennes rivaler (Google och Amazon sa att de planerar att föra fler språk till sina respektive assistenter), har användaren fortfarande kvar med en sub-par-upplevelse eftersom, som jag nämnde, andra assistenter är bättre på att förstå sammanhang och ge mer konversationssvar.

Cupertino-företagsförvärvet på 200 miljoner dollar av Australien-baserade maskininlärningsstart Turi i augusti 2016 borde bidra till att förbättra Siris språk- och kunskapsmodeller.

Apple förväntas visa upp förbättrade Siri-funktioner (som kanske eller inte är exklusiva för iPhone 8) vid sin årliga pilgrimsfärd för utvecklare som startar med en nyckel den 5 juni. Siri-förbättringar kan inkludera flerspråkigt stöd.

iOS 10 stöder att skriva på två språk utan att behöva byta tangentbord så kanske kommer Siri snart att förstå flera språk utan att kräva att du manuellt väljer ett på Inställningar → Siri → Språk?

En Siri på flera språk bör också fungera bra på Apple TV.

En intervju i november 2015 med flera projektledare för Apple TV föreslog att Apple ursprungligen begränsade Siri på set-top boxen till bara åtta länder på grund av skillnaderna i uttalet av skådespelarens namn, filmer och regissörer på olika språk och dialekter..

Källa: Reuters