Amazon har tusentals anställda lyssnar på Echo-ljudklipp som en del av att förbättra Alexa's maskininlärning så att den personliga assistenten bättre kan svara på röstkommandon.
Dessa människor lyssnar på vad vissa Alexa-ägare berättar assistenten, granskar, transkriberar och kommenterar ljudinspelningar för att hjälpa till att träna Alexa's maskininlärningsmodell.
Bloomberg har historien:
Arbetet är mestadels vardagligt. En arbetare i Boston sa att han brytade ackumulerade röstdata för specifika yttranden som 'Taylor Swift' och kommenterade dem för att indikera att sökaren menade musikalartisten.
Hittills så bra, men ...
Ibland lyssnar lyssnarna på saker som Echo-ägare förmodligen hellre vill hålla sig privat: en kvinna som sjunger dåligt av nyckeln i duschen, eller ett barn som skriker om hjälp. Lagen använder interna chattrum för att dela filer när de behöver hjälp med att analysera ett förvirrat ord - eller stöta på en underhållande inspelning.
Jag får dela kundens ljudinspelning med en kollega för att få jobbet gjort. Men att dela ett ljudklipp med en kollega bara för att användaren kan ha hänt att säga något roligt eller dumt känns helt fel och oprofessionellt för mig.
Ibland hör de inspelningar som de tycker är upprörande eller eventuellt kriminella. Två av arbetarna sa att de plockade upp det de tror var ett sexuellt övergrepp. När något sådant händer kan de dela upplevelsen i det interna chattrummet som ett sätt att lindra stress.
Medan Amazon har en process för sina arbetare att följa varje gång de hör något oroande, avvisades vissa anställda i inga osäkra termer med förklaringen att det inte var Amazons jobb att störa.
För dem som är oroliga för integritet hävdar rapporten att personer i detta team bara lyssnar på några av de röstinspelningar som fångades i Echo-ägarnas hem och kontor.
En talesman på Amazon kommenterade:
Vi tar säkerheten och integriteten för våra kunders personliga information på allvar. Vi kommenterar bara ett extremt litet urval av Alexa-röstinspelningar för att förbättra kundupplevelsen.
Till exempel hjälper denna information oss att träna våra system för taligenkänning och naturligt språkförståelse, så Alexa kan bättre förstå dina önskemål och se till att tjänsten fungerar bra för alla.
Sudio-filer har tagits bort från identifierbar information som användarens fulla namn och adress. Med det sagt kan Amazon ha varit mer transparent med sin datainsamling:
Alexa-röstgranskningsprocessen, som beskrivs av sju personer som har arbetat med programmet, belyser den ofta förbisatta mänskliga rollen i utbildningsprogramvarealgoritmer. I marknadsföringsmaterial säger Amazon Alexa "lever i molnet och blir alltid smartare." Men som många mjukvaruverktyg byggda för att lära av erfarenhet, gör människor lite av undervisningen.
Användare kan justera inställningarna för att hindra Amazon från att använda sina röstinspelningar för att förbättra Alexa.
Onlinehandelsgiganten erkänner att Alexa-förfrågningar används ”för att utbilda våra system för taligenkänning och naturligt språkförståelse”, men detta ligger begravd i en lista med vanliga frågor på deras webbplats. Oavsett hur du tittar på det, är kontextuell röstigenkänning en tuff mutter att spricka men maskininlärning lovar att vara rätt lösning. Problemet är att modeller för maskininlärning måste utbildas.
Amazon har team av människor som märker och kategoriserar Alexa röstfrågorApple har till exempel tränat Face ID med mer än en miljard fotografier av människors ansikten. När det gäller taligenkänning krävs stora mängder märkta data för att uppnå hög noggrannhet.
Därför är det inte möjligt att lansera Siri på ett nytt språk utan att ha tillräckligt med data för att träna de akustiska modellerna, och att data måste komma från riktiga människor som utför riktiga röstfrågor. Den enda skillnaden mellan Amazon och Apple är att den förra har människor som lyssnar på några av dessa inspelningar medan den senare, antagligen, inte.
Nu när du vet att Amazon har ett globalt team som lyssnar på Alexa-ljudklipp är det mer eller mindre troligt att du fortsätter att använda Echo-produkter?
Låt oss veta det genom att lämna en kommentar nedan.