Bloomberg rapporterade nyligen att Amazon har ett projekt med några av sina anställda som lyssnar på några av ljudinspelningarna från Alexa-högtalare när användare interagerar med dem, men det verkar nu som att de här personerna har tillgång till kundens hemadresser också.
En ny Bloomberg-rapport från i morse citerar fem anonyma anställda i Amazons Alexa Data Services-team som bekräftar att de enkelt kan hitta en kunds hemadress genom att skriva in sin latitud- och longitudinformation i mappningsprogram som Google Maps.
Det finns inget som tyder på att Amazon-anställda med tillgång till uppgifterna har försökt spåra enskilda användare, men två medlemmar i Alexa-teamet uttryckte oro för Bloomberg för att Amazon beviljade onödigt bred tillgång till kunddata som skulle göra det enkelt att identifiera en enhets ägare.
Det låter verkligen inte lovande.
Några av de anställda som är anklagade för att analysera inspelningar av Alexa-kunder använder ett Amazon-verktyg som visar ljudklipp tillsammans med data om enheten som fångade inspelningen. Mycket av den information som lagras av programvaran, inklusive ett enhets-ID och kundidentifieringsnummer, kan inte lätt kopplas tillbaka till en användare.
Så ska det vara.
Emellertid samlar Amazon också platsinformation så Alexa kan mer exakt besvara förfrågningar, till exempel föreslå en lokal restaurang eller ge vädret i närliggande Ashland, Oregon, i stället för avlägsna Ashland, Michigan.
Det var inget fel med Alexa som samlade platsdata från användare för att förbättra sin tjänst om det inte var för att vissa av dess anställda får se dem i första hand.
I en demonstration av Bloomberg klistrade en Amazon-teammedlem in en användares koordinater, lagrade i systemet som latitud och longitud, i Google Maps. På mindre än en minut hoppade den anställde från en inspelning av en persons Alexa-kommando till det som tycktes vara en bild av deras hus och motsvarande adress.
Det är verkligen störande men vem som helst kan leta upp en persons plats i Google Maps så länge de har sin latitud och longitud, det finns inget speciellt med det. Det som är störande är det faktum att användarkoordinater är tillgängliga för vissa Amazon-anställda.
Ett annat internt verktyg som de använder lagrar mer personlig information.
Efter att ha lagt in ett kund-ID-nummer kan de arbetare, så kallade kommentatorer och verifierare, se hem- och arbetsadresser och telefonnummer som kunderna skrev in i Alexa-appen när de installerade enheten, sa medarbetaren. Om en användare har valt att dela sina kontakter med Alexa visas deras namn, nummer och e-postadresser också i instrumentpanelen.
Ja, men varför visa all den informationen i instrumentpanelen?
Dessa data finns i systemet så att om en kund säger "Skicka ett meddelande till Laura", kan mänskliga granskare se till att transkriptionerna skrev namnet korrekt så att programvaran lär sig att para den begäran med Laura i kontaktlistan.
Det är oklart av rapporten hur många anställda och entreprenörer som kan ha tillgång till dessa funktioner. Två Amazon-anställda sa att de trodde att de allra flesta arbetare i Alexa Data Services-gruppen kunde använda den programvaran för cirka ett år sedan.
En annan anställd sa att ”tills nyligen” visade systemet fullständiga telefonnummer med vissa siffror dolda. "Fram till nyligen", vilket innebär att Bloomberg rapporterade om detta, rätt?
Amazon ytterligare begränsade tillgången till data efter Bloombergs 10 april-rapport, sade två av de anställda. Vissa datainsamarbetare, som transkriberar, kommenterar och verifierar ljudinspelningar, anlände till arbetet för att upptäcka att de inte längre hade tillgång till programverktyg som de tidigare använt i sina jobb, sa dessa människor.
Från presstiden hade deras åtkomst inte återställts.
Bekymrande inkluderade den ursprungliga rapporten ett uttalande tillskrivet en talesman för Amazon som förnekade att de som lyssnar på Alexa-inspelningar har tillgång till annan information.
Anställda har inte direkt tillgång till information som kan identifiera personen eller kontot som en del av detta arbetsflöde. All information behandlas med stor konfidentialitet och vi använder autentisering med flera faktorer för att begränsa åtkomst, servicekryptering och granskningar av vår kontrollmiljö för att skydda den.
I ett nytt uttalande som svarar på historien har emellertid Amazon ändrat sin position och kallar nu åtkomst till interna verktyg "mycket kontrollerad":
Tillgång till interna verktyg är mycket kontrollerad och ges endast till ett begränsat antal anställda som behöver dessa verktyg för att utbilda och förbättra tjänsten genom att bearbeta ett extremt litet urval av interaktioner.
Vår policy förbjuder strikt anställdas tillgång till eller användning av kunddata av någon annan anledning och vi har en nolltoleranspolicy för missbruk av våra system. Vi granskar regelbundet anställdas tillgång till interna verktyg och begränsar åtkomsten när och när det är möjligt.
Innan vi hoppar till några för tidiga slutsatser upprepas det att detta inte är någon form av ett hemligt projekt - Amazon döljer inte det faktum att det betalar människor att lyssna på i kundsamtal. Liksom Apple och andra teknikföretag håller Amazon anonymiserade utdrag av ljudinspelningar på sina servrar under en tid för att förbättra sitt röstigenkänning och AI.
"Vi använder dina förfrågningar till Alexa för att utbilda våra system för taligenkänning och naturligt språk," säger företaget i en lista med vanliga frågor.
Det är ett faktum i teknikvärlden att konstgjorda intelligenssystem som hjälper maskiner att förstå innebörden bakom talade ord måste utbildas regelbundet med riktiga inspelningar, vilket är det enda pålitliga sättet att förbättra deras noggrannhet.
Som Amazon talesman förklarade till Bloomberg:
Vi kommenterar bara ett extremt litet urval av Alexa-röstinspelningar för att förbättra kundupplevelsen. Denna information hjälper oss att träna våra system för taligenkänning och naturligt språkförståelse så att Alexa bättre kan förstå dina önskemål och se till att tjänsten fungerar bra för alla.
Apple gör exakt samma sak - Siri har mänskliga hjälpare som lyssnar på några av klippna, bundna till en slumpmässig identifierare och lagras på servrar i sex månader.
Därefter tas den slumpmässiga identifieraren helt bort men data bevaras under längre perioder för att förbättra Siris röstigenkänning. Ja, Google har också granskare som har till uppgift att lyssna på några av Assistants utdrag för att hjälpa till att träna och förbättra tjänsten. Googles inspelningar har tagits bort all personlig identifierbar information och själva ljudet är förvrängd.
Som Florian Schaub, en professor vid University of Michigan som har forskat integritetsfrågor relaterade till smarta högtalare, uttrycker det snyggt:
Du tänker inte nödvändigtvis på en annan människa som lyssnar på det du berättar för din smarta högtalare i ditt intimitet. Jag tror att vi har konditionerat antagandet att dessa maskiner bara gör magi-maskininlärning.
Men faktum är att det fortfarande är manuell behandling inblandad.
Huruvida det är en sekretessproblem eller inte beror på hur försiktiga Amazon och andra företag är i vilken typ av information de har antecknat manuellt, och hur de presenterar den informationen till någon.
För sammanhang är här ett utdrag ur den ursprungliga berättelsen:
Vissa Alexa-granskare har till uppgift att transkribera användarnas kommandon, jämföra inspelningarna med Alexa's automatiserade transkript, säga eller kommentera interaktionen mellan användare och maskin. Vad frågade personen? Ger Alexa ett effektivt svar?
Andra noterar allt talaren tar upp, inklusive bakgrundssamtal - även när barn pratar. Ibland hör lyssnarna användare diskutera privata detaljer som namn eller bankinformation; i sådana fall ska de kryssa för i en dialogruta som anger kritiska data. De går sedan vidare till nästa ljudfil.
Enligt Amazons webbplats lagras inget ljud om inte Echo upptäcker väckningsordet eller aktiveras genom att trycka på en knapp. Men ibland verkar Alexa börja spela in utan någon fråga alls, och ljudfilerna börjar med en bländande tv eller oinförståeligt brus. Oavsett om aktiveringen är felaktig eller inte, måste granskarna transkribera den. En av folket sa att revisorerna transkriperar var och en upp till 100 inspelningar per dag när Alexa inte får något väckarkommando eller utlöses av en olycka.
Bloombergs ursprungliga rapportering hävdade att ”de tusentals anställda” som arbetar med detta projekt ibland också måste granska klipp som kan vara ganska oroande - och till och med några som kan vara kriminella. I ett rapporterat fall hörde två anställda från Amazon vad de tycker var sexuella övergrepp men fick sina arbetsgivare i uppdrag att inte anmäla händelsen eftersom det "inte var Amazons jobb att störa."
I sådana extrema fall är det mycket Amazons jobb att störa.
Varför skulle inte företaget tillåta de anställda som lyssnar på Alexa-inspelningar att rapportera dessa händelser till brottsbekämpning och eventuellt rädda liv? Om någon bryter in i mitt hus och håller mig på vapen, vill jag att vem som helst som lyssnar får se min hemadress och till och med varna polisen, vid behov.
tankar?