Indholdsfortegnelse:
- Hvad er Google Duplex?
- Er dette ikke ligesom tale-til-tekst?
- Hvordan fungerer Duplex?
- Hvad med sikkerhed og privatliv?
- Hvornår har jeg Duplex på min telefon?
- Hvor kan jeg lære mere?
På Google I / O 2018 så vi en demo af Googles seneste nye seje ting, Duplex. 60-fods skærm på scenen viste, hvad der ligner din Google Assistant-app med en line-for-line-afspilning af Assistant, der ringer til en frisør og opsætter en aftale, komplet med pauserne, ummms og ahhhs og resten af de idiosynkrasier, der ledsager menneskelig tale. Den person, der tog aftalen, så ikke ud til at vide, at de talte til en computer, fordi det ikke lyder som en computer. Ikke engang lidt.
Den slags demo ser fantastisk ud (og måske lidt uhyggelig), men hvad med detaljerne? Hvad er duplex nøjagtigt? Hvordan fungerer det endda? Vi har alle spørgsmål, når vi ser noget så anderledes, og det er en smerte at finde svar spredt over internettet. Lad os gennemgå det, vi hidtil ved om Google Duplex.
Hvad er Google Duplex?
Det er et nyt værktøj fra Google, der sigter mod at bruge kunstig intelligens (AI) til at "udføre virkelige opgaver over telefonen" ifølge Googles AI-forskere og udviklere. For øjeblikket betyder det meget specifikke opgaver som at arrangere aftaler, men teknologien udvikles med øje på udvidelse til andre områder. At bruge milliarder på at skabe en cool måde at reservere middag lyder som noget, Google ville gøre, men det er ikke en god brug af tid eller penge.
Duplex er også mere, end vi så i en demo, og hvis det nogensinde forlader laboratoriet, vil det være meget mere, end vi ser eller hører på vores ende. Der er enorme databanker og computere til at behandle det involveret, som ikke er næsten lige så cool som det endelige resultat. Men de er vigtige, fordi det er svært at få en computer til at tale og tænke i realtid som en person.
Er dette ikke ligesom tale-til-tekst?
Nix. Ikke engang tæt på. Og det er derfor, det er en big deal.
Duplex er designet til at ændre den måde, en computer "taler" på telefonen på.
Målet for Duplex er at få ting til at lyde naturligt og at assistent tænker på farten for at finde en aftale tid der fungerer. Hvis Joe siger, "Yeah, om det - jeg har ikke noget åbent før 10, er det OK?" Assistent er nødt til at forstå, hvad Joe siger, finde ud af, hvad det betyder, og tænk, hvis det, Joe tilbyder, fungerer for dig. Hvis du er optaget over hele byen klokken 10, og det vil tage 40 minutter at køre til Joe's Garage, skal assistent være i stand til at regne det ud og sige, at 11:15 ville være godt.
Lige vigtigt for Google er, at Duplex svarer og lyder som en person. Google har sagt, at den ønskede, at personen på telefonen ikke skulle vide, at de talte til en computer, selvom den til sidst besluttede, at det ville være bedst at informere dem. Når vi taler med mennesker, snakker vi hurtigere og mindre formelt (læs: usammenhængende babling fra en computers synspunkt), end når vi taler med assistent på vores telefon eller computeren på DMV, når vi ringer til. Duplex er nødt til at forstå dette og genskab det, når du svarer.
Endelig og mest imponerende er, at Duplex er nødt til at forstå kontekst. Fredag, næste fredag og fredag efter næste uge er alle betingelser, som du og jeg forstår. Duplex skal også forstå dem. Hvis vi talte på samme måde, skriver vi, dette ville ikke være et problem, men vi ved du ved det ikke, fordi det lyder bare lyder så indelukket, ja det er ikke som forvirrende, selvom vi har hørt det hele vores liv og er vant til det så nej, vi har ikke problemer, du ved, at du forstår det eller intet lignende.
Jeg administrerer førstehjælp til min redaktør efter at have skrevet det, mens du siger det højt, så du kan se, hvad det betyder.
Hvordan fungerer Duplex?
Fra brugerens slut er det så simpelt som at fortælle assistent at gøre noget. For nu, som nævnt, at noget er begrænset til at aftale aftaler, så vi vil sige, "Hej Google, gør mig en aftale om et olieskift på Joe's Garage til tirsdag formiddag, " og (efter at det mindede os om at sige venligst) ville det ringe op Joe's Garage, og sæt ting op, og tilføj det derefter til din kalender.
Temmelig flot. Men hvad der sker ud fra kameraet er endnu finere.
Duplex bruger det, der kaldes et tilbagevendende neuralt netværk. Det er bygget ved hjælp af Googles TensorFlow Extended-teknologi. Google trænede netværket på alle disse anonymiserede voicemails og Google Voice-samtaler, som du accepterede at lade det lytte til, hvis du tilmeldte dig en blanding af talegenkendelsessoftware og muligheden for at overveje samtalen og detaljerne som f.eks. Tidspunktet på dagen og placering af begge parter.
I det væsentlige knækker et helt netværk af højdrevne computere data i skyen og taler gennem Assistant på din telefon eller et andet produkt, der har Assistant om bord.
Hvad med sikkerhed og privatliv?
Det kommer til en enkel ting: stoler du på Google. Maskintelligensitet på enheden er en rigtig ting, skønt den er begrænset og relativt ny. Google har udviklet ML Kit til at hjælpe udviklere med at gøre mere af denne slags ting på selve enheden, men det hele handler om computerkraft. Det kræver utrolige mængder beregninger at lave en håraftale på denne måde, og der er ingen måde, det kunne gøres på din telefon eller Google Home.
Du skal stole på Google med dine data for at bruge dens smarte produkter, og Duplex vil ikke være anderledes.
Google skal bruge mange af dine personlige data for at gøre de specielle ting, som assistenten kan gøre lige nu, og Duplex ændrer ikke det. Det nye her er, at der nu er en anden part involveret, som ikke eksplicit gav Google tilladelse til at lytte til deres samtale.
Hvis / når Duplex bliver et faktisk forbrugerprodukt, som enhver kan bruge, forventer det at blive kritiseret og anfægtet ved domstole. Og det skulle være; At lade Google bestemme, hvad der er bedst for vores privatliv, er som den gamle ordsprog mellem to ræve og en kylling, der bestemmer hvad der skal til middag.
Hvornår har jeg Duplex på min telefon?
Ingen ved lige nu. Det kan aldrig ske. Google bliver ophidset, når den kan gøre denne slags fantastiske ting og vil dele den med verden. Det betyder ikke, at det vil være succes eller nogensinde blive et rigtigt produkt.
I øjeblikket testes Duplex i et lukket og overvåget miljø. Hvis alt går godt, kommer en indledende eksperimentel frigivelse til forbrugerne for at foretage restaurantbestillinger, planlægge aftaler med frisørsaloner og få ferietimer over telefonen senere på året ved hjælp af Assistant på telefoner.
Hvor kan jeg lære mere?
Google er overraskende åben over den teknik, den bruger til at oprette Duplex. Du finder relevant information på følgende websteder:
- Google AI-blog (Google)
- Deepmind
- Tensorflow.org
- Cornell University Library
- Google Research (Google)
- Nøgleordet (Google)
- ML Kit (Google)
Selvfølgelig følger vi også Duplex nøje, og du vil høre den seneste udvikling lige her, så snart de er tilgængelige.