Älykaiuttimien kasvava määrä on selkeä osoitus siitä, että seuraava käyttöliittymä ihmisten ja koneiden välillä on ääni.

Nykyisten älykaiuttimien on valitettavan vaikeaa saada komennoista selvää, jos paikalla on useampia puhujia. Googlen uusi tekniikka erottaa puhujat toisistaan.

Tosin suurin osa tämänhetkisistä älykaiuttimista ei pysty innovaatiota suoraan hyödyntämään. Engadgetin uutisoima keksintö perustuu kameran käyttämiseen. Google koulutti neuroverkon tunnistamaan puhujan ihmisen suun liikkeistä. Apuna käytettiin virtuaalisia juhlia, joiden melusta koneen piti oppia poimimaan eri ihmisten äänet eri ääniraidoiksi.

Kuten yhtiön julkaisemalta demovideolta näkyy, tekniikka toimii hämmentävän hyvin. Osittainen päällepuhuminen tai suun peittäminen hetkeksi mikrofonilla eivät hämää tekniikkaa, vaan kahden ihmisen esitykestä saadaan poimittua lähes täydellisen erotetut ääniraidat.

Tekniikkaa voitaisiin käyttää esimerkiksi Google Hangouts- tai Duo -videopuheluiden äänen parantamiseen. Myös jo tallennetuiden videoiden puheääntä voitaisiin selkeyttää. Eräs käyttökohde voisivat olla aivan uudenlaiset kuulolaitteet. Samantyyppinen käyttökohde voisi tosin olla huippuluokan salakuuntelulaite, jolla voitaisiin tarkasti vakoilla ja tallentaa keskusteluja.