Accueil Nouvelles Plus de 1 000 enregistrements audio privés de l’Assistant fuient, admet Google

Plus de 1 000 enregistrements audio privés de l’Assistant fuient, admet Google

0
Plus de 1 000 enregistrements audio privés de l’Assistant fuient, admet Google

Une erreur de confidentialité révèle de vilaines vérités pour Google

"Fuite

Google a été pris dans une erreur de confidentialité sur la collecte de voix, la société admettant que plus de 1 000 enregistrements sonores ont été divulgués sur un site d’information belge.

Comme Amazon, Google dispose d’un noyau de travailleurs qui écoutent les requêtes Google Assistant des utilisateurs afin d’améliorer son IA. Ces enregistrements sont censés rester anonymes et, surtout, sécurisés sur les serveurs de Google.

Mais plus de 1 000 de ces enregistrements ont été divulgués par un sous-traitant au diffuseur belge VRT NWS. Les enregistrements contiendraient des informations sensibles, y compris des adresses, selon la VRT. Pour confirmer que les enregistrements étaient réels, la VRT « a laissé les Flamands ordinaires entendre certains de leurs propres enregistrements ». Ces personnes pourraient confirmer avoir entendu leur propre voix sur les clips audio.

Bien que la fuite de ces informations soit suffisamment grave, 153 des enregistrements étaient des conversations enregistrées sans que le mot de réveil « Ok Google » ne soit prononcé. Les haut-parleurs intelligents de Google écoutent ces mots de réveil et ne devraient commencer à enregistrer quoi que ce soit une fois qu’ils ont été prononcés. Parmi ces clips vocaux figuraient des conversations privées, des appels professionnels et autres, que les participants ne voulaient presque certainement pas enregistrer.

Google a admis la fuite dans un article de blog, où il a confirmé qu’un examinateur linguistique avait enfreint les politiques de sécurité de l’entreprise et partagé les enregistrements avec la VRT.

« Nos équipes de sécurité et de réponse à la confidentialité ont été activées sur ce problème, enquêtent et nous prendrons des mesures », a déclaré David Monsees, chef de produit de la recherche chez Google. « Nous procédons à un examen complet de nos garanties dans cet espace pour éviter qu’une inconduite comme celle-ci ne se reproduise. »

C’est la dernière d’une série d’erreurs de sécurité commises par les sociétés de téléphonie. Amazon a fait la une des journaux récemment pour la façon dont il gère les enregistrements Alexa, avec des rapports selon lesquels il n’anonymise pas suffisamment les données.

Les entreprises de voix utilisent des travailleurs pour écouter des enregistrements afin de « former » l’IA. C’est une pratique établie, mais dont beaucoup d’utilisateurs ne sont pas conscients. Et c’est tout à fait juste parce que Google ne dit pas qu’il fait cela dans ses politiques de confidentialité.

« Les experts en langues n’examinent qu’environ 0,2% de tous les extraits audio », a déclaré Monsees. « Les extraits audio ne sont pas associés aux comptes d’utilisateurs dans le cadre du processus d’examen, et les examinateurs sont invités à ne pas transcrire les conversations en arrière-plan ou d’autres bruits, et à transcrire uniquement les extraits qui sont dirigés vers Google. »

Google a également reconnu ce qu’il appelle des  » fausses acceptations  » – des moments où l’assistant pense avoir entendu les mots de réveil et commence à enregistrer, alors qu’en fait la commande de déclenchement n’a jamais été donnée. Cela pourrait expliquer les 153 enregistrements involontaires, mais c’est un nombre important sur un échantillon de 1 000. Alors extrapolez cela, et ce n’est pas un bon coup d’oeil. De plus, les politiques de Google stipulent que seuls les enregistrements prévus sont envoyés à Google – ce qui n’est clairement pas le cas.

Alors, qu’est-ce que tu peux faire? Vous pouvez désactiver le stockage des données audio sur votre compte Google si vous le souhaitez, ou vous pouvez le faire supprimer automatiquement vos données tous les trois ou 18 mois. Google a promis qu’il « examinerait les opportunités » pour clarifier la façon dont les données sont utilisées. Il était temps aussi.