欧美成人A片免费|日韩无码一级av|一级黄色大片在线播放|黄片视频在线观看无码|亚洲精品成人无码影视|婷婷五月天视频网站|日韩三级AV在线播放|姓爱av在线婷婷春色五月天|真人全黃色录像免费特黄片|日本无码黄在线观看下载

  • +1

隔屏有耳調(diào)查|亞馬遜智能音箱有千人監(jiān)聽團隊,曾聽到性侵案

澎湃新聞記者 承天蒙 綜合報道
2019-04-12 07:34
來源:澎湃新聞
? 10%公司 >
字號

遭遇“隔屏有耳”質(zhì)疑的,不止中國流行的手機App,還有國內(nèi)外近年興起的智能音箱。最新的一例是亞馬遜智能音箱Echo植入的智能語音助手Alexa,被曝有人類人工參與“監(jiān)聽”。

4月11日,彭博社發(fā)布調(diào)查報道,揭秘了亞馬遜Alexa“監(jiān)聽”團隊中,這些一直被隱藏的人類員工的工作內(nèi)容。報道稱,有時候,參與其中的工作人員會聽到用戶私人的聲音片段,如一個女人洗澡時嚴重走調(diào)的歌聲,或者一個孩子尖叫著尋求幫助。還有兩名員工甚至稱,他們聽到過他們認為是性侵案的聲音。

亞馬遜此前從未公開過它會人工聽取用戶和Alexa的私人聊天,也沒有披露過Alexa的語音技術中,部分包括人類參與。7位為該項目工作的員工向彭博社透露了亞馬遜Alexa的這項人工聲音檢查流程。

亞馬遜的Echo是世界上最流行的智能音箱,它于2014年上市;Echo音箱之后,谷歌也推出了植入谷歌語音助手的Google Home智能音箱,蘋果隨后推出了采用Siri的智能音箱HomePod。在中國,天貓精靈、小度智能音箱、小米AI音箱等設備也紛紛走進了更多用戶家庭。

如今,很多用戶已經(jīng)習慣于通過喚醒詞將音箱中的語音助手激活,進而向它提出問題或下達指令,有的智能音箱甚至還能與用戶簡單地聊兩句天。但彭博社的報道提出,智能助手如此“懂你”的背后,可能并不僅僅是人工智能和機器學習,而是有人類員工團隊人工聽取用戶與設備的對話錄音,并幫忙改進算法的結(jié)果。

Google Home智能音箱

亞馬遜千人監(jiān)聽團隊

彭博社報道介紹,亞馬遜在全球有數(shù)千名工作人員,他們?nèi)斯ぢ犎『蜋z查用戶和智能語音助手Alexa的私人對話,目的是幫助Alexa改進語音識別技術。

Echo音箱

該團隊專門收聽用戶在家中和辦公室里被Echo音箱抓取的錄音。這些錄音會被轉(zhuǎn)錄、加上注釋,然后反饋到軟件中,以消除Alexa對理解人類語言的差距,幫助它更好地響應指令。

亞馬遜在廣告詞中介紹,“Alexa生活在云端,并且一直越來越聰明”,實際上,和許多需要從經(jīng)驗中學習的軟件工具一樣,人類也為機器做了不少教學。

執(zhí)行這一工作的團隊包括全職亞馬遜員工和合約工,工作地點遍布世界不同地區(qū),包括波士頓、哥斯達黎加、印度、羅馬尼亞。員工簽署了保密協(xié)議禁止公開談論這一項目。

羅馬尼亞首都布加勒斯特的兩位員工透露,他們一天工作9小時,每班解析多達1000條音頻片段。

波士頓的一名員工則表示,他為特定的話語,如Taylor Swift,挖掘了累積的語音數(shù)據(jù),并對其進行了注釋,以表明這個搜索是指那位歌手。

私人聲音片段也會被抓取

智能音箱需要時刻開啟麥克風,以監(jiān)聽用戶是否說出了喚醒詞、是否在向自己下命令。亞馬遜語音助手Alexa的軟件就被設計為持續(xù)記錄音頻片段,聆聽喚醒詞。默認的喚醒詞即為“Alexa”。

目前的工作流程下,私人的聲音片段也會被設備抓取。

有時候,工作人員會聽到用戶私人的聲音片段,如一個女人洗澡時嚴重走調(diào)的歌聲,或者一個孩子尖叫著尋求幫助。工作人員利用內(nèi)部聊天室共享文件,解析含糊的單詞,或者是分享搞笑的錄音。

有時員工還會聽到不安甚至有可能是犯罪的錄音。兩名員工稱,他們聽到過他們認為是性侵案的聲音,當這種事情發(fā)生時,他們會在內(nèi)部聊天室說出來解壓。

亞馬遜對此表示,員工聽到令人痛苦的事情時,他們有標準流程處理。但是這兩位羅馬尼亞員工表示,他們要求對這類案件進行處理時,被公司告知干預此類事件不是亞馬遜的工作。

“我們認真對待用戶的個人信息和隱私安全?!眮嗰R遜發(fā)言人在一份電子郵件聲明中稱,“我們只會注釋極小一部分的Alexa錄音樣本,為了改善用戶體驗。如幫助我們訓練語音識別和自然語言理解系統(tǒng)的信息,這樣Alexa可以更好地理解用戶要求,并保證對每個人都能提供好的服務。”

“我們有嚴格的技術和操作保障,對濫用我們系統(tǒng)的行為采取零容忍政策。員工在工作流程中無法直接訪問能辨別用戶和賬號的信息。我們使用多重驗證來限制訪問,對服務加密,審計我們的工作環(huán)境,以對所有信息高度保密。”

語焉不詳?shù)碾[私政策

亞馬遜在其宣傳和隱私政策的材料中,沒有明確表明Alexa獲取的一些對話錄音是人工來聽,只是在常見問題解答列表中提到了一句“我們使用您對Alexa的命令來訓練我們的語音識別和自然語言理解系統(tǒng)”。

Alexa的隱私設置中,公司給用戶提供了禁用錄音開發(fā)新功能的選項。彭博社看到的截圖顯示,發(fā)送給工作人員的Alexa錄音沒有提供用戶的全名和地址,但與用戶的賬戶號、名稱和設備序列號相關聯(lián)。

依賴人類員工填補算法空白的,還有谷歌、Siri

亞馬遜圓柱形的智能音箱Echo于2014年上市后,很快就因其可以在家中使用智能語音軟件快速流行開來。不久之后,谷歌母公司Alphabet推出了自己的版本Google Home,隨后是蘋果公司的HomePod,在中國也有很多品牌的智能音箱產(chǎn)品。

據(jù)研究機構(gòu)Canalys的報告,2018年,全球消費者購買了7800萬臺智能音箱,其中數(shù)百萬臺通過語音軟件與智能手機上的智能助手進行交互。

大多數(shù)現(xiàn)代語音識別系統(tǒng)依賴于模仿人腦的神經(jīng)網(wǎng)絡,軟件會通過海量數(shù)據(jù)進行機器學習,為Echo等其他智能音箱的算法提供可能性的模型。如果用戶問Alexa附近有沒有名叫“希臘某某”的地方,算法會自動知道用戶在尋找希臘餐廳,而不是教堂或社區(qū)中心。

但Alexa也經(jīng)常犯錯,尤其是俚語、口語、方言和非英語的語言。因此亞馬遜需要雇傭人類員工,幫助填補算法的空白。

除了亞馬遜之外,實際上,其他品牌的語音助手也都是在人類的幫助下訓練出來的。

蘋果的Siri也有人類員工的幫助,他們負責評估語音助手對請求的解釋是否與用戶說的相符。根據(jù)蘋果安全白皮書,員工檢查的Siri錄音是沒有個人身份信息的,錄音會與一個隨機標識符關聯(lián),存儲六個月,之后這些數(shù)據(jù)就會被移除隨機標識符,但它們也有可能存儲更長時間以改善Siri的語音識別。

在谷歌,一些人類員工也可以獲取谷歌助手的音頻片段幫助訓練和改善產(chǎn)品,這些音頻也沒有個人身份信息,并且經(jīng)過音頻失真處理。

    責任編輯:杜薇
    校對:欒夢
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司