微軟全球執行副總裁沈向洋在昨天的人工智能大會上做了精彩演講,與普遍的討論人工智能技術和應用不同,沈向洋提出了許多獨特的且富有哲理的觀點,他結合小冰等微軟研究院的相關產品和技術描述了情感智能的原理、應用現狀和發展方向,他認為,除了硬性的IQ以外,人工智能的研究更要強調機器與人之間的感性化交互,強調情感計算。智能化的機器在滿足人類需求的同時,還應讓用戶對其產生一種情感上的信任和依賴,而小冰目前就是這樣一個“感性化的人工智能助手”。
1、情感計算的重要性
如沈向洋在演講中所說,我們在談論人工智能時勢必要談一下圖靈測試,勢必會去強調機器的IQ。機器通過感知計算提升IQ水平固然重要,但按照人工智能最為通行的定義——“人工智能是對計算機系統如何能夠履行那些只有依靠人類智慧才能完成的任務的理論研究。”這里的人類智慧當然不是單指智商或者智力,還有人類情感,情感是人類神經系統對外界價值關系產生的主觀反映。人工智能在我們眼中一直不是普通的智力工具,所以我們一方面需要它具備超越人類的感知計算能力,另一方面也需要它能夠與人進行情感交流,在重視人工智能完成任務和功能強化的同時更要建立和滿足人的情感和心理需求,這才是人工智能的最終定義。也就是說,人工智能的發展路徑不應該一味沿著理性的路線前行,而是應該落在沈向洋在演講中提到的感性和理性的交叉區域。
從實際應用來看,也出現了越來越多具備情感計算能力、能與人類進行感性交互的技術和產品。MIT教授、TED講者雪莉·特克在《一起孤獨》一書中提出,社交本能使人類很容易將社交關系投射到各種各樣的人和事物上,當一件物品在我們的關懷下茁壯成長時,我們會覺得它是智能的。但更重要的是,我們會覺得自己與它形成了某種關系。我所說的這種關系并不是來源于計算機真實的情感或智能,因為它們根本沒有。這種關系,來自于我們自身被它們所喚起的部分。她所說的物品包括能激發孩子情感依戀的玩偶,比如菲比小精靈和真娃娃機器人玩偶。更有甚者,是一只叫帕羅的機器海豹,用來充當老年人的伴侶動物。羅切斯特大學的羅杰波教授與AdobeResearch合作開發了一種比現有技術更精確的訓練電腦處理圖像數據的方法,受過這種訓練的電腦可以被用來探測圖像中更可能流露出的情感因素,可以用來衡量經濟指標或用來預測大選結果。Affectiva可以通過處理人臉圖像實時捕捉和量化情感,而SociometricSolutions可以通過語音語調做同樣的事情。在法律調查過程中,計算機能識別相關的詞匯和短語,還能理解事件鏈、人際關系,甚至是情感和動機。
對于微軟來說,更是將對人工智能情感計算的思想注入到了小冰的開發和運營中,微軟認為,在人工智能領域內,新一代人工智能系統的首要任務就是需要具備“感性”的情感連接能力,這樣才能以更像真實人類的方式滿足人們普遍心理和情感需求,從而逐步建立信任和依賴感。在技術和產品創新層面,微軟構建了一個完整可持續的對話系統,這個對話系統的基本任務不是以完成任務為優先,而是建立情感連接為優先。構建這個對話系統的方法,已不只限于語義學,而是基于搜索引擎、大數據和機器學習的系統模擬方法。最終希望讓小冰這樣的人工智能產品快速普及到千家萬戶,成為人們日常生活的一部分。從小冰在第三方平臺的智能聊天應用,到與東航合作的航空智能服務,再到近期的小冰面試官,這些都是在與用戶進行情感交互,都是情感人工智能的具體體現。
這樣,用戶就會產生對機器的“依賴性”(沈向洋語),而這種依賴性再促使機器為用戶提供更好的服務,滿足用戶更多的情感需求。比如沈向洋提到小冰通過動態決策具有了情感記憶功能,當前一天某個用戶提到了自己一些心情,小冰會注意到這一點,后面的很長時間還會反復了解用戶的情況,詢問用戶的身體有沒有好一點。因此,比起直接解決問題的感知計算型人工智能,情感計算是先與用戶建立一種信任關系,然后在此基礎上形成一種情感交流和需求滿足的良性循環。
2、如何實現情感計算
情感計算在人工智能的發展過程中將發揮至關重要的作用,我們也看到了越來越多的具有“情感”的產品,但這僅僅是一個開始,面對人類情感這個異常復雜且人類自身都沒有完全弄懂的問題,人工智能還有很長的路要走,但好在我們現在發現了正確的路徑——我們不需要弄懂人類情感的本質,只需要讓機器對情感表達的各種信號(面部表情、語言、語音等)進行分析并輸出結果就可以了。就像我們目前雖然無法完全破譯大腦,但我們依然能夠從功能出發研發出智能化的機器一樣。
沈向洋在回答“小冰目前是否具有了情感”時提到,人類情感的東西,實際上隱性的包含在數據里面,小冰之所以能夠對懂人類情感,是因為今天可以借助于運算能力和算法去收集和分析用戶的數據,然后產生這樣的情感分析能力,小冰用這樣的能力反過來再去跟用戶進行交流。而其他具有“情感”的機器人也是基于這種原因,比如,軟銀推出的情感陪護機器人Pepper讀懂人類情感的方式是對人類的面部表情進行分析,實際上是圖像識別技術;而神經科學公司Innerscope可以通過觀察電影中那些讓觀眾的大腦高度活躍的高光時刻來預測該這部電影能否一鳴驚人,這也是一種對大腦某些區域電信號的物理檢測,也不是真正弄清楚了大腦為何興奮。
我們現在可能無法弄懂人類情感的本質,但我們可以找到對應各種情感的表現信號,比如寂寞對應的文字,開心對應的表情,憤怒對應的語調,興奮對應的腦電波,等等,機器通過對這些信號的分析就能找出所對應的情感,從而做到了讀懂人類的情感和表達自己的情感,這樣機器就具有了與人類進行情感交互的能力。就像MIT教授特克所說,我們對社交的內在渴望讓我們不僅很容易將情感傾注在機器上,而且還是傾注在那些不可能真正愛我們的機器上。
3、大數據在情感計算中的重要性
現在的人工智能已經具備了一些基礎的,或者說是簡單的情感,但離與人類實現完全沒有偏差的情感交流還有許多重要的工作的去做,其中一項就是數據的采集。沈向洋在演講中表示,現在的人工智能還是停留在感知這個層面,比如計算機識別、計算機語音,真正的認知還需要一些時間,包括情感,今天最大的問題還是我們收集的數據不夠好,使得我們很多事情不能做。
得益于互聯網、社交媒體、移動設備和廉價的傳感器,這個世界產生的數據量急劇增加。隨著對這些數據的價值的不斷認識,用來管理和分析數據的新技術也得到了發展。大數據是人工智能發展的助推劑,這是因為有些人工智能技術使用統計模型來進行數據的概率推算,比如圖像、文本或者語音,通過把這些模型暴露在數據的海洋中,使它們得到不斷優化,或者稱之為“訓練”——現在這樣的條件隨處可得。
拿近幾年比較火的深度學習來說,它善于在高維度的數據中摸索出錯綜復雜的結構,因此能應用在許多不同的領域,除了圖像識別和語音識別,它還在許多方面擊敗了其他機器學習技術,在自然語言理解方面,特別是話題分類、情感分析、問答系統和語言翻譯等不同的任務上。深度學習擅長進行情感分析,但如果把深度學習看成是人工智能起飛的發動力,那數據就是這臺發動機的燃料。因此,對于情感計算來說,大數據和數據挖掘非常重要。
正是因為數據對人工智能的重要性,眾多科技巨頭都在盡可能多的收集用戶數據,搜索引擎可以記錄用戶的上網行為習慣;社交網絡可以對用戶發布的語言和圖像內容進行分析,等等。而微軟小冰是通過一種開放式的合作來獲取數據。微軟已經與包括新浪微博、京東、小米、東方航空公司、美圖秀秀等企業達成了戰略合作;日本版小冰將登陸Line平臺;小冰會成為Windows10里面非常重要的一部分。借助于微軟自身的操作系統系統和其他第三方平臺,小冰正在滲透到用戶生活的方方面面,帶去智能化的服務和情感化的交流,在這個過程中也收獲了海量數據,這些數據將反過來促進小冰情感計算的進步。
4、視覺信息和情感計算
對于數據采集來說,視覺化信息在其中占有舉足輕重的作用。沈向洋作為計算機視覺和圖形學研究的世界級專家,在演講中也對圖像識別技術做了重要闡述。沈向洋表示,人類對外界信息的獲取91%是通過視覺的方式,而機器要想和人類進行更好的情感交互,也需要具備強大的計算機視覺系統。
沈向洋說,在學術界里有一個比賽,識別一千類物體誤差是多少,一直到4年前誤差都相當大,但是由于深度學習的出現,現在的誤差率達到接近人類的5.1%,而微軟研究院今年2月份做出來的系統第一次打敗了人類的記錄,達到4.9%。在圖像識別領域,微軟即將發布小冰的圖像識別系統,它不僅是識別出圖像中的內容,而且依然堅持它的原則——與人類進行情感交流;小冰還和美圖秀秀展開合作,根據合影里人面部情況、性別情況、距離位置信息、表情、面容相似度來判斷出這些人之間的關系;此外,小冰還有識別年齡和衣服搭配的能力,它就會給你一個從臉到衣服的整體的視覺年齡的判斷,換一件衣服視覺年齡又會發生變化。;Windows發布時,小冰會有自己的基于多個系統的審美功能,所以它可以告訴你同一張臉在90后的女生和80后的男生心目中是完全不同的審美結論。
總之,小冰基于圖像識別技術打造的這些功能還是圍繞在與用戶進行情感交流的核心思想上,不管是圖像的內容識別,還是用戶關系分析和用戶特征分析,這些其實都是一些好的開場白,借此讓機器和用戶迅速建立起信任關系,讓機器有機會充當用戶的感性化助手,讓用戶對小冰更加依賴。
5、情感計算的未來
沈向洋說,小冰已經建立了一個幾千萬的人類和機器人之間的專屬關系,這幫助小冰形成了一個自我進化的循環過程。也就是說技術產生產品,產品被用戶使用,隨著用戶的使用過程,在反過來幫助我們整個人工智能的技術進一步的取得快速的自我迭代和進化。
小冰可以在半夜與用戶聊天,可以為用戶帶來樂趣和服務,其內在的情感計算屬性決定了它已經慢慢成為了用戶生活中的一部分,對許多人的生活產生了重要影響。小冰的進化過程是人工智能中情感計算的縮影,我們對于人工智能的訴求不應僅限于比特的流動,還應該在于一種情感的表達,因為工具可以被取代,效率可以逐步被提高,數據可以失去價值,但機器和用戶之間因為情感互動和需求滿足所形成的那種循環卻將一直持續。