12月21日,科大訊飛召開年度發(fā)布會,發(fā)布新產(chǎn)品,展示大型會議上同步將演講者語音轉(zhuǎn)換為文字的技術(shù),總結(jié)成績,公布“訊飛超腦”科研項目進展,最終展望未來:3~5年內(nèi),讓機器人考上大學!
低調(diào)了一年,科大訊飛在各家紛紛推出人工智能產(chǎn)品的2015年末尾,一次性宣告其在該領(lǐng)域的江湖地位。
這不禁讓筆者想起科大訊飛的2014年度發(fā)布會,主題為“語音點亮生活”。發(fā)布會上,科大訊飛為普羅大眾勾勒的還是“無論你在開車,看電視,還是玩手機,只要動動嘴就能“下命令”的美好生活。
但也正是在這場發(fā)布會上,科大訊飛宣布正式啟動“訊飛超腦”計劃,研發(fā)基于類人神經(jīng)網(wǎng)絡(luò)的認知智能引擎,賦予機器從“能聽會說”到“能理解會思考”的能力,并希望研發(fā)出第一個中文認知智能計算引擎。而其團隊由來自語言國家工程實驗室、清華大學、加拿大約克大學等10多位人工智能領(lǐng)域頂級專家組成,組長是來自加拿大約克大學的江輝教授。
1年過去,科大訊飛再提目標,讓機器人在3~5年內(nèi)考上大學。相較之下,暫不提谷歌大腦、微軟“Adam計劃”、Facebook邀請Yann LeCun建立的人工智能實驗室、Tesla創(chuàng)始人Elon Musk的“Open AI”有多牛,僅國內(nèi),李彥宏今年在某次活動上透露百腦大腦如今智力已達到3、4歲孩子智力水平,而人工智能初創(chuàng)團隊圖靈機器人在今年年底發(fā)布的機器人操作系統(tǒng)號稱已擁有4、5歲孩子智商,各家“大腦“拼智商時代似乎到來。
這不禁讓筆者覺得,今年年初那個文能療傷,武能打怪獸的暖男大白已經(jīng)不遠了。但冷靜下來發(fā)現(xiàn),訊飛超腦才1歲啊,它真能讓速記員失業(yè),讓機器人3年后考上大學嗎?這場野心勃勃的發(fā)布會似乎在努力回答這一問題。
先看訊飛超腦是怎么煉成的?
發(fā)布會上,科大訊飛董事長劉慶峰、副總裁兼研究院院長胡郁首次對其進行詳細解讀,筆者總結(jié)如下:
人工智能的三個層次是計算智能、感知智能和認知智能,前兩者機器的能力已經(jīng)超越人類,讓機器實現(xiàn)認知智能是科研焦點?;乜慈祟愖陨戆l(fā)展,產(chǎn)生認知智能的標志是語言的廣泛使用,因此科大訊飛選擇從”自然語言理解“這一方向去尋找人工智能突破口,實現(xiàn)感知智能和認知智能。
經(jīng)驗論,工業(yè)界在這一方向取得進步主要基于三大關(guān)鍵因素,即深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和漣漪效應(yīng),訊飛超腦也是基于這三大因素去實現(xiàn)的,深度神經(jīng)網(wǎng)絡(luò)是研究方法,大數(shù)據(jù)和漣漪效應(yīng)依靠的是科大訊飛的產(chǎn)業(yè)化路徑,即“產(chǎn)學研”一體化。
具體到感知智能(能聽會說)層面,訊飛超腦的構(gòu)(核)型(心)是利用FLN神經(jīng)網(wǎng)絡(luò)來讓機器聽懂世界,根據(jù)測試機構(gòu)ICDIR的測試結(jié)果,如今效果可以達到93%。
(核心在于構(gòu)型,即重構(gòu)的能力。因為所謂深度神經(jīng)網(wǎng)絡(luò)只是基于數(shù)學統(tǒng)計模式識別的一個很小分支,它起源于上世紀60年代,用于模擬人腦思考方式。2012年,訊飛將深度神經(jīng)網(wǎng)絡(luò)用于參數(shù)語音合成,使其效果提升30%。但人腦記憶包括短時記憶、瞬時記憶和長時記憶,而深度神經(jīng)網(wǎng)絡(luò)處理短時記憶能力比較弱,新的方式叫回歸神經(jīng)網(wǎng)絡(luò),它可以將前一個時塊的信息輸入到當前時刻,以此提高記憶能力。而訊飛自己的構(gòu)型FLN神經(jīng)網(wǎng)絡(luò)可縮短響應(yīng)時間。)
在認知層面,當感知層面的各種信息集到認知層面,類大腦就要去進行語音理解、知識表達、邏輯推理和最后決策。簡單來說,就像你看到一只貓,腦海中形成貓的概念,同時還知道摸貓的感覺。為了實現(xiàn)這樣一個系統(tǒng),訊飛超腦框架被定義為自然意義下的語言生成及知識表達推理。而這其中有詞語、句子、篇章等不同層面。在最難的篇章層面,目前訊飛超腦可以做到的正確率為51%。
而在此基礎(chǔ)上,訊飛超腦要做兩件事情,第一,語言生成與理解,第二,知識的表述及推理。目前,訊飛超腦已可以作詩、評分等。還是數(shù)據(jù)說話:
此外,訊飛超腦還有一個重要特點,它沒有喜怒哀樂。“我們從大腦中學習的越多,越可以把大腦主管智能的這部分和主管自我意識,即喜怒哀樂的這部分區(qū)分開來。我們可以讓將來人工智能機器人掌握智能,不一定非要有自我意識和喜怒哀樂。”胡郁介紹。
圍繞訊飛超腦,這兩年科大訊飛做了什么?
科大訊飛2014年年報顯示,其營業(yè)收入為17.7億,研發(fā)投入為5.1億,占營業(yè)收入的29.18% 。而圍繞訊飛超腦計劃,其業(yè)務(wù)在面向各行業(yè)數(shù)千家開發(fā)伙伴提供語音能力的基礎(chǔ)上,加快布局教育、移動互聯(lián)、智能客服、智能電視、車載等領(lǐng)域。2015年上半年報告顯示,其上半年營業(yè)收入10.3億,同比增長60.44%,主要是行業(yè)應(yīng)用產(chǎn)品等業(yè)務(wù)增長所致,這也反映出其在行業(yè)拓展方面的成績。
劉慶峰認為,這是因為科大訊飛做對了三件事,首先選準了切入點,從語音合成到語音識別再到語音理解,并將其產(chǎn)業(yè)化形成自我造血和迭代;其次是有真正有抱負的核心人才,最后是產(chǎn)業(yè)路徑,從語音云平臺到教育、客服等領(lǐng)域,具有2B和2C的雙輪驅(qū)動能力。
下一步,科大訊飛計劃怎么做?
在創(chuàng)業(yè)邦看來,除了其基于語音交互技術(shù)系列產(chǎn)品帶來的大數(shù)據(jù)和漣漪效應(yīng),科大訊飛新推出的人機交互新產(chǎn)品AIUI和其在人工智能領(lǐng)域的布局才將是關(guān)鍵。
1、 AIUI、標準、全球化
據(jù)介紹,科大訊飛AIUI系統(tǒng)是集成了包括全雙工技術(shù)、麥克風陳列技術(shù)、聲紋識別技術(shù)、方言識別、語義理解技術(shù)和內(nèi)容服務(wù)等科研成果和服務(wù)的產(chǎn)品。
這也將是其在行業(yè)布局的拳頭產(chǎn)品,“基于此,我們會積極制定標準,并將標準利用AIUI優(yōu)勢全球化。 教育領(lǐng)域為例,目前,科大訊飛已經(jīng)在同新加坡、澳洲、東南亞國家合作進行語音評測。”胡郁告訴創(chuàng)業(yè)邦。
2、智能機器人領(lǐng)域布局
在智能機器人行業(yè),科大訊飛有三方面的計劃。第一,為所有機器人公司提供語音和語言交互方案,第二,選擇家庭服務(wù)機器人、產(chǎn)業(yè)機器人領(lǐng)域的優(yōu)秀公司,為其提供定制方案和投資;第三,主導開發(fā)機器人。
劉慶峰介紹,科大訊飛目前看好的方向有三個,第一是以陪伴和安防為主的家庭機器人;第二是教育行業(yè)的真正人型機器人或虛擬服務(wù)形態(tài)機器人;第三是客服領(lǐng)域,代替人工的機器人。
而創(chuàng)業(yè)邦查詢科大訊飛2014年年報和2015年上半年、第三季度報告,尚未發(fā)現(xiàn)其具體在智能機器人領(lǐng)域的投資,但發(fā)布會上可以看到,科大訊飛更多是將以提供解決方案形式參與其中,例如同Ninebot&Segway合作開發(fā)了“服務(wù)機器人”、ROOBO、UBTECH開發(fā)的系列機器人也利用了其核心技術(shù)等。
最后,創(chuàng)業(yè)邦不禁幻想,幾年后,戴著各家“大腦”的機器人共同坐在考場上,孰優(yōu)孰劣,考上一本再說吧!