相比于傳統(tǒng)的高新技術(shù),中國是有優(yōu)勢(shì)的。
第一個(gè)是經(jīng)過這么多年核心技術(shù)的發(fā)展,特別是中國863計(jì)劃以后,大家會(huì)注意到,在這一次的人工智能浪潮中,國內(nèi)的企業(yè)和國外企業(yè)相比一點(diǎn)沒有落后。如果說,在5、60年代和7、80年代那兩次(人工智能發(fā)展期),中國企業(yè)還沒有辦法和外國企業(yè)在技術(shù)上相比的話,那在這次(發(fā)展浪潮里),我們完全走在了前面。
第二個(gè)方面是在于,任何機(jī)器的交互離不開產(chǎn)業(yè)環(huán)境和商業(yè)生態(tài)。這個(gè)產(chǎn)業(yè)環(huán)境和商業(yè)生態(tài),在7、80年代之前是什么?是電子產(chǎn)品。
大家都知道,中國的電子產(chǎn)品在7、80年代才剛剛起步,完全不具備在全球市場(chǎng)競(jìng)爭(zhēng)的能力。但是在現(xiàn)在,我們的依賴的是什么產(chǎn)品?是智能手機(jī),是互聯(lián)網(wǎng)產(chǎn)品和移動(dòng)互聯(lián)網(wǎng)產(chǎn)品。而在這方面,整個(gè)中國不僅是從事語音技術(shù)的公司對(duì)此有依賴,相關(guān)的商業(yè)公司也是,比如網(wǎng)上購票,還有各種的O2O。
作為一種連接型的技術(shù),把人和機(jī)器連接在一起之后,語音技術(shù)如果想在物聯(lián)網(wǎng)里面占領(lǐng)很多市場(chǎng),就必須和這些后臺(tái)的服務(wù)連接起來。所以說從整個(gè)商業(yè)和技術(shù)環(huán)境上來講,中國現(xiàn)在應(yīng)該說也是很好,因?yàn)槲覀兊幕ヂ?lián)網(wǎng)公司和美國方面來講,已經(jīng)是一個(gè)同臺(tái)競(jìng)技,甚至均分天下的態(tài)勢(shì)。
在這點(diǎn)上,我覺得這為我們?cè)趯?,在物?lián)網(wǎng)時(shí)代用語音交互作為人機(jī)交互的主要手段,并引發(fā)相應(yīng)的商業(yè)模式,提供了很好的基礎(chǔ)。
而第三點(diǎn),大家會(huì)注意到,無論是什么操作系統(tǒng),PC的也好,手機(jī)的也好,雖然這些操作系統(tǒng)可能是美國的公司做的,比如說微軟、谷歌,但是要注意到,輸入法這個(gè)部分,都是中國公司占主導(dǎo)地位。
為什么?因?yàn)樗驼Z言有關(guān)。一個(gè)簡(jiǎn)單的鍵盤輸入法,就因?yàn)檎Z言之間的差異導(dǎo)致這么大的差異。那么大家可以想象一下,一個(gè)包括了語音識(shí)別、語音合成、自然語言理解的語音系統(tǒng),語言之間的壁壘會(huì)有多高。中國公司在這方面會(huì)完全具有優(yōu)勢(shì)。
所以說從這三個(gè)方面來講,我們?cè)趯淼奈锫?lián)網(wǎng)時(shí)代里面,無論是從技術(shù)本身,還是從語言的差異化本身,還是從商業(yè)的生態(tài)和環(huán)境本身,我們現(xiàn)在都和國外公司完全處于同一個(gè)水平。所以在這一波浪潮中,我們有信心中國會(huì)成長(zhǎng)出一批國際水準(zhǔn)的公司出來。
不可否認(rèn),我們對(duì)人工智能的了解,不要說產(chǎn)業(yè)界,就是媒體,其實(shí)對(duì)人工智能更多的認(rèn)識(shí)是落在應(yīng)用特性和娛樂特性上。而美國的很多人,是真正從理論的角度,進(jìn)行非常深入的探討。
如果我們只談?wù)搼?yīng)用和娛樂層面上的東西的話,我們是得不了圖靈獎(jiǎng)的,也得不了諾貝爾獎(jiǎng),也不能創(chuàng)造信息論這些東西。美國所謂原創(chuàng)性的研究,是從理論的根基出發(fā),建立一套完整的思維方式。而有許多理論研究的東西是不會(huì)產(chǎn)業(yè)化的,沒有產(chǎn)業(yè)化價(jià)值的。它只是一種哲學(xué)化的思考,而這些東西我們沒有關(guān)心。
哲學(xué)會(huì)產(chǎn)生真正的創(chuàng)新。創(chuàng)新有很多種,有一種是在最原始的技術(shù)上創(chuàng)新。而我們講的很多其實(shí)是在應(yīng)用層面上創(chuàng)新,或者在技術(shù)層面上創(chuàng)新,但不是在科學(xué)的層面上去發(fā)現(xiàn)和創(chuàng)新。
所以在這個(gè)層面上來講,我覺得國內(nèi)應(yīng)該從兩個(gè)方面,恰恰是我們的研究的部分,我們的研究院所,我們的高校,可能應(yīng)該更加著重于在理論方面的深入。而我們的產(chǎn)業(yè)界,不應(yīng)該僅僅去應(yīng)用它,而且應(yīng)該在技術(shù)方面去做大規(guī)模的整合和創(chuàng)新。
因?yàn)槿斯ぶ悄芫拖窈娇瞻l(fā)動(dòng)機(jī)一樣,里面有非常非常多的零件,有視覺的,有聽覺的。你要把它們綜合在一起,而且每一個(gè)都要做到世界上最好。我覺得現(xiàn)在學(xué)術(shù)界可能因?yàn)橐彤a(chǎn)業(yè)界對(duì)接,做了很多技術(shù)層面上,和應(yīng)用相關(guān)的創(chuàng)新。而產(chǎn)業(yè)界還沒有能力,來做整體性、系統(tǒng)性創(chuàng)新的工作,比較少。所以我覺得這就是我們和美國相比有差異的所在。
我覺得我們?cè)趯W(xué)術(shù)上,理論的深度,和愿意去花長(zhǎng)時(shí)間究本質(zhì)的工作還是太少,還應(yīng)該增強(qiáng)。
智能語音是訊飛整個(gè)人工智能戰(zhàn)略中的一部分。而訊飛人工智能戰(zhàn)略的核心,是基于語音和語言的認(rèn)知智能。
什么是認(rèn)知智能?比如在醫(yī)療的過程中,我們需要通過病例幫助醫(yī)生分析病人可能會(huì)得什么病,吃什么藥,這就是一種認(rèn)知智能。包括在教育里面,我們通過手寫的試卷來判斷學(xué)生的得分,并給出改進(jìn)的意見。這些都是和語言,和人的概念和推理有關(guān)的。除了交互之外,它們能給我們的生活帶來更多改進(jìn)。
我再舉一個(gè)例子,和我們的安全有關(guān)。在7、8月份,電話詐騙非常猖獗,特別是臨開學(xué)的那段時(shí)間。有很多上學(xué)的同學(xué)不是因?yàn)樵p騙,做出了很多不理性的事情么?安徽省8月份電話詐騙的發(fā)生次數(shù)下降了60%,而同期全國其他地區(qū)增長(zhǎng)了58%。為什么能做到這點(diǎn)?因?yàn)槲覀冊(cè)诎不帐∷械碾娫捓锩孀隽艘粋€(gè)監(jiān)控系統(tǒng),它可以對(duì)通話內(nèi)容進(jìn)行分析,對(duì)那些詐騙性質(zhì)行為自動(dòng)作出提醒,而這個(gè)過程是完全自動(dòng)化的。這樣就為安徽省避免了5個(gè)億以上的可能的損失。
我相信大家也注意到了,我們演講的時(shí)候會(huì)有一個(gè)同步實(shí)時(shí)顯示文字的技術(shù)。就是說我在上面講話的同時(shí),文字出來了,對(duì)你們(記者)來說是最有用的。這個(gè)產(chǎn)品馬上就要開發(fā)出來了,最理想的狀態(tài)就是我在這邊說話,你們的屏幕上就能實(shí)時(shí)顯示出來我講的內(nèi)容。
在去年的發(fā)布會(huì)上,我們發(fā)布了這個(gè)功能以后。大家可以看到,今年阿里和搜狗都展示了同樣的技術(shù)。這也代表了一個(gè)發(fā)展方向。這個(gè)方向可能和語音交互是沒有關(guān)系的,但和語音(技術(shù))有關(guān)系。
首先iPhone我們是搞不定的,除非破解它。iPhone本身就是一個(gè)垂直的生態(tài)。而且這個(gè)問題不僅僅是在中國,美國也是。但是iPhone自己的語音技術(shù)很差,導(dǎo)致它的用戶體驗(yàn)相對(duì)于其他公司、產(chǎn)品會(huì)有劣勢(shì)。
但對(duì)Android來講,情況是不一樣的。因?yàn)楣雀枰仓繟ndroid有全球不通用的地方。比如說審美、風(fēng)格,比如說語言相關(guān)的部分:輸入法、交互。這就造成了Android系統(tǒng)在設(shè)計(jì)的時(shí)候就是一個(gè)比較開放的系統(tǒng)。
這就造成了第三方UI其實(shí)接管了中間層的一些功能,也導(dǎo)致了這些領(lǐng)域是可以進(jìn)入的。而且現(xiàn)在很多的智能硬件,其實(shí)用的都是Android的操作系統(tǒng)。
我相信在將來的發(fā)展中,世界上會(huì)存在兩種公司。一種公司是垂直產(chǎn)品型公司,比如說做手機(jī),就一直做手機(jī),手機(jī)技術(shù)不可能給別人用。世界上看起來,最多有8到9家這樣的手機(jī)公司,加起來產(chǎn)量可能到全球的90%-到95%以上。
另外還有些公司,像谷歌這樣,就是平臺(tái)型的公司。我提供一些基礎(chǔ)性的工作,給各個(gè)廠商都能用。但是做了平臺(tái)之后就要面臨控制權(quán)大小的問題。有可能控制權(quán)不在自己手上,而在手機(jī)廠商手上。
所以在未來的發(fā)展過程里,訊飛要做的不僅僅是手機(jī),而是我剛才說的各個(gè)領(lǐng)域。這些領(lǐng)域里,有的是幾家大公司聯(lián)合壟斷了市場(chǎng),有的領(lǐng)域會(huì)是成千上萬個(gè)公司來分享市場(chǎng)。比如說玩具、機(jī)器人,就是后面的這種。而且我相信現(xiàn)在這么多機(jī)器人公司,到最后也不會(huì)合并成大的公司,因?yàn)橛脩粜枰鄻有缘膫€(gè)性化產(chǎn)品。而手機(jī)這種產(chǎn)品,雖然有差異,但還是個(gè)工具性質(zhì)的產(chǎn)品。
所以訊飛會(huì)成為一個(gè)平臺(tái)型的公司,不僅幫平臺(tái)上的公司提供核心技術(shù),甚至可以幫它們整合各種各樣的資源。我覺得我們是用這樣一個(gè)思路來發(fā)展的。
場(chǎng)景的問題其實(shí)和剛才的問題,就是內(nèi)容方面是非常有關(guān)系的。我們?nèi)嗽谔幚硪患碌臅r(shí)候,你可以想象下你在訂一張票,你所要和別人交談的內(nèi)容,嘴里面發(fā)出的指令,其實(shí)相對(duì)來講不是開放的集合,是封閉的集合。
這里最難的問題就是怎么把它豐富起來,怎么讓它多覆蓋(些場(chǎng)景)。我們現(xiàn)在的做法就是一個(gè)點(diǎn)一個(gè)點(diǎn)去做。每做完一個(gè)點(diǎn)就拿到實(shí)際里去用。越來越多的人用了之后,語言的覆蓋性就會(huì)越來越好,這個(gè)場(chǎng)景的問題就解決了。
那在這個(gè)過程里怎么加速這個(gè)問題呢?我們?cè)趺丛谧鲆恍﹫?chǎng)景的時(shí)候,其他場(chǎng)景也能變快呢?這就是我們?yōu)槭裁匆瞿切└呖即痤}機(jī)器人的原因。它能學(xué)會(huì)系統(tǒng)學(xué)習(xí)的方法,當(dāng)我們做了一兩個(gè)場(chǎng)景之后,就能轉(zhuǎn)移到其他很多場(chǎng)景上。這樣能使我們的覆蓋快速增加。我們通過這樣的方式來解決這樣的問題。
當(dāng)然擔(dān)心,但擔(dān)心了也沒用。
任何一個(gè)新技術(shù)出來的時(shí)候都會(huì)魚龍混雜。人類有夸大預(yù)期的本性在里面,是人類的社會(huì)特性決定的。認(rèn)識(shí)到這個(gè)規(guī)律之后就不會(huì)覺得這事是什么壞事。我們能做的就是在局部上防止過熱。
所以我們應(yīng)該考慮的是如何利用這種周期性的狂熱來合理布局。從投資人角度來說,投資人很容易找到錢,但投資人可以利用這種環(huán)境去找最有價(jià)值的公司來投資。所以只能說改變你能改變的,接受你不能改變的。
我覺得在人工智能領(lǐng)域里有兩個(gè)領(lǐng)域是有價(jià)值的。一個(gè)是人工智能核心技術(shù)研究,他們不一定有經(jīng)驗(yàn)去進(jìn)行商業(yè)化,我們可以投資他,提供經(jīng)驗(yàn)。另外是如何利用人工智能技術(shù)來解決現(xiàn)實(shí)問題,這通常在大的公司里面,他們都有很大的產(chǎn)業(yè)基礎(chǔ),只要把新技術(shù)嫁接進(jìn)來。
大部分的公司并不會(huì)因?yàn)槿斯ぶ悄艹霈F(xiàn)而進(jìn)行重組和重構(gòu)。比如農(nóng)業(yè),人工智能只是一個(gè)改進(jìn)的工具,所以在這些領(lǐng)域里,原有的大公司依然占有優(yōu)勢(shì)。所以更有價(jià)值的是去尋找哪些懂得怎么利用人工智能的人來投資。
比較公司要看戰(zhàn)略,我不是特別了解百度的戰(zhàn)略,因?yàn)槊磕臧俣鹊闹攸c(diǎn)不一樣。但是過去三年里面我們一直在做運(yùn)算智能、感知智能和認(rèn)知智能,而且會(huì)定期公布進(jìn)展,有清晰的商業(yè)模式。這是我們和互聯(lián)網(wǎng)公司的不同,是專注科技創(chuàng)新的公司??萍紕?chuàng)新公司更像是爬山的公司,一步一步去爬到頂峰。
但互聯(lián)網(wǎng)有很多機(jī)會(huì),所以很多公司都是沖浪型的,需要不停地抓住下一個(gè)浪潮,如果不是,就換了。
我們還是堅(jiān)持做人工智能,堅(jiān)信交互革命那天會(huì)到來。所以一個(gè)公司要有清晰地戰(zhàn)略,而且要把戰(zhàn)略傳達(dá)給別人。我們戰(zhàn)略十分清晰:我們是一個(gè)技術(shù)創(chuàng)新性公司,解決人機(jī)交互這個(gè)問題。
在行業(yè)里面,我們用我們的人工智能技術(shù)幫助醫(yī)院、學(xué)校、司法、金融機(jī)構(gòu)去改善他們的問題。這里面有很多“臟活累活”,要做很多結(jié)合型的工作?;ヂ?lián)網(wǎng)公司追求收益,毛利要非常高。而且有很多“臟活”不一定愿意去干。但在產(chǎn)業(yè)互聯(lián)網(wǎng)階段,和傳統(tǒng)領(lǐng)域結(jié)合,是少不了這一步的。
當(dāng)然不是說一味去做基礎(chǔ)性的工作。上面要有頂天立地的東西,但是不能因?yàn)橛羞@個(gè)就不能彎腰了,絕對(duì)不是這個(gè)概念。
所以我覺得中國需要更多爬山型的公司,無論外面怎么變化。外面無論是互聯(lián)網(wǎng)時(shí)代也好,移動(dòng)互聯(lián)網(wǎng)時(shí)代也好,物聯(lián)網(wǎng)時(shí)代也好,這都是外圍環(huán)境的變化。但是公司征服一個(gè)領(lǐng)域,具有爬山的本質(zhì)是必不可少的。