人民網
人民網>>人民網通信頻道

智能語音:爭奪人工智能皇冠上的“明珠”

郜小平
2019年02月22日08:11 | 來源:南方日報
小字號
原標題:智能語音:爭奪人工智能皇冠上的“明珠”

  吼一吼就可登App?近日,雲知聲聲紋登錄系統,成功率可達99%。與智能語音先行者科大訊飛相似,兩家公司創始人師出同門。

  除了專業的語音技術廠商,互聯網科技巨頭也紛紛涌入語音賽道中來。2月20日,在小米的新品發布上,小愛觸屏音箱亮相,而在這兩天前,騰訊也出面澄清,聽聽(音箱)一直在正常研發和銷售運營,面向行業輸出全棧語音人工智能解決方案能力。

  智能語音被譽為人工智能皇冠上的“明珠”,近段時間以來熱度不減,隨著深度學習技術的突破,大數據技術以及自然語言理解能力的提升,帶動了一波產業熱潮,除了在教育、客服、電信等傳統行業之外,還開辟出了車載、家居、醫療、智能硬件等語音技術應用新天地。

  “聽懂”人話,語音方案“百花齊放”

  走進廣州迅羽通信技術公司的客服中心,敲擊鍵盤的聲音不再此起彼伏,客服人員更多在傾聽和安靜地回復來電。

  迅羽先后承運了香港快運、電訊盈科、和記電訊、東亞銀行、亞航以及廣東省12348司法、廣東電力與國稅熱線等國內外超大型客服服務。一直以來,傳統的客服呼叫中心是勞動密集型產業,由於內地人力成本優勢,香港一些電信業、銀行業、航空業等將呼叫中心外包,但隨著人力成本的提升,呼叫中心的利潤進一步被壓縮。

  從去年9月起,迅羽聯合哈工大共同成立人工智能自動問答技術研發實驗室,著手引入AI。經測算,有七成動作是可替代的——客服人員大部分時間都在文字錄入和反復確認,而如今,每當客戶一報完身份証號碼、家庭地址等信息時,就已經自動錄入系統,而客服人員則可專注聽取客戶的反饋。在台風等極端天氣下,面對激增的訂改機票業務也更從容,避免了人員配備過多。

  機器能“聽懂”人話,已經深入各種場景。科大訊飛與上海高院合作的刑事案件輔助辦案系統投用后,目前已開始在全國范圍內擴展,輔助辦案系統有望在國內法院系統全面鋪開,並向更多罪種、民商行政案件等方向延伸,截至今年初,審訊產品於法庭拓展迅速,已覆蓋815個法院、4200個法庭。

  陪你聊,陪你跳,會管家,會傳情……深圳狗尾草智能科技公司不僅推出了呆萌又暖心的情感社交機器人,還打造出全球首個3D全息AI虛擬生命“琥珀”,在日趨白熱化的語音市場中走出了一條差異化道路。

  “幫我調下明天上午7點的鬧鐘。”語音識別距離大眾並不遙遠,在移動終端上,用戶可以實現手機讀短信、介紹餐廳、詢問天氣、語音設置鬧鐘等,智能音箱更被認為是控制智能家居的自然入口,從“百箱大戰”到現在的語音方案“百花齊放”,互聯網平台商、語音技術硬件服務商、內容和雲服務商、芯片商等,都相繼推出了各自支持設備智能化升級的方案。

  不是替代人,而是更好發揮人的價值

  通過人工智能語音交互,機器不僅能聽懂人話,還能更好地發掘人的價值。

  通過匯聚學生的家庭作業、課堂訓練數據,科大訊飛用語音識別對內容進行語義理解分析,判斷作業對錯,提供改進方案。“人工智能+大數據結合因材施教,比如同一個班學生對內容接受度是不一樣的,每個人的知識點情況掌握又是怎樣的,單個學生上一個知識點有沒有掌握,都可以有針對性地改進。”科大訊飛高級副總裁杜蘭說。

  杜蘭說,AI賦能教育產業不是要取代老師這個職業,而是可替代批改等瑣碎事務,解放老師更多時間。

  迅羽副總經理黃勉超也同樣認為,AI的出現,並不是要用機器人來取代人,而是與機器有更好分工,“有一半用戶是帶著情緒或投訴打進電話來,但如果他們面對的是一台毫無表情的機器,隻會繼續帶著憤怒挂掉電話”。

  黃勉超還發現,引入AI后,客服業務有了更多科技含量,品牌形象大為提升,公司在招人時也更有底氣,“以前這行業的人會覺得,大好青春就在這1平米的格子間日復一日從事簡單枯燥的事情,他們會覺得沒有前途,而現在工作沒有那麼枯燥后,人員流動沒有那麼頻繁,而且人員培訓周期也大為縮短,新手很快就可以進入角色,在整個過程中,人的價值就發揮出來了”。

  向B端發力,與產業結合構筑生態

  盡管智能音箱大戰火熱,但不少人始終認為,目前AI產品尤其是語音產品還只是一種年輕人的科技玩具,實用性並不強。

  狗尾草創始人、CEO邱楠對此表示,任何一個代表未來方向的科技類產品的流行,比如手機、電腦、智能手表等,一定是從年輕人開始。年輕人對AI有想象力,他們知道自己需要的場景是怎樣的。盡管現有AI技術還不足夠成熟,但這就和電腦早期發展一樣,技術本身是需要時間去發展的。當年PC也同樣是從最開始的性能不足到后面慢慢被消費者接受。

  C端產品火過一陣后,越來越多的玩家開始深入B端,與行業相結合。黃勉超說,C端產品可以戲謔、搞笑的方式與用戶溝通,當用戶說我要在附近找吃時,智能音箱回答不了就會說,“哎呀,你是個吃貨”,但客服語音對答就不能有絲毫調侃,用戶查詢明天下午3:30是否有飛往大阪的航班,有就是有,沒有就是沒有,不可能存在第三個答案。

  不過,整體移動互聯網用戶增長見頂,以及BAT等行家也紛紛入局,語音技術日趨成熟,客戶變對手,讓科大訊飛的技術優勢漸消。但杜蘭認為,BAT的到來會讓語音技術變得更好,這片海域是非常寬闊的,並不存在相互競爭的問題。

  而科大訊飛也在加快構建一個融合共享的人工智能產業生態。有這樣一個經典的故事:一位四川人石城川,11歲那年高燒因失去聽覺,2015年,他發現科大訊飛有一種語音識別技術,盡管自己聽不到自己的發音,但是可以通過這種技術矯正自己發音,並識別正常人的語音轉換成文字,這樣就可以實現自己和正常人的對話。在咿咿呀呀的發音中,他重拾語言能力。后來,他創立了“音書”App,為聽障者和健聽者之間建立溝通的橋梁。

  目前,科大訊飛開放平台已為超過90萬開發者提供服務,2018年,共有55.8%的創業團隊借助科大訊飛技術實現創業夢想。

  隨著技術迭代更新越來越快,語音識別准確率方面的提升越來越難,在眾多玩家之間,競爭差距是更大還是更小?“企業間並不存在太大的技術差距,早期都是同一個技術公司,隨著技術紅利和技術壁壘的下降,后期推動開源,不只是看單一的技術能力。”邱楠說,論技術,有哪一家企業能競爭過中科院?但企業是給技術找到技術場景,在此基礎上不斷延展,競爭的維度一定是多元的,語音技術的壁壘也不會一直持續下去。

  “我把企業分成兩大類,分別是技術輸出型和產品創新型,前者如谷歌,輸出安卓系統﹔后者如蘋果,其技術能力是為自己定義差異化、尋找差異化服務。”邱楠說,我給我們的定位就是追求產品的差異化和創新性。

  ■專家點評

  智能語音市場整體處於啟動期

  ●廣州市社會科學院產業所副研究員 陳峰

  智能語音是最早落地的人工智能技術。隨著行業數據資源的積累,深度學習算法的進步,以及與其他人工智能技術之間的整合,語音識別、語義理解、語音合成技術將取得進一步突破,語音交互有望成為新一代人機交互的主要方式。

  目前,國內外幾乎所有的科技巨頭都相繼進入了智能語音市場,國外有IBM的Watson、Google Now、蘋果的Siri、微軟的Cortana、Facebook的Message Platform、亞馬遜的Aleax等,國內有阿裡的天貓精靈、百度的度秘、騰訊的微信語音,以及科大訊飛、華為、小米、雲知聲、依圖等發展的智能語音技術和產品。據《2017-2018中國智能語音產業白皮書》的數據顯示,2014年至2018年,中國智能語音產業規模由30億元增長至159.7億元,五年間增長了五倍。雖然有這麼多的科技巨頭和新創AI企業進入智能語音領域,產業規模也快速增長,但智能語音市場整體依然處於啟動期,智能語音產品和技術變現尚處於起步階段,真正成熟的語音產品還需要時間的打磨。

  國家高度重視新一代人工智能產業的發展,隨著新一代人工智能發展規劃的啟動實施,加快產業化和應用是著力點。工信部將進一步推動以智能語音為代表的人工智能核心技術發展,加強技術攻關、促進行業融合應用、優化發展環境,務實推動智能語音產業規模發展。可以預見,隨著行業應用和場景的大規模切入,智能語音產品將快速迭代,產品的性能和用戶體驗也會不斷提升,智能語音的發展大有可期。

  南方日報記者 郜小平

(責編:趙超、孟哲)

分享讓更多人看到

返回頂部