11月18日,第五屆聲博會暨2022科大訊飛全球1024開發(fā)者節(jié)在合肥奧體中心盛大開幕,科大訊飛董事長劉慶峰在發(fā)表題為《因為看見,所以堅信》演講時表示,未來機器人會像水、電一樣走進每個家庭,人工智能賦能機器人要解決4大核心問題。
一是多模感知,不僅是語音感知,還要有視覺、有眼神、有面部表情、有肢體語言、有環(huán)境的綜合感知,包括味覺觸覺等;二是要有深度理解和學習能力,可充分理解我們所面對的物體、人物和環(huán)境等;三是可多維表達,不僅能用語音讀出來,還要有虛擬形象、背景畫面等;四是運動智能,行動平穩(wěn),能夠靈活避障,適應各種復雜地形。
【資料圖】
截止目前,科大訊飛在上述關鍵技術領域均取得重要突破。其中,在深度理解方面,知識推理技術再創(chuàng)里程碑,科大訊飛承建的認知智能全國重點實驗室在科學常識推理挑戰(zhàn)賽OpenBookQA上奪冠。。
在多模感知方面,語音是人類最自然的溝通方式。語音的交互既包括了語音聽寫,將語音立刻變成文字。
語音識別最難的是高噪音場合下的識別能力,借助將語音識別和嘴型識別多種模式識別相融合,科大訊飛在高噪音復雜場景的識別正確率位于頭部全球,現(xiàn)在奔馳、寶馬、法拉利等很多的國際汽車品牌都在跟訊飛進行合作。
在多維表達能力方面,劉慶峰表示,目前科大訊飛的語音合成已經(jīng)實現(xiàn)從超過普通人發(fā)音水平到高表現(xiàn)力個性化。虛擬主播已廣泛用于媒體傳播,虛擬主播在主流媒體和各類場景中廣泛使用。
科大訊飛通過個性化真人捏臉系統(tǒng),可以快速實現(xiàn)虛擬人生產(chǎn)。虛擬客服、虛擬醫(yī)生、虛擬老師、虛擬員工,以及虛擬志愿者、虛擬偶像等,可以在虛擬現(xiàn)實中對人類產(chǎn)生更切實的幫助。
今年,數(shù)字員工正在加速進入到人機協(xié)同新階段,利用人工大腦,再結合IT工作流程的自動化,可以迅速完成人們在日常辦公和生產(chǎn)中的財務、電子合同管理、招聘等方面的工作。
最后是運動智能,目前,使用了訊飛AI算法的四足機器狗已經(jīng)可以輕松應付各種復雜場景,在不同地形上行動自如。
有了運動能力加持,劉慶峰表示,未來人工智能賦能整個實體經(jīng)濟、賦能每個家庭將變得更加容易實現(xiàn)。
讓人工智能懂知識、善學習、能進化,讓機器人走進每個家庭,是科大訊飛一直以來的愿望。為了這一愿望最終實現(xiàn),科大訊飛于今年1月份正式啟動“訊飛超腦2030計劃”。
按照規(guī)劃,該計劃共分三個重要節(jié)點:
第一階段是2022-2023年,科大訊飛將掌握仿生機器人本體技術、多模態(tài)感知及表達技術和主動對話技術,發(fā)布軟硬一體化機器人可養(yǎng)成的寵物玩具以及專業(yè)虛擬人家族。
第二階段是2023-2025年,將專注多傳感融合運動控制技術、多模態(tài)情感理解及持續(xù)學習技術和深度知識理解及運用技術,發(fā)布自適應行走的外骨骼機器人和陪伴虛擬人家族。
第三階段是2025-2030年,將攻堅復雜場景融合決策與柔性驅動、跨模態(tài)融合自主學習技術和常識推理及聯(lián)想決策技術,發(fā)布懂知識會學習的陪伴機器人和能夠自主學習的虛擬人。
從目前的進展來看,科大訊飛正在朝這個目標穩(wěn)步邁進。
免責聲明:此文內(nèi)容為本網(wǎng)站轉載自其他媒體企業(yè)宣傳資訊,僅代表作者個人觀點,與本網(wǎng)無關。僅供讀者參考,并請自行核實相關內(nèi)容。您若對稿件處理有任何疑問或質疑,請即與我們聯(lián)系,本網(wǎng)將迅速給您回應并做處理。
郵箱:contactus@stockstar.com 處理時間:9:00—17:00。


















