發(fā)布日期:2019-05-17
騰訊科技訊 5月16日,全球無障礙宣傳日之際,騰訊優(yōu)圖實(shí)驗(yàn)室宣布攻克AI手語識(shí)別技術(shù)挑戰(zhàn),聯(lián)合深圳市信息無障礙研究會(huì)發(fā)布“優(yōu)圖AI手語翻譯機(jī)”,致力于通過人工智能技術(shù)為聽障人群搭建無障礙溝通平臺(tái)。
據(jù)優(yōu)圖實(shí)驗(yàn)室AI手語識(shí)別項(xiàng)目組研究員陽趙陽介紹,優(yōu)圖AI手語翻譯機(jī)以普通攝像頭作為手語采集裝置,依托高性能計(jì)算機(jī)進(jìn)行后臺(tái)運(yùn)算,用戶只需面對攝像頭完成手語表達(dá),翻譯機(jī)屏幕界面就能快速把手語轉(zhuǎn)換為文字,幫助聽障人士和健聽人士進(jìn)行正常交流,未來有望在機(jī)場、高鐵、民政窗口等公共場所部署應(yīng)用,助力信息無障礙城市建設(shè)。
這也是繼本月初優(yōu)圖實(shí)驗(yàn)室宣布通過人工智能技術(shù)幫助警方尋回多名被拐超過10年兒童之后,騰訊踐行“科技向善”理念的又一體現(xiàn),也是騰訊在計(jì)算機(jī)視覺人工智能領(lǐng)域的又一重大技術(shù)突破。
攻克手語識(shí)別難題,自研算法解決溝通障礙
據(jù)世界衛(wèi)生組織最新數(shù)據(jù)顯示,目前全球約有4.66億人患有殘疾性聽力損失,超過全世界人口的5%;據(jù)估計(jì),到2050年這一數(shù)字將達(dá)到9億,全球?qū)⒂屑s十分之一的人出現(xiàn)殘疾性聽力損失。據(jù)北京聽力協(xié)會(huì)2017年預(yù)估數(shù)據(jù),我國聽力障礙人士已達(dá)7200萬,其中有2700萬聽障者需通過手語等方式進(jìn)行溝通交流。
雖然我國在信息無障礙領(lǐng)域的投入在逐漸增加,但聽障人群的一些需求仍得不到滿足,尤其在公共環(huán)境設(shè)施、服務(wù)體驗(yàn)等方面。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),我國目前致力于聽障者專業(yè)服務(wù)的人士只有大約一萬名,大部分公共服務(wù)并沒有配備專門的便利設(shè)施,這些都是聽障者長久以來面臨的迫切需求。
針對這一社會(huì)痛點(diǎn),優(yōu)圖團(tuán)隊(duì)首次將計(jì)算機(jī)視覺人工智能技術(shù)應(yīng)用到手語識(shí)別場景,而此次發(fā)布的“優(yōu)圖AI手語翻譯機(jī)”產(chǎn)品,利用了普通攝像頭和高性能計(jì)算機(jī),可以識(shí)別聽障人士的手語,并快速識(shí)別翻譯成文字。
據(jù)騰訊優(yōu)圖研究員陽趙陽介紹,手語翻譯的核心技術(shù)是手語識(shí)別(SLR),通過計(jì)算機(jī)算法,自動(dòng)區(qū)分手語表達(dá)中的各類手勢、動(dòng)作、手勢和動(dòng)作之間的切換,最后將手語翻譯成為文字。此前也有一些團(tuán)隊(duì)探索過用人工智能技術(shù)緩解聽障人士溝通障礙,但往往需要借助一些額外的設(shè)備或傳感器,不僅增加了使用門檻,而且也無法保證對復(fù)雜手語表達(dá)的識(shí)別率。不僅如此,手語特有的地域性、復(fù)雜性和多樣性,使得手語識(shí)別技術(shù)即使在深度學(xué)習(xí)的幫助下也依然存在很大的挑戰(zhàn),難以被實(shí)際應(yīng)用。
手語識(shí)別算法總體框架圖
此次優(yōu)圖AI手語翻譯機(jī)產(chǎn)品,通過自研算法實(shí)現(xiàn)了對復(fù)雜手語表達(dá)的識(shí)別技術(shù)突破,該算法參考了先進(jìn)的手勢識(shí)別、動(dòng)作識(shí)別和序列翻譯等技術(shù),考慮了手語的地域性和多樣性表達(dá),包含了不同的表達(dá)習(xí)慣和速度。
據(jù)介紹,優(yōu)圖實(shí)驗(yàn)室手語識(shí)別數(shù)據(jù)集覆蓋了近千句日常表達(dá),900個(gè)常用詞匯,是最大的中文手語識(shí)別數(shù)據(jù)集。與此同時(shí),優(yōu)圖對數(shù)據(jù)進(jìn)行了進(jìn)一步的分析和歸納,使優(yōu)圖AI手語翻譯機(jī)能夠?qū)崿F(xiàn)整句的識(shí)別和翻譯,用戶表達(dá)的時(shí)候可以連貫將整個(gè)句子表達(dá)完,不需要設(shè)定特定的結(jié)束或起始動(dòng)作,也無需在句中故意停頓或放慢速度。
踐行科技向善,騰訊攜手信息無障礙研究會(huì)攻堅(jiān)場景服務(wù)
“優(yōu)圖團(tuán)隊(duì)將繼續(xù)進(jìn)行語料庫拓展和算法優(yōu)化,進(jìn)一步探索在機(jī)場、民政等公共服務(wù)領(lǐng)域部署,提供無障礙溝通解決方案,方便聽障人日常交流提供便利?!彬v訊杰出科學(xué)家賈佳亞教授表示。
為進(jìn)一步深入接觸聽障群體,了解手語和優(yōu)化數(shù)據(jù)和識(shí)別算法,目前騰訊優(yōu)圖實(shí)驗(yàn)室已和深圳市信息無障礙研究會(huì)成立AI手語識(shí)別聯(lián)合項(xiàng)目組,雙方將基于手語數(shù)據(jù)采集、產(chǎn)品算法優(yōu)化等展開長期深度的合作,通過與聽障者或手語使用者進(jìn)一步接觸,擴(kuò)充數(shù)據(jù)容量,完善數(shù)據(jù)規(guī)范,致力于推動(dòng)后續(xù)的產(chǎn)品和服務(wù)部署。
深圳市信息無障礙研究會(huì)秘書長楊驊表示,騰訊優(yōu)圖提供的這項(xiàng)技術(shù),可以在一定程度上緩解聽障者的溝通障礙,為聽障者提供更好的服務(wù)。
實(shí)際上, 這并不是騰訊在AI+無障礙建設(shè)上的首次嘗試,騰訊一直在堅(jiān)持推動(dòng)“一個(gè)都不能少”和“信息無障礙”理念的傳播與落地。從2009年起,騰訊在信息無障礙方面率展開探索,截至目前,旗下QQ、QQ空間、微信、騰訊網(wǎng)、騰訊新聞、應(yīng)用寶、企鵝FM等大部分產(chǎn)品已針對障礙用戶實(shí)現(xiàn)專門優(yōu)化。騰訊旗下各類產(chǎn)品從社交、娛樂、新聞等多維度出發(fā),共同努力,為障礙人士構(gòu)建友好的信息社會(huì)。2018年12月3日,獲得“聯(lián)合國教科文組織數(shù)字技術(shù)增強(qiáng)殘疾人權(quán)能獎(jiǎng)”。
根據(jù)世界衛(wèi)生組織的調(diào)查,全世界有超過十億人生活在因殘障引起的不便中,也就是說,地球上每七個(gè)人中就約有一人需要無障礙設(shè)施的幫助。為了讓更多的人關(guān)注障礙群體,了解無障礙理念,每年五月的第三個(gè)星期四也被設(shè)立為了全球無障礙宣傳日。
來源:騰訊科技
400-9905-168
粵ICP備13059948號 廣州格慧泰福(GHTF)生物科技有限公司 版權(quán)所有
??