OrCam:让盲人 “看见”

數碼情報站 於 16/06/2013 發表 收藏文章
Liat Negrin是一個從小就視力受損的以色列小姑娘。而現在,憑藉著一副簡單而不突兀的眼鏡,她能隨意地走進一家便利店拿起商品並“閱讀”上面的文字。

Negrin先天患有虹膜缺損,她是以色列一家初創公司OrCam的員工。 OrCam研發的產品是一套基於攝像頭的增強現實係統——能讓視力受損人群自由地閱讀和活動。

到目前為止,市面上幫助視力受損人群閱讀的設備或笨重,或使用條件苛刻。新近也有出現智能機上的app,但多是功能有限。而OrCam其實是一架扣在鏡框上的攝像頭,它通過一根細小的線纜與便攜式的電腦相連,電腦的大小可以放在兜里。攝像頭是通過磁鐵跟鏡框吸附在一起,同時骨傳導的揚聲器將讀取到的內容清晰地傳遞給用戶。

這一系統的宗旨是識別和傳遞“自然條件下的文字”(無論是報紙上的長文還是公交車上的數字),還有包括路標、紅綠燈和人臉這樣的情景。這款設備跟我們之前報導過的Argus II有很大不同,後者採取的方式是繞過視網膜直接向大腦傳送圖像的神經信號。


“OrCam的神奇之處在於它還能向用戶學習來識別新的物品。”Tomaso Poggio,一位MIT的計算機專家表示,同時他也是OrCam的創始人Amnon Shashua的研究生同學。

這一項技術進步顯然是得益於芯片在處理能力和體積上的改良,加上圖形算法的精進。在更廣泛的技術層面來說,OrCam是一系列AI尤其是製造業的圖形處理和無人駕駛汽車領域技術進步的體現(Shashua曾是一家無人汽車圖像採集技術公司Mobileye的創始人)。在iPhone和Android手機上,數以千萬的用戶正在使用語言識別技術。同時,自然語言處理也在簡化計算機“閱讀”文件的過程。

在Hebrew University 2011年發表的一篇關於OrCam技術的論文裡:他們的技術實現能在識別的準確率和速度上達到不錯的平衡。這項名為Shareboost的技術在當需要識別的物品數量增加時,系統會減少需要的附加計算單元。

除此之外,OrCam系統還配有一個很小的控制系統或者說UI。用戶只要用手指指向他想識別的物品,那麼設備就會開始讀取這個場景。系統本身內置了一些物品的數據,而用戶也可以不斷向庫中添加新的數據——比如商標上的文字、紅綠燈等等——只要在攝像頭的區域揮一揮手。

Shashua表示這一系​​統關鍵的難度在於不同光學條件下的快速識別,以及柔軟材料表面的內容識別。 “專業的光學字符傳感器在圖像清晰的情況下識別率已經非常好了,但是在一些別的情況下——比如手持的報紙表面就比較難處理。”他說道。

這款設備的初衷是給那些視力受損人群(也就是那些無法通過眼鏡矯正的用戶)使用,但盲人也可以使用。

OrCam的這款設備會在本週起它的官網開始發售,目前還只支持英語,價格是2500刀,跟一款中檔助聽器價位相當。目前這是公司唯一一款產品。

需要說明的是,在美國2120萬18歲以上的人受視受損的困擾,包括因衰老,眼疾和先天等各種因素引起的障礙。 OrCam表示全球範圍內大約有3億4千2百萬的成人患有嚴重的視力受損,其中有5千2百萬人屬於中產階級。


資料來源:雷鋒網
標籤: OrCam  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→