OCR功能是什麼?和一般的桌上型擴視機差在哪裡?
撰寫者/歐綺家、張佳叡
2020年愛盲基金會的輔具開箱文啟動,我們為視障使用者進行功能實測,提供輔具資訊和客觀試用心得。如有任一新型輔具想提供給愛盲開箱評測,歡迎推薦。
本文為愛盲低視能服務處人員與視障者實際試用後撰寫,愛盲基金會不涉及相關買賣。
前言
隨著科技的進步,視障者的輔具開始走向多元功能的結合,例如上一篇介紹的穿戴式輔具OrCam MyEye 2.0,具備了OCR光學掃描辨識系統、語音報時器等功能;或是智慧型手機,若語音回饋完整,等同於配備簡易型擴視機、簡易型望遠鏡、聽書機等三種輔具;又或者是此篇文章的主角──擴視機結合OCR光學掃描辨識系統,除了擴視機原先配備的色彩模式、放大/縮小功能外,OCR辨識系統可將文字轉換成圖片檔案,再經由程式轉變成語音輸送出去,讓使用者可以透過聲音辨識紙本資料,適用於有閱讀困難、破碎型視野、視野明顯缺損、或習慣以語音閱聽資料的低視能者。
上一篇介紹的穿戴式輔具「OrCam MyEye 2.0」也是利用OCR系統進行文字辨識,考量OrCam MyEye 2.0尚未有社政補助,對於一般低視能者負擔較大,因此本篇將介紹同有OCR辨識系統的「DaVinci Pro桌上型擴視機」,此款輔具符合桌上型擴視機的社政補助規範,若單純想透過語音進行文字辨識的話,可以嘗試看看哦!
文章分成三大部分,第一部分將DaVinci Pro的輔具資訊和功能彙整成表格,讓閱讀者可直接掌握輔具特色;第二部分介紹外觀與設備;第三部分我們分享輔具的評測結果。
壹、重點彙整
彙整DaVinci Pro桌上型擴視機的產品資訊及特色說明:
輔具名稱:DaVinci Pro桌上型擴視機
特色說明:
●SONY HD 三合一鏡頭:望遠、自拍、看近皆可輕鬆操作
●OCR光學掃描辨識系統,可即時朗讀紙本資料內容
●共28種色彩對比模式,可依需求選擇5種設定為常用模式
●具閱讀線及遮罩功能
●一體成型且LCD螢幕可輕易調整垂直角度
●有繁體中文、英文、日文、韓文等多種語言可供選擇
●可加購收納行李箱,方便移動及收存
●符合補助項目:桌上型擴視機
參考價格:約12萬元
貳、外觀與設備功能介紹
因為DaVinci Pro桌上型擴視機的體型較大,廠商有提供為它量身訂做的收納紙箱,方便收存及寄送,收納紙箱有個很貼心的設計是,箱子裡面已經黏好滿滿的泡棉,只要把擴視機的方向對準放進去箱子裡,就可以避免擴視機在運送過程中有碰撞或損傷,還能減少我們花心思煩惱如何固定擴視機哦!
DaVinci Pro桌上型擴視機主要是由主機和遙控器兩種設備來進行操作,以下將分別介紹這兩種設備的功能及操作方式。
主機
從DaVinci Pro的正面看,螢幕下方會有三個按鈕,最右邊的按鈕為電源鍵,中間圓形轉盤轉動可調整放大倍率,按下去可切換至OCR模式,再按一下就會變回擴視機閱讀模式,左邊的按鈕為調整色彩模式,按鈕的兩側為喇叭位置。
(此為主機正面照。最右邊的按鈕為電源鍵,中間按鈕轉動可調整放大倍率,按下去可切換至OCR模式,左邊的按鈕為調整色彩模式。)
DaVinci Pro的鏡頭分為兩個,SONY HD 三合一鏡頭是用於擴視機閱讀模式,藉由轉動鏡頭切換成看遠、看近、鏡像三種模式,此鏡頭還配有一個可掀式的聚焦鏡片,以利於近距離模式下可準確對焦,要特別注意的是,在看遠時需要把特寫鏡片掀開;另一個鏡頭是在OCR模式下使用,此鏡頭位於SONY鏡頭的左側,因此若要使用OCR模式時,要記得將紙本資料對準OCR鏡頭,才會拍攝到完整的影像,OCR鏡頭左側有四盞燈泡,無論在擴視機模式或OCR模式都會自動開啟,但無法手動關閉。
(此為鏡頭正面照。最右邊為4顆燈泡,中間為OCR鏡頭,左邊為SONY HD三合一鏡頭。)
從DaVinci Pro的背面看,可以發現有個把手方便搬運擴視機,須留意不能用鏡頭手臂提起。把手下方有個軌道,讓鏡頭手臂能順著軌道平移鏡頭。
(左圖:此為DaVinci的背面照,由上至下分別是鏡頭手臂、把手、鏡頭手臂的滑動軌道。)
(右圖:此為安全搬運DaVinci的示意圖,手須握於把手而非握於鏡頭手臂。)
遙控器
遙控器有一個保護蓋蓋住下半部,平時只露出基本操作按鈕,如需進階使用時才將保護蓋掀開。以下從基本型和進階型兩種模式分別介紹:
基本型模式的遙控器其實就是指在有保護蓋的方式下進行操作,外觀如下圖,圖片中標記的數字編號會對應到文字上的解釋:
1.中間的圓形轉盤可調整影像倍率,順時針放大,逆時針縮小。
2.中間轉盤上方的黑色按鈕為搜尋定位用,長按時會將影像倍率最小化,以利於掌握目前閱讀資料的位置,放開按鈕就可以返回先前的放大倍率。如果在OCR模式下,此按鈕是用來擷取OCR影像,再按一次就會結束OCR模式,並回到OCR導引框。
3.左邊的搖桿可以調整亮度,向上推是提升亮度,反之亦然。如果在OCR模式下,向上推可以暫停OCR播放,向下推則是繼續播放。
4.右邊搖桿的功能為調整色彩模式,可以向上或向下推動選取適合的對比色彩。
5.左側有個轉盤可以調整音量,向上轉增加音量,反之亦然。
6.右側轉盤可以選取不同模式的閱讀線或視窗遮蔽,如果在OCR模式下,則變成調整語音速度,向上轉加快速度,反之亦然。
(此為遙控器基本模式。上半部左右各有一個搖桿、中間為圓形轉盤,下半部左右兩側各有一個轉盤)
進階型模式的遙控器則是指掀開保護蓋後,新增一些功能按鈕可以操作的模式。保護蓋是利用磁吸式的方式吸附在遙控器上,直接往上提就可以掀開保護蓋囉!
進階型的外觀如下圖,圖片中新增的數字編號會對應到文字上的解釋,此為進階型模式下新增的功能:
7.保護蓋上緣的方形按鈕只有在OCR模式才會被使用,按此按鈕來擷取OCR影像,再按一次就會結束OCR模式,並回到OCR導引框。
8.中間的橢圓形按鈕也只在OCR模式下使用,又可以分成三個部分,中心的圓形按鈕可以暫停OCR播放或是繼續播放,左邊的按鈕則為移動至上一行或上一閱讀區塊,右邊按鈕則是移動至下一行或下一閱讀區塊。
9.左下角有個相機圖案的按鈕,可以在OCR模式下進行拍照保存文件,只要長按2秒鐘就會自動儲存至資料夾
10.右下角有個資料夾圖案的按紐,長按2秒鐘就可以進入資料夾查閱已儲存的文件。
(此為遙控器掀開保護蓋後的新增按鍵介紹。上排為一個方形按鈕、中間為橢圓形按鈕可分為三個部分、下排左側及右側各有一個方型按鈕)
基本型和進階型兩者之間最大的差異在於進階型多了存取畫面、進入資料庫、選擇閱讀區塊的功能,可以依個人習慣及需求挑選適合的方式操作。有一點要特別注意的是,只要摘開保護蓋就代表進階型的模式,這時候操作就得使用進階型的方法,尤其是在OCR模式下,基本型和進階型的擷取影像按鈕不一樣,如果按錯按鈕,機器是不會有反應的哦!
接著我們來介紹DaVinci Pro的OCR模式,有四種報讀方式可以選擇,分別為整頁影像模式、整頁文字模式、單行模式和表格模式,報讀的呈現方式如下圖,整頁影像模式會在OCR掃描的實際影像下報讀文字,整頁文字模式只會呈現全版面的文字檔,而單行模式也只會出現文字檔,但一次只出現一行,會用像跑馬燈的方式進行報讀,此三種模式可以在擴視機的功能選單進行設定。表格模式是一種特殊的模式,專門用來讀取表格格式的文件,使用的方法是長按進階型遙控器的OCR擷取按鈕超過5秒鐘,讀取後會以整頁文字模式或單行模式的型態顯示。
★擴視機的功能選單
如果想要調整擴視機的設定,需要同時按遙控器搜尋定位用的按鈕並且將色彩模式的搖桿向上推,就可以進入擴視機的功能選單,選單內可以更改OCR的報讀模式、音效、時間、語言、偏好的色彩對比模式等相關設定,也提供DaVinci Pro的介紹影片、產品訊息以及儲存圖片的資料夾。
★儲存/刪除文件
如果想儲存紙本資料,要符合以下兩個條件才能執行,第一是必須在OCR模式,第二是需要在進階型遙控器下操作,此時只要長按遙控器左下方相機圖案的按鈕2秒鐘,就儲存完畢。
如果想刪除資料,必須進入功能選單內的媒體庫內,選取想刪除的資料後,按一下遙控器右側轉盤,螢幕上就會顯示一個垃圾桶圖示,代表成功刪除,要特別注意的是,刪除按鈕並沒有再次確認的選項,只要按一下資料就會消失不見了哦!
★閱讀線、視窗遮蔽的功能介紹
前面介紹遙控器時,有提到遙控器的右側轉盤可以選取不同模式的閱讀線或視窗遮蔽,下圖為四種可選擇的模式,此外,閱讀線和視窗遮蔽的位置和大小可以透過快捷鍵做調整。
★開/關機時間
開機需要約45秒,關機分成兩段式,按一下為待機模式,長按7秒會出現關機提示音,完全關機約需要20秒,若待機後重新開啟需要約20秒的恢復時間。
參、 輔具評測分享
本次內容將著重於DaVinci Pro桌上型擴視機的OCR功能進行評測,分為以下10點:
1.辨識距離:建議鏡頭與紙本文件距離為30.5至48公分,以獲得最佳清晰度。此次評測距離約落在45公分處。
2.辨識範圍:可辨識A4大小的範圍。
3.OCR辨識時間:辨識時間會依照資料的文字多寡而不同,普遍為10-15秒。
4.最小可辨識字體:隨機抽選21個國字,將字體大小分成20號字到5號字,測試不同字體大小的正確率,測試結果為7號字至20號字間,除了14號字可達100%準確辨識外,其他字體大小會錯1至2個字,而6號字以下錯誤率則開始增加。
5.字型差異的辨識正確率:手寫字體無法辨識,印刷字體我們選擇目前常見的三種字型,標楷體、新細明體及微軟正黑體進行比較,挑選三篇250~300字左右的文章評測,發現標楷體的正確率為98.4%、新細明體為99.4%、微軟正黑體為99.0%,過程中發現OCR鏡頭在四個角落會出現扭曲變形的情況,對文字辨識有影響,所以需要盡量將資料放置在中間處使用,如果OCR是使用整頁文字模式報讀,只會出現機體辨識完的文字檔,文章就會出現不正確的標點符號及斷句方式,可能影響閱讀,如下圖範例。
6.OCR模式的辨識正確率:主要比較整頁影像模式、整頁文字模式、單行模式三種。以同一份紙本資料做辨識,每次的正確率皆略有不同,若以評測人員的感受而言,整頁影像模式的文字正確率較高,但不能排除是因為可以同時使用視覺閱讀真實文件,較不受文字辨識錯誤的影響;整頁文字模式及單行模式因顯現的是機體辨識後的文字,如果剛好遇到正確辨識率較低、辨識區塊分區錯誤的話,就會比較難理解其文章內容。
7.生活常見的資料辨識:實測日常易取得的瓶罐之成分資訊、信用卡、證件等,易受曲面、材質反光影響,容易分區錯誤或無法辨識導致辨識率不高。另外實測郵局及銀行的匯款單、帳單,雖為平面紙張且非反光材質,即便使用表格模式來辨識,仍容易出現分區錯誤的情形,甚至無法辨識。
8.書本厚度的影響:實際以一本近1000頁的書測試,平放狀態下650頁左右接近書脊處的文字辨識率會開始受到影響。需要注意的是,因OCR辨識範圍為A4大小,但坊間書籍多為B5大小,攤平時無法同時辨識兩頁文字,所以在放置書本時,建議盡可能只保留一頁在辨識範圍內,以免同時辨識到另一頁的文字,導致聽取時無法理解其內容。
9.望遠功能:此鏡頭的解析度相當高,當天將3公尺遠的0.5公分高字體放大至2.5公分高,影像邊緣不會出現鋸齒狀或毛邊,可清楚辨識放大後的字體,且對比度也有明顯提升,評測圖如下,此項功能對於低視能學生在看黑板或投影螢幕上有很大的幫助。
10.鏡像:可以將鏡頭轉向自己,變換成鏡像功能,可以輔助化妝、刮鬍子、整理儀容等,但會需要花一些時間熟悉及適應不同的距離感。
這次我們邀請三位低視能者試用,其試用者影響視覺的疾病分別有錐細胞退化、色素性視網膜病變、眼球震顫,希望透過不同視覺障礙類型的低視能者操作此款擴視機,分享試用的心得,我們將試用者的回饋與建議歸納如下:
1.看遠的解析度比以往使用過的擴視機還清晰。
2.有眼球震顫困擾的低視能者,喜歡利用視窗遮蔽的模式操作,以免發生跳行的困擾。
3.對於視覺功能明顯退化的低視能者,搭配OCR功能可以大大提升閱讀效率。
4.視野狹窄的低視能者,因需要花費較長時間搜尋,覺得使用OCR的單行模式會比較輕鬆。
5.可以將文件下載到隨身碟,且提供多種類型的檔案格式,例如txt、rtf、jpg、pdf、doc等,方便之後在電腦進行操作。
6.桌面上若增加觸覺或視覺的提示,可以幫助低視能者將資料放在OCR可辨識的範圍內。
7.遙控器的按鍵大且容易辨識,方便操作,但某些功能需要透過複合式按鍵才可以啟用,若不常使用,很容易忘記怎麼操作。
8.OCR功能偶爾會出現文字辨識錯誤或文字分區錯誤,造成閱讀上無法理解文件內容。
9.受文字辨識正確率較低、辨識時間稍長及價格昂貴的影響,雖然鏡頭能力很好、影像清晰,但不會考慮購買。
10.此款擴視機的視覺閱讀的效果較OCR功能要來的優良,但因價格考量,不會考慮購買。
要注意的是,視覺障礙類型種類多元不易分割,本篇文所提供的低視能者使用心得,並不會含括所有低視能者的情況,若有興趣的低視能者,仍建議親自嘗試使用。
肆、總結
將此次評測DaVinci Pro桌上型擴視機的優缺點整理成表格如下,僅供參考。
優點 | 缺點 |
鏡頭解析度高,影像清晰 | OCR文字辨識正確率較低 (正確率約80%) |
有遮罩、閱讀線的附加功能 | OCR辨識文字分區不穩定 |
有OCR功能 | OCR文字辨識時間稍長,即時性較差 |
基本功能按鍵易操作 | 進階功能複合按鍵多,需熟悉 |
可儲存資料 | 價格昂貴 |
以上是這次DaVinci Pro桌上型擴視機的開箱評測文介紹,未來我們將持續關注民眾感興趣的視覺相關輔具,發表輔具開箱文讓大家能事先了解,目前於台北愛盲基金會低視能服務處有一台DaVinci Pro桌上型擴視機,歡迎有興趣的低視能者來電預約試用哦!若想知道更多DaVinci Pro桌上型擴視機的詳細資訊,文章下方提目前台灣有販賣視覺輔具的廠商資料,供各位參考,謝謝您的閱讀!
目前台灣有販賣視覺輔具的廠商資料如下表:
常業企業股份有限公司
(02)2397-0197
台北市忠孝東路2段130號9樓之7
(近捷運忠孝新生站 2號出口)
聯郃國際視覺輔具中心
(02)2596-1695
台北市大同區承德路三段229號2樓之2
(圓山捷運站1號出口右轉步行三分鐘,酒泉街/承德路口)
龍泰視覺輔具中心
(02) 2370-8988
台北市忠孝西路一段50號14樓之22
(台北車站正對面、原大亞百貨14樓)
(04)3703-6569
台中市北屯區文心路四段83號19樓
(07)716-1702
高雄市前鎮區瑞隆路637號
宇崝企業有限公司
(02)2587-3206
台北市雙城街21號6樓
(近捷運中山國小站1號出口)
華堂光學實業有限公司
(02)2976-9898
新北市三重區光明路72巷9號
(近捷運菜寮站2號出口)