發表文章

目前顯示的是 1月, 2017的文章

自已的書 自已電子化

比起手機裏的電子書,紙本書又厚又重,儘管如此紙本書還是有優點的,不用插電,隨翻即看,只是現在的房價高漲,想要保存紙本書的成本越來越高,自已的書自已電子化的想法就在網路上流傳了起來,有人稱之為自炊,這事只能自已來,自用自爽,原因無他,幹這事是出版商和作者的大敵,但是如果有電子書,買電子書是最方便的,奈何有些書就是只出紙本。 電子化最基本就是做成影像,一開始相機不是那麼強悍的時侯,靠的是平台掃描機;如今有相機也行,不然就手機上場,解析度差點而已,如果有1000萬像素,要進一步做字體辨識已經足夠,光是拍照的過程,自炊的決心大概就消耗殆盡,別說還要做辨識(所謂的OCR)了,沒有經過辨識的影像其實也能讀,因此通常不會考慮內容辨識的吧;至於非接觸式的拍攝機都不便宜,就跳過了,這種設備,號稱可以校正書本因為厚度造成彎曲的影像,減輕使用者的工作負擔,一般人買了相機很多場合可用,買了這機器只為了應付一種狀況,可能會落在小眾市場。 不管用什麼方式,最煩人的就是翻書這件事,用相機的話,要架腳架,因為翻書壓平之後拍的書頁,影像才平整、架了腳架,拍出來的書頁,影像才不會晃、壓了書才不會拍到一半書自已翻頁,影像糊掉、固定相機和書的距離較好,可以固定焦距,以免成像調半天,或是整個糊掉;用掃描器的話,翻好書頁後必須再把書翻過來壓平在掃描器上給掃描器掃,看來好像掃描器好像比較麻煩,但是如果只有一個人剛開始嘗試的話,成像時用掃描器似乎效果好些,因為沒壓平的書頁,拍起來的影像歪來歪去,讀起來心情超級差。 平台式掃描器的優點就是,掃出來的影像是平的,頂多調個角度轉正就是紙本書的內容了;用相機拍書,調整成像時就GG了,不但要調整變形,如果還想辨識,就算變形調整回來了,如果沒架腳架,手晃到或是書頁自翻的影像,就算辨識跑完,等於是重打,同時附送眼睛閃光的視覺效果。 工作環境: asus 1300 像素手機 (怎麼覺得沒有帕金森式症的話這個已經很夠用) SONY alpha 5000 (不會關多焦點,很多影像都糊成一片) Canon EOS M1 (定焦鏡就很好用了) Windows 10 Scan Tailor:調整影像變形很強,但是好像影像解析度會變低 ABBYY試用版:只要字夠正夠清楚,辨識力超強 多種 OCR 的 android app:免費,辨識能力都不錯,操作直覺,後來