isPowerfulBlog

[OCR] 개념 본문

AI

[OCR] 개념

왕밤빵도라에몽 2022. 9. 18. 20:27

OCR이란?

image

Optical Character Recognition
광학 문자 인식

OCR pipeline

image

OCR의 파이프라인은 위와 같고
간단히 요약하자면 Text Detection과 Recognition을 거쳐 이미지 속 글씨를 인식한다고 보면 된다.

앞으로 Detection과 Recognition에 집중해서 공부해봐야겠다.

OCR 엔진 비교

많이 사용하는 듯한 OCR 두 개, easyocr과 tesseract

EasyOCR

image

https://github.com/JaidedAI/EasyOCR

  • 영수증이나 PDF처럼 글자 구조가 잘 잡혀있는 이미지에 대해 성능이 좋음
  • GPU 지원 O

Tesseract

https://github.com/tesseract-ocr/tesseract

  • 고해상도 이미지에서 성능이 좋음
  • GPU 지원 X

OCR 정리 github

https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
굉장히 정리 잘 되어있는 이활석님의 레포지토리
앞으로 공부할 때 봐야겠다


References

https://www.youtube.com/watch?v=ZIE_1tq6xFk&t=164s
https://medium.com/mlearning-ai/tesseract-vs-keras-ocr-vs-easyocr-ec8500b9455b
https://velog.io/@vanang7/%EA%B5%AD%EB%AC%B8-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-OCR