isPowerfulBlog
[OCR] 개념 본문
OCR이란?
Optical Character Recognition
광학 문자 인식
OCR pipeline
OCR의 파이프라인은 위와 같고
간단히 요약하자면 Text Detection과 Recognition을 거쳐 이미지 속 글씨를 인식한다고 보면 된다.
앞으로 Detection과 Recognition에 집중해서 공부해봐야겠다.
OCR 엔진 비교
많이 사용하는 듯한 OCR 두 개, easyocr과 tesseract
EasyOCR
https://github.com/JaidedAI/EasyOCR
- 영수증이나 PDF처럼 글자 구조가 잘 잡혀있는 이미지에 대해 성능이 좋음
- GPU 지원 O
Tesseract
https://github.com/tesseract-ocr/tesseract
- 고해상도 이미지에서 성능이 좋음
- GPU 지원 X
OCR 정리 github
https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
굉장히 정리 잘 되어있는 이활석님의 레포지토리
앞으로 공부할 때 봐야겠다
References
https://www.youtube.com/watch?v=ZIE_1tq6xFk&t=164s
https://medium.com/mlearning-ai/tesseract-vs-keras-ocr-vs-easyocr-ec8500b9455b
https://velog.io/@vanang7/%EA%B5%AD%EB%AC%B8-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-OCR
'AI' 카테고리의 다른 글
[환경구축] StyleGAN2 | Setting up StyleGAN2 TensorFlow in GoogleColab (0) | 2023.01.06 |
---|---|
[GoogleColab] How to Downgrade to an Older Version of TensorFlow (0) | 2023.01.03 |
[논문리뷰] GANSpace: Discovering Interpretable GAN Controls (0) | 2022.11.28 |
[GoogleColab] Runtime: 연결 끊김 방지 (1) | 2022.09.10 |
[논문리뷰] StyleGAN: A Style-Based Generator Architecture for GANs (0) | 2022.08.23 |