PaddleOCR-VL 영수증 OCR : 비전언어모델로 상품명·수량·단가 JSON 추출 파이썬 GUI 프로그램 제작
사무실에서 영수증을 처리하거나 또는 상품을 구매하고 영수증 OCR 자동화를 구현하고 싶은데, 일반 OCR로는 표 구조가 뭉개지거나 상품명과 금액이 뒤섞여 제대로 된 결과를 얻지 못한 경험이 있으신가요? 이번 글에서는 비전언어모델(Vision-Language Model, VLM) 기반의 PaddleOCR-VL을 활용하여 영수증 이미지에서 상품명·수량·단가·금액을 자동으로 추출하고 JSON으로 저장하는 Python 영수증 인식 자동화 GUI 프로그램을 제작합니다. 단순한 문자 인식 수준의 PaddleOCR 영수증 인식이 […]