PDF OCR
OCR을 사용하여 스캔된 PDF에서 텍스트 추출 — 20개 언어 지원, 무료, 브라우저 기반.
편집 및 수정
정리
AI 도구
PDF OCR Tool
스캔된 PDF를 여기에 드롭하거나 클릭하여 선택하세요
최대 50MB
OCR을 사용하여 스캔된 PDF에서 텍스트 추출 — 20개 언어 지원, 무료, 브라우저 기반.
PDF OCR 소개
PDF OCR은 스캔된 PDF 및 이미지 기반 문서에서 텍스트를 추출하는 무료 온라인 optical character recognition 도구로, 영어, 프랑스어, 독일어, 스페인어, 아랍어, 중국어, 일본어를 포함한 20개 언어를 지원합니다. 보이지 않는 텍스트 레이어가 있는 Searchable PDF를 출력하거나 Plain Text를 직접 추출하도록 선택할 수 있습니다. 모든 OCR 처리는 browser에서 로컬로 실행되며 파일은 기기를 떠나지 않습니다. signup이 필요 없습니다.
사용 방법
스캔된 PDF(최대 50 MB)를 업로드하고, 문서 언어 또는 다국어 문서의 경우 여러 언어를 선택한 다음, 모든 페이지 또는 1,3,5-8과 같은 사용자 지정 범위 등 처리할 페이지를 지정합니다. 텍스트 레이어를 삽입하려면 Searchable PDF를, 원시 텍스트를 추출하려면 Plain Text를 선택합니다. Start OCR을 클릭하여 처리를 시작합니다. 페이지별 진행 상황과 confidence scores를 모니터링한 다음 Searchable PDF를 다운로드하거나 추출된 텍스트를 복사합니다.
주요 사용 사례
- 스캔된 계약서 및 법원 문서를 이미지 기반 PDF로 받는 법률 사무소는 OCR을 실행하여 텍스트 검색이 가능하게 함으로써 사건 관리 시스템의 방대한 문서 컬렉션에서 keyword 검색을 수행할 수 있습니다.
- 인쇄된 서적, 저널 기사 또는 보관 문서를 디지털화하는 연구원은 이 무료 PDF OCR 도구를 사용하여 전체 텍스트 레이어를 추출하고 인식된 텍스트를 citation managers나 연구 데이터베이스로 가져올 수 있습니다.
- 방대한 양의 스캔된 양식을 처리하는 정부 기관 및 compliance 팀은 사용자 지정 페이지 범위 기능을 사용하여 데이터가 포함된 페이지만 OCR 처리함으로써 처리 시간을 크게 단축할 수 있습니다.
- 여러 언어로 된 문서를 다루는 다국어 조직은 여러 OCR language packs를 동시에 선택하여 한 번의 작업으로 혼합 언어 문서를 정확하게 인식할 수 있습니다.
- 스캔한 인쇄 강의 노트나 교과서 페이지가 있는 학생은 OCR을 사용하여 전체 텍스트를 추출함으로써 내용을 수동으로 다시 입력하지 않고도 검색 및 복사 붙여넣기가 가능한 디지털 노트를 만들 수 있습니다.