Convertir PDF a PDF A OCR Reconocimiento Optico de Caracteres, reconocimiento de texto en PDF SIMO

Convertir PDF a PDF A OCR Reconocimiento Optico de Caracteres, reconocimiento de texto en PDF SIMO

How to Convert a Standard PDF to an OCR PDF

Introduction to OCR PDFs

  • The video introduces the process of converting a conventional PDF into an OCR (Optical Character Recognition) PDF, which allows for text selection and editing.

Identifying Non-OCR PDFs

  • A demonstration shows a scanned image in a PDF where text cannot be selected, indicating it is not configured for OCR.

Using Online Tools for Conversion

  • The presenter suggests using an online tool called "PDF 24 Tools" for converting standard PDFs to OCR-enabled PDFs.

Steps to Convert the PDF

  • Users can upload their file by dragging it into the designated area on the website or selecting it directly.
  • Important settings include choosing "PDF/A" as the output type and selecting "Spanish" as the language for recognition.

Finalizing and Downloading the Converted File

  • Users are advised on whether to enable page straightening based on how well-aligned their scanned images are.
  • After initiating the OCR process, users must wait until conversion is complete before downloading their new file.

Verifying Successful Conversion

  • Upon opening the newly created file, users can confirm that text selection works correctly, demonstrating successful recognition of text within the document.
Video description

En este video podrán observar cómo convertir un archivo PDF a un PDF/A con OCR (Reconocimiento Optico de Caracteres) el cual genera un archivo con reconocimiento del texto, así se trate de una imagen. Este tipo de archivo es muy útil en el caso de que se requiera extraer el texto para copiar y pegar en otro lado, editar texto del archivo, copiar partes importantes del mismo, etc. Igualmente, este tipo de archivos es necesario para cargar en diferentes plataformas que así lo exigen, como por ejemplo en la plataforma SIMO de la Comisión Nacional del Servicio Civil (CNSC) para poder validar los documentos en los concursos de mérito que allí aparecen.