Top
PDFelement
PDFelement: Editor de PDF, Scanner
Editar, Converter, Anotar PDF
Editar, Anotar PDF
Abrir Abrir

Como Executar OCR em Texto PDF e Arquivos de Imagens

ocr em texto, ocr em arquivos de imagens, ocr pdf

Baixe Grátis Baixe Grátis Baixe Grátis
téléchargement sécurisé100% seguro | Sem publicidade |ai suporte

2024-03-05 21:48:23 • Arquivado para: PDFelement para Mac How-Tos • Soluções comprovadas

OCR ou reconhecimento óptico de caracteres é um processo de computação que converter caracteres baseados em imagem em texto editável e pesquisável. É normalmente usado para arquivos PDF que foram gerados por um scanner ou até mesmo arquivos de imaem contendo texto. O OCR é muito útil ao converter documentos físicos ou arquivos digitais não editáveis em PDFs com os quais você pode realmente trabalhar usando um editor de PDF ou um leitor de PDF. Alguns casos de uso típicos para OCR:

  • Conversão de faturas em papel para formato digital
  • Digitalização e conversão de formulários preenchidos à mão
  • Transformar o conteúdo de um estado não interativo para um interativo, como conversão de livro em eBook

Seja qual for o cenário, não podemos esquecer que o aspecto mais importante na escolha de uma ferramenta para OCR é o nível de precisão. Para isso, recomendamos [没有发现file] que está disponível para sistemas Windows e Mac e possui uma das mais altas precisões de OCR na indústria. Além disso, permite converter texto baseado em imagem em formato pesquisável ou editável, dependendo da finalidade da conversão.

Parte 1. Como Fazer o OCR de um Documento ou Imagem no PDFelement

Executar o OCR em um documento é literalmente muito fácil porque o PDFelement diz exatamente o que fazer. No momento em que você abre um arquivo PDF não editável ou usa o Create PDF para converter uma imagem em PDF, ele reconhece isso e solicita que você instale o plug-in OCR e execute o OCR. Aqui está o que você verá na tela:

[没有发现file]

1. Arquivos de imagem, use o botão Criar PDF na página de boas-vindas para adicionar seus JPGs, PNGs, ect., e clique em Criar para convertê-los em PDF e abri-los no PDFelement. Para PDF não editáveis, basta usar a opção Abrir Arquivos para buscar o arquivo em sua pasta.

baixe ocr

2. Assim que o arquivo for aberto, você verá um prompt dizendo Executar OCR na barra de notificação acima do documento. Cliquar nela acionará um prompt solicitando que você baixe e instale o plug-in OCR. Faça isso agora.

executar ocr

3. Após a instalação, você está pronto para fazer OCR no arquivo PDF. Clique no botão de notificação para executar o OCR. Desta vez, você verá outra janela com duas seções de opções - na seção Opção Scanner, escolhe entre editável e pesquisável; na seção Intervalo de Páginas, selecione Todos, Atual ou especifique o intervalo de números de páginas a serem convertidos. Por fim, selecione o idioma de origem e clique em Aplicar.

intervalo de páginas ocr

4. Seu arquivo agora será convertido de acordo com suas configurações.

configurações de ocr


Parte 2. Como Exportar o Documento Convertido por OCR

Agora que o arquivo pode ser lido ou pesquisado, você pode editá-lo, extrair texto e realizar várias outras ações. Mas como exportá-lo? É disso que esta seção fala.

[没有发现file]

1. Como agora é um arquivo PDF, não há necessidade de nenhuma conversão adicional. Você pode exportar o arquivo indo em Arquivo - Salvar Como. Usamos esta opção para manter o PDF baseado na imagem original e usar outro nome para o arquivo convertido.

salvar como

2. Se precisar compartilhá-lo diretamente por email ou carregá-lo em um serviço de armazenamento em nuvem, você pode usar o ícone Compartilhar na parte superior ou usar Arquivo - Compartilhar para acessar o recurso. Isso acionará seu cliente de email padrão ou seu navegador. Você pode preencher o restante dos campos de email ou fazer login na sua conta do serviço de armazenamento em nuvem e armazenar o arquivo PDF lá.

anexar ao email

3. Outras forma de exportar um PDF com o OCR é imprimi-lo. Use a opção Arquivo - Imprimir para isso.

imprimir

Agora você pode seguir esses dois processos para qualquer PDF baseado em imagem ou arquivo de imagem contendo texto. Mas como você processa vários arquivos ao mesmo tempo? O PDFelement Pro também permite que você faça isso, conforme explicado na seção a seguir.


Parte 3. Como Fazer o OCR de Vários Documentos em Massa

O PDFelement Pro também oferece um recurso de processamento em lote para OCR e muitas outras funções. Para usar esse recurso, siga as etapas mostradas aqui.

[没有发现file]

1. N aguia Ferramenta, você verá Processo em Lote como uma opçaõ na barra de ferramentas. Clique nela para abrir a janela de diálogo Processo em Lote.

lote ocr

2. À esquerda, você verá várias opções como Converter, Criar e Otimizar. Clique em OCR no painel da barra lateral.

3. você pode arrastar e soltar os arquivos nesta janela ou usar o botão Adicionar Arquivos no canto superior direito.

4. Depois que seus arquivos gorem importados, você poderá escolher o idioma, o intervalo de páginas e outros parâmetros, como pesquisável/editável. Clique em Aplicar quando terminar e todos os arquivos serão convertidos de acordo com as configurações especificadas.

Usando esse processo, você pode converter centenas de arquivos com OCR rapidamente, permitindo que você digitalize rapidamente seus fluxos de trabalho de documentos.


Parte 4. Como Editar Documentos Digitalizados com OCR

Depois que o OCR for executado e o arquivo for editável, você poderá editá-lo como qualquer outro arquivo PDF legível por máquina. Isso significa que você pode controlar todos os elementos do arquivo, seja texto, imagens, hiperlinks, objetos incorporados, marcas d'água, cabeçalhos/rodapés e assim por diante. Aqui está o processo para editar um documento digitalizado após o OCR.

1. Supondo que você já tenha executado o OCR, agora você pode clicar na guia Editar na parte superior.

editar texto em pdf

2. Isso exibirá as várias ferramentas de edição para vários componentes. Por exemplo, se você deseja editar um trecho de texto, clique no ícone Texto. Você também pode editar o texto no modo linha ou parágrafo.

3. Quando estiver no modo de edição de texto, você pode selecionar qualquer palavra, frase ou paragráfo no documento e excluí-lo, adicioná-lo ou modificá-lo.

4. Para editar imagens, basta clicar no ícone da imagem e selecioná-la. Você terá opções para substituir, girar, reposicionar, etc.

5. Da mesma forma, existem opções para adicionar ou editar links, marcas d'água, planos de fundo e muito mais.


Por que PDFelement?

Para encerrar, vamos tentar responder a essa pergunta muito importante. A razão pela qual é importante é que você pode estar usando outro editor de PDF com funcionalidade OCR, mas pode não ser preciso ou pode estar fora do seu orçamento. Aqui estão algumas das razões para considerar mudar para o PDFelement:

[没有发现file]

  • Preciso - OCR é altamente preciso em mais de 20 idiomas, com suporte para OCR multilíngue
  • Rápido - As velocidades de conversão estão entre as melhores do setor
  • Intuitivo - PDFelement representa uma curva de aprendizado zero para novos usuários, facilitando a troca
  • Abrangente - Quase todos os recursos encontrados nos editores de PDF mais famosos do mundo podem ser encontrados no PDFelement
  • Atualizado - PDFelement recebe atualizações de versão constantes, tanto menores quanto maiores, que continuam alcançando novos padrões de desempenho e experiência do usuário.

Finalmente, vamos tentar responder a algumas perguntas que você possa ter sobre o OCR e tópicos relacionados.


Perguntas Frequentes

O OCR é 100% preciso?

Nenhuma ferramenta de OCR é 100% precisa com todos os tipos de conteúdo de texto. Por exemplo, se o texto for manuscrito de forma pouco legível, é muito difícil lê-lo com os olhos, muito menos realizar o OCR. No entanto, com texto impresso, o OCR é o mais preciso possível. Como tal, é extremamente útil ao converter arquivos digitalizados contendo texto impresso ou digitado e outros caracteres.

Posso usar o OCR para anotações manuscritas?

Conforme mencionado, a caligrafia precisa ser claramente legível para que o OCR funcione com precisão. A escrita cursiva é a mais difícil de converter, mas o nível de precisão é muito maior se a caligrafia for impressa em bloco. Lembre-se, quanto mais clara for a escrita e masi legível ao olho humano, mais preciso será o OCR.

Posso digitalizar diretamente um documento em um PDF editável?

Sim, o PDFelement oferece esse recurso. Para usá-lo, você pode clicar em Arquivo - Criar - Do Scanner. Isso abre a caixa de diálogo de configurações de digitalização, onde você verá um botão Digitalizar. Clique nele e o scanner digitalizará o documento, após o qual o PDFelement irá importá-lo e convertê-lo usando o plug-in OCR.

Download Grátis ou Compre PDFelement agora!

Download Grátis or Compre PDFelement agora!

Compre PDFelement agora!

Compre PDFelement agora!


Ana Sophia

staff Editor

Início > PDFelement para Mac How-Tos > Como Executar OCR em Texto PDF e Arquivos de Imagens