Como traducir unha imaxe a texto usando ABBYY FineReader?

Pin
Send
Share
Send

Este artigo será un complemento ao anterior (//pcpro100.info/skanirovanie-teksta/), e con máis detalle revelará a esencia do recoñecemento directo do texto.

Comecemos pola esencia propia de que moitos usuarios non entenden completamente.

Despois de dixitalizar un libro, xornal, revista, etc., obtén un conxunto de imaxes (é dicir, ficheiros gráficos, non ficheiros de texto) que necesitas recoñecer nun programa especial (un dos mellores para isto é ABBYY FineReader). Recoñecemento: é o proceso de obtención de textos a partir de gráficos e é este proceso que describiremos con máis detalle.

No meu exemplo, vou facer unha captura de pantalla deste sitio e tratarei de sacar texto del.

 

1) Apertura dun ficheiro

Abre a imaxe (s) que pretendemos recoñecer.

Por certo, débese notar aquí que pode abrir non só formatos de imaxe, senón tamén, por exemplo, ficheiros DJVU e PDF. Isto permitirá recoñecer rapidamente todo o libro, que na rede, normalmente distribúese nestes formatos.

2) Edición

De acordo inmediatamente co recoñecemento automático non ten moito sentido. Se, por suposto, tes un libro no que só hai texto, non hai imaxes e placas, ademais está dixitalizado con excelente calidade, entón podes. Noutros casos, é mellor configurar todas as áreas manualmente.

Normalmente, primeiro debes eliminar áreas innecesarias da páxina. Para iso, fai clic no botón de edición do panel.

Entón só precisa deixar a zona coa que desexa traballar máis tempo. Para iso, existe unha ferramenta para recortar os bordes non desexados. Na columna dereita, selecciona o modo cultivo.

A continuación, selecciona a área que queres deixar. Na imaxe de abaixo resáltase en vermello.

Por certo, se tes varias imaxes abertas, pódese aplicar o recorte a todas as imaxes á vez. Conveniente non cortar cada individual. Teña en conta que na parte inferior deste panel hai outra gran ferramenta:borrador. Usándoo, pode borrar táboas non desexadas, números de páxina, manchas, caracteres especiais innecesarios e seccións individuais da imaxe.

Despois de facer clic para cortar os bordos, a túa imaxe orixinal debería cambiar: só queda a área de traballo.

A continuación, pode saír do editor de imaxes.

3) Resaltar áreas

No panel superior á imaxe aberta hai pequenos rectángulos que definen a área de exploración. Hai varios deles, considere brevemente os máis comúns.

Imaxe: o programa non recoñecerá esta área, simplemente copia o rectángulo especificado e pegao no documento recoñecido.

O texto é a área principal na que se centrará o programa e tratará de sacar texto da imaxe. Esta área destacaremos no noso exemplo.

Despois da selección, a zona está pintada de verde claro. A continuación, pode pasar ao seguinte paso.

4) Recoñecemento de textos

Despois de definir todas as áreas, faga clic no comando recoñecer no menú. Afortunadamente, non fai falta máis nada neste paso.

O tempo de recoñecemento depende do número de páxinas do documento e da potencia do ordenador.

En media, unha páxina completa dixitalizada de boa calidade leva 10-20 segundos. potencia media do PC (segundo os estándares actuais).

 

5) Verificación de erros

Calquera que sexa a calidade inicial das imaxes, os erros adoitan permanecer despois do recoñecemento. Igual, ata o de agora ningún programa foi capaz de excluír completamente o traballo humano.

Faga clic na opción de verificación e ABBYY FineReader comezará a amosarlle un por un os lugares do documento onde tropezou. A túa tarefa, comparando a imaxe orixinal (por certo, este lugar mostrarase nunha versión ampliada) coa opción de recoñecemento - responde afirmativamente ou corrixe e aproba. A continuación, o programa pasará ao seguinte lugar difícil e así sucesivamente ata que se comprobe o documento completo.

 

En xeral, este proceso pode ser longo e aburrido ...

6) Aforro

ABBYY FineReader ofrece varias opcións para gardar o teu traballo. A máis usada é a "copia exacta". I.e. todo o documento, o texto nel, formatarase así como na fonte. Unha opción conveniente para transferilo a Word. Así o fixemos neste exemplo.

Despois diso, verás o teu texto recoñecido nun documento de Word familiar. Creo que non ten moito sentido pintar máis que facer con el ...

Así, fixemos un exemplo concreto de como traducir unha imaxe a texto simple. Este proceso non sempre é sinxelo e rápido.

En todo caso, todo dependerá da calidade da imaxe de orixe, da túa experiencia e da velocidade do ordenador.

Que teñades un bo traballo!

 

Pin
Send
Share
Send