Recoñecemento de textos. Programa gratuíto - análogo de FineReader

Pin
Send
Share
Send

Máis tarde ou máis cedo, todos os que adoitan traballar con programas de oficina enfróntanse a unha tarefa típica: dixitalizar texto dun libro, revista, xornal, só folletos e logo traducir estas imaxes a formato de texto, por exemplo, nun documento de Word.

Para iso, precisa dun escáner e dun programa especial para recoñecer texto. Este artigo discutirá a contrapartida gratuíta de FineReader -Cuneiforme (sobre o recoñecemento en FineReader - consulte este artigo).

Comecemos ...

Contidos

  • 1. Características do programa CuneiForm, características
  • 2. Exemplo de recoñecemento de textos
  • 3. Recoñecemento de texto por lotes
  • 4. Conclusións

1. Características do programa CuneiForm, características

Cuneiforme

Podes descargalo desde o sitio web do desenvolvedor: //cognitiveforms.com/

Un programa de recoñecemento de texto de código aberto. Ademais, funciona en todas as versións de Windows: XP, Vista, 7, 8, o que agrada. Ademais, engade a tradución completa ao programa ruso!

Pros:

- recoñecemento de texto nos 20 idiomas máis populares do mundo (neste número inclúese o inglés e o ruso);

- enorme soporte para varias fontes de impresión;

- comprobar o dicionario de texto recoñecido;

- a capacidade de gardar resultados de traballo de varias maneiras;

- preservación da estrutura do documento;

- Gran apoio e recoñecemento da táboa.

Contras:

- non admite documentos e ficheiros demasiado grandes (máis de 400 ppp);

- Non admite directamente algúns tipos de escáneres (ben, non é un gran problema, inclúese un programa especial de escáner cos controladores do escáner);

- o deseño non brilla (pero quen o necesita se o programa resolve plenamente o problema).

2. Exemplo de recoñecemento de textos

Supoñemos que xa recibiu as imaxes necesarias para o seu recoñecemento (dixitalizado alí ou descargado un libro en formato pdf / djvu en Internet e eliminou delas as fotos necesarias. Como facelo, consulte este artigo).

1) Abre a imaxe desexada no programa CuineForm (ficheiro / abrir ou "Cntrl + O").

2) Para comezar o recoñecemento, primeiro debes seleccionar varias áreas: texto, imaxes, táboas, etc. No programa Cuneiform pódese facer non só manualmente, senón tamén automaticamente! Para iso, fai clic no botón "maquetación" no panel superior da xanela.

3) Despois de 10-15 segundos. O programa resaltará automaticamente todas as áreas con diferentes cores. Por exemplo, unha área de texto resalta en azul. Por certo, ela resaltou todas as áreas de xeito correcto e bastante rápido. Sinceramente, non esperaba unha reacción tan rápida e correcta dela ...

4) Para aqueles que non confían no esquema automático, pode usar o manual. Para iso, existe unha barra de ferramentas (ver a imaxe a continuación), grazas á cal podes seleccionar: texto, táboa, imaxe. Mover, ampliar / reducir a imaxe inicial, recortar os bordos. En xeral, un bo conxunto.

5) Despois de que todas as áreas estiveron marcadas, podemos continuar recoñecemento. Para iso, simplemente fai clic no botón co mesmo nome, como na imaxe de abaixo.

6) Literalmente en 10-20 segundos. Verás un documento en Microsoft Word con texto recoñecido. Curiosamente, no texto deste exemplo, por suposto, houbo erros, pero hai moi poucos! Ademais, tendo en conta a calidade sen impredecible que foi o material de orixe: unha imaxe.

A velocidade e calidade son bastante comparables a FineReader.

3. Recoñecemento de texto por lotes

Esta función do programa pode resultar útil cando non precisa recoñecer unha soa imaxe, pero varias á vez. O atallo para iniciar o recoñecemento por lotes adoita estar oculto no menú inicial.

1) Despois de abrir o programa, ten que crear un novo paquete ou abrir un gardado anteriormente. No noso exemplo, crea un novo.

2) No seguinte paso dámoslle nome, preferentemente a un que recorda o que se garda nel seis meses despois.

3) A continuación, seleccione o idioma do documento (ruso-inglés), e indique se hai imaxes e táboas no seu material dixitalizado.

4) Agora precisa especificar o cartafol no que se atopan os ficheiros para o recoñecemento. Por certo, o que é interesante, o propio programa atopará todas as imaxes e outros ficheiros gráficos que pode recoñecer e engadilos ao proxecto. Só tes que eliminar o extra.

5) O seguinte paso non é importante: escolla que facer cos ficheiros de orixe despois do recoñecemento. Recomendo que seleccione a caixa de verificación "non facer nada".

6) Resta só escoller o formato no que se vai gardar o documento recoñecido. Existen varias opcións:

- rtf - un ficheiro dun documento word, aberto por todas as oficinas populares (incluídas as gratuítas, unha ligazón a programas);

- txt - formato de texto, só podes gardar texto nel, imaxes e táboas non poden ser;

- htm - unha páxina de hipertexto, conveniente se escanea e recoñece ficheiros do sitio. Seleccionaremos no noso exemplo.

7) Despois de facer clic no botón "Finalizar", iniciarase o proceso de procesamento do seu proxecto.

8) O programa funciona bastante rápido. Despois do recoñecemento, unha lapela con ficheiros htm aparecerá diante de ti. Se fai clic nun ficheiro, comeza un navegador onde podes ver os resultados. Por certo, o paquete pódese gardar para máis traballos con el.

9) Como podes ver, os resultados o traballo é moi impresionante. O programa recoñeceu facilmente a imaxe e debaixo dela recoñeceuse facilmente o texto. A pesar de que o programa é gratuíto, normalmente é super!

4. Conclusións

Se a miúdo non dixitaliza e non recoñece documentos, probablemente a compra do programa FineReader non ten sentido. CuneiForm manexa a maioría das tarefas.

Por outra banda, ela tamén ten desvantaxes.

En primeiro lugar, hai poucas ferramentas para editar e comprobar o resultado. En segundo lugar, cando tes que recoñecer moitas imaxes, é máis conveniente en FineReader ver inmediatamente todo o engadido ao proxecto na columna da dereita: elimina rapidamente as innecesarias, fai correccións, etc. E, en terceiro lugar, CuneiForm perde como recoñecemento nos documentos: Teño que levar o documento á mente - editar erros, poñer signos de puntuación, comiñas, etc.

Isto é todo. Coñeces algún outro programa de recoñecemento de texto gratuíto digno?

Pin
Send
Share
Send