Software de recoñecemento de textos

Pin
Send
Share
Send

Por regra xeral, cando se trata de programas para recoñecer texto dixitalizado (OCR, recoñecemento óptico de caracteres), a maioría dos usuarios recordan o único produto: ABBYY FineReader, que, sen dúbida, é o líder entre este software en Rusia e un dos líderes do mundo.

Non obstante, FineReader non é a única solución: hai programas gratuítos para recoñecer texto, servizos en liña para os mesmos fins e, ademais, tales funcións tamén están presentes nalgúns programas que vostede sabe que xa se poden instalar no seu computador. . Intentarei escribir sobre todo isto neste artigo. Todos os programas revisados ​​funcionan en Windows 7, 8 e XP.

Líder de recoñecemento de textos - ABBYY Finereader

A maioría de vostedes probablemente escoitou falar sobre FineReader (pronunciado Fine Reader). Este programa é o mellor ou un dos mellores para o recoñecemento de alta calidade de textos en ruso. O programa é de pago e o prezo dunha licenza para uso doméstico é lixeiramente inferior a 2000 rublos. Tamén é posible descargar unha versión de proba de FineReader ou usar o recoñecemento de texto en liña en ABBYY Fine Reader Online (pode recoñecer varias páxinas de xeito gratuíto, despois de pago). Todo isto está dispoñible no sitio web oficial do creador //www.abbyy.ru.

A instalación dunha versión de proba de FineReader non causou problemas. O software pode integrarse con Microsoft Office e o Explorador de Windows para facilitar o recoñecemento. Entre as limitacións da versión de proba gratuíta: 15 días de uso e a capacidade de recoñecer non máis de 50 páxinas.

Captura de proba para programas de recoñecemento

Como non teño un escáner, usei unha instantánea desde a cámara dun teléfono de baixa calidade para comprobar, na que editei un pouco o contraste. A calidade non vale para nada, vexamos quen pode manexala.

Menú de FineReader

FineReader pode recibir unha imaxe gráfica do texto directamente desde o escáner, desde ficheiros de imaxe ou a cámara. No meu caso, foi suficiente para abrir o ficheiro de imaxe. O resultado satisfeito - só un par de erros. Debo dicir que este é o mellor resultado de todos os programas probados cando se traballa con esta mostra - a calidade de recoñecemento semellante só estaba no servizo gratuíto en liña OCR gratuíto en liña (pero nesta revisión estamos falando só de ferramentas de software, non de recoñecemento en liña).

Resultado de recoñecemento de texto en FineReader

Francamente, FineReader probablemente non ten competidores para textos cirílicos. As vantaxes do programa non son só a calidade do recoñecemento de texto, senón tamén unha ampla funcionalidade, soporte de formato, exportación competente a moitos formatos, incluíndo Word docx, pdf e outras funcións. Así, se as tarefas de OCR son algo que atopas constantemente, non aforras unha cantidade relativamente pequena de cartos e pagará a pena: aforrarás unha cantidade enorme de tempo obtendo un resultado de alta calidade en FineReader. Por certo, non anuncio nada, de verdade creo que aqueles que precisan recoñecer máis dunha ducia de páxinas deben considerar a compra deste software.

CuneiForm: un programa gratuíto de recoñecemento de textos

Na miña opinión, o segundo programa de OCR máis popular en Rusia é o CuneiForm gratuíto, que se pode descargar desde o sitio web oficial //cognitiveforms.ru/products/cuneiform/.

Instalar o programa tamén é moi sinxelo, non intenta instalar ningún software de terceiros (como moito software libre). A interface é concisa e clara. Nalgúns casos, o xeito máis sinxelo de usar o asistente, para o cal a primeira das iconas do menú.

O programa que non afrontei coa mostra que empreguei en FineReader ou, máis precisamente, deu algo mal lexible e contornos de palabras. O segundo intento fíxose cunha captura de pantalla do texto desde o propio sitio deste programa, que, con todo, tivo que aumentar (precisa analizar cunha resolución de 200 ppp e superior; non le capturas de pantalla cun grosor da liña de letra de 1-2 píxeles). Aquí fíxoo ben (parte do texto non foi recoñecida, xa que só se seleccionou o ruso).

Recoñecemento de textos en CuneiForm

Así, podemos supor que CuneiForm é o que debes probar, especialmente se tes páxinas dixitalizadas de alta calidade e queres recoñecelas de balde.

Microsoft OneNote é o programa que xa pode ter

Microsoft Office, que comeza desde a versión 2007 e remata coa actual, 2013, ten un programa para tomar notas: OneNote. Tamén ten funcións de recoñecemento de texto. Para empregalo, simplemente inserir a imaxe dixitalizada ou calquera outra imaxe na nota, faga clic co botón dereito sobre ela e use o menú contextual. Teño en conta que o idioma por defecto de recoñecemento está fixado en inglés.

Recoñecemento en Microsoft OneNote

Non podo dicir que o texto se recoñeza perfectamente, pero, polo que podo dicir, é algo mellor incluso que en CuneiForm. O plus do programa, como xa se mencionou, é que cunha probabilidade considerable xa está instalado no seu computador. Aínda que, por suposto, é pouco probable que o use se é preciso traballar cun gran número de documentos dixitalizados, é máis adecuado para recoñecer rapidamente as tarxetas de visita.

OmniPage Ultimate, OmniPage 18 - Debe ser algo moi legal

Non sei o bo que é o programa para o recoñecemento de texto OmniPage: non hai versións de proba, non quero descargar nalgún lugar. Pero, se o seu prezo está xustificado e custará uns 5.000 rublos na versión para uso individual e non Ultimate, entón isto debería ser algo impresionante. Páxina do programa: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

Prezo do software OmniPage

Se te familiarizas coas características e as críticas, incluso nas edicións en lingua rusa, obsérvase nelas que OmniPage realmente ofrece un recoñecemento de alta calidade e precisión, incluso en ruso, compara dixitalizacións de calidade relativamente baixa e proporciona un conxunto de ferramentas adicionais. Entre as carencias, a interface non é a máis conveniente, especialmente para un usuario novato. Dun xeito ou outro, no mercado occidental OmniPage é un competidor directo de FineReader e nas clasificacións en inglés loitan precisamente entre si, e polo tanto, creo que o programa debería ser digno.

Non son todos os programas deste tipo, tamén hai varias versións de pequenos programas gratuítos, pero mentres experimentaba con eles atopei dúas desvantaxes principais inherentes a eles: a falta de soporte cirílico ou varios software pouco útiles no kit de instalación, polo que decidín non mencionalos. aquí

Pin
Send
Share
Send