Начало - установка Cuneiform.
И вот, ждал меня сюрприз: при попытке просто посмотреть, что будет после ввода в консоли cuneiform, получила я сердитый ответ, что не хватает библиотеки там какой-то lib****.so.0.9.0. Чё?!?!?! Проверила я, все библиотеки тихо-мирно лежат в /usr/local/lib. Шозахрень? Взяла, ради пробы скопировала одну библ. в папку /lib. Глядь, прога её тут же нашла, но не нашла следующую. А там их штук 20 с лишним. Лень мне было с этим разбираться, я просто все нужные библиотеки с расширением .0.9.0 скопировала из /usr/local/lib в /lib:
Наверно, что-то не так собралось... Но после этого никакой ругани не было, в ответ на попытку запуска программа выдала коротенький man, как её использовать.
Тут всё предельно ясно:
-l язык eng ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur
-f формат выходного файла html, hocr, native, rtf, smarttext, text
--dotmatrix если распознаваемый документ напечатан на матричном принтере
--fax если... ля-ля-ля... получен факсом
-o как назвать выходной файл
ну и в конце просто имя распознаваемого файла. В итоге совсем не страшно:
на tif ругается чего-то...
вот такой мутный кошмар
распознался так:
И вот, ждал меня сюрприз: при попытке просто посмотреть, что будет после ввода в консоли cuneiform, получила я сердитый ответ, что не хватает библиотеки там какой-то lib****.so.0.9.0. Чё?!?!?! Проверила я, все библиотеки тихо-мирно лежат в /usr/local/lib. Шозахрень? Взяла, ради пробы скопировала одну библ. в папку /lib. Глядь, прога её тут же нашла, но не нашла следующую. А там их штук 20 с лишним. Лень мне было с этим разбираться, я просто все нужные библиотеки с расширением .0.9.0 скопировала из /usr/local/lib в /lib:
sudo find -name "*.0.9.0" -exec cp '{}' /lib \;
Наверно, что-то не так собралось... Но после этого никакой ругани не было, в ответ на попытку запуска программа выдала коротенький man, как её использовать.
cuneiform [-l languagename -f format --dotmatrix --fax -o result_file] imagefile
Тут всё предельно ясно:
-l язык eng ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur
-f формат выходного файла html, hocr, native, rtf, smarttext, text
--dotmatrix если распознаваемый документ напечатан на матричном принтере
--fax если... ля-ля-ля... получен факсом
-o как назвать выходной файл
ну и в конце просто имя распознаваемого файла. В итоге совсем не страшно:
cuneiform -l rus -f rtf -o ужжас.rtf хрень.jpg
на tif ругается чего-то...
вот такой мутный кошмар
распознался так:
Серыи чугун характеризуется низким сопротивлением Отрыву, почти полевым 1.)1~ у 1~ 1оиьи~ (тут текст на картинке "съеден") относительного удлинения (до 0,5;4), весьма низкой ударной вязкостью. Поэтому чем мельче графитовые пластины и чем больше они изолированы друг от друга, тем вьппе прочностные свойства чугунов при одной и той же металлической основе. Такая более благоприятная структура получается модифицированием, т.е. введением в жидкий сплав небольших количеств веществ, называемых модификаторами (ферросилиций, силикокальций). В структуре чугунов встречается также структурная составляющая, называемая фосфидной эвтектикой. Она образуется вследствие присутствия в чугуне фосфора. Фосфидная эвтектика улучшает жидксмтекучесть чугуна; будучи очень твердой составляющей, она так же повьппает его твердость и износостойкость. Однако при значительном количестве в структуре чугуна фосфидной эвтектики увеличивается его хрупкость и затрудняется обработка резанием. Серый чугун является одним из важнейших литейных машиностроительных материалов, так как он характеризуется высокими литейными и удовлетворительными механическими свойствами, хорошей обрабатываемостью, высокой износостойкостью, нечувствительностью к концентраторам напряжений и одновременно низкой стоимостью.Консольный cuneiform больше для не навороченных текстов пойдёт. Для навороченных настроек маловато. А графический интерфейс YAGF совсем меня не впечатлил - может сохранять только в простом тексте и html, таблицы и картинки не показывает. Есть cuneiform под виндуз, с gui, естественно. Там больше параметров распознавания: бла-бла-бла (это я параметры напечатала, с работы скрин принесу настроек), исходная картинка делится на блоки, которые можно редактировать. Распознаёт прилично, только немножко попилить надо. В смысле пощёлкать настройки, чтоб лучше получалось выходное.
Комментариев нет:
Отправить комментарий