Вышла
первая стабильная версия системы распознавания текста Cuneiform для платформы
Linux. В новой версии проведена большая работа по исправлению ошибок и
чистке исходных текстов, что дало разработчикам основание полагать о
стабилизации кодовой базы проекта. Код Cuneiform для Linux
распространяется под упрощенной лицензией BSD и основан на коде открытом
компанией Cognitive Technologies в 2007 году.
OCR CuneiForm может распознавать любые полиграфические,
машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров
за исключением декоративных и рукописных. В систему встроены специальные
алгоритмы для распознавания текста с матричного принтера, плохих
ксерокопий факсов и машинописи. Поддерживается более чем 20 языков.
Отдельно стоит отметить отличную поддержку распознавания текста на
русском и украинском языках. Результат распознавания может быть сохранен
в форматах HTML, hOCR, RTF или PDF с сохранением особенностей
начертания оригинала (выделение жирным, курсивом и т.д.).