HYBRID MULTIMODAL TEXT DIGITIZATION FOR PUBLISHING AND PRINTING
Анотація
This paper investigates AI application in text input for the publishing sector. It establishes a classification system for digitization methods based on text complexity and defines key selection criteria. To improve the processing of complex content, the author proposes a hybrid Optical Character Recognition (OCR) and Automatic Speech Recognition (ASR) approach, alongside a specialized multimodal algorithm integrated into publishing workflows.
Поліграфічні, мультимедійні та web-технології у цифровому середовищі. Том 1: колективна монографія
##submission.downloads##
Сторінки
335–344
Опубліковано
червня 5, 2026
Категорії
Авторське право (c) 2026 Харківський національний університет радіоелектроніки
Деталі про цю монографію
ISBN-13 (15)
978-617-8254-58-2