SDL Trados - разпознаване на текст в сканирани PDF документи.
Thread poster: etale
etale
etale
Local time: 22:36
Spanish to Bulgarian
+ ...
Mar 12, 2018

Напоследък ми изпращат доста сканирани PDF документи. Функцията на SDL Trados 2017 за четене на PDF файли всеки път ми показва грешка.
Как се справяте Вие с този проблем, колеги?


 
Pavel Tsvetkov
Pavel Tsvetkov  Identity Verified
Bulgaria
Local time: 23:36
Member (2008)
English to Bulgarian
+ ...

Moderator of this forum
. Mar 12, 2018

Здравейте, etale!

Подходящ софтуер за преработката на сканирани документи в текст е ABBYY Finereader. Има и много други, но този се справя добре със славянски езици вкл. български.

Поздрави,
Павел


 
Ekaterina Kroumova
Ekaterina Kroumova  Identity Verified
French to Bulgarian
+ ...
Не е най-доброто решение Mar 12, 2018

Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBY... See more
Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBYY PDF Transformer+, отлично се справя, но май от известно време предлагането ѝ е спряно.

При всички случаи, ако често Ви изпращат такива файлове, или искайте предварително да Ви ги извлекат в подходящ за текстообработване формат, или си набавете надежден софтуер. Ако нямате притеснения за поверителността, има прилични онлайн варианти.
Collapse


 
invguy
invguy  Identity Verified
Bulgaria
Local time: 23:36
English to Bulgarian
Още един глас за ABBYY Mar 12, 2018

Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична ... See more
Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична работа.

Вероятно няма някои функции за автоматизация, с които разполагат по-новите версии. Но аз и без това съм малко консерва и не обичам софтуер да решава вместо мен, без да ме пита – тъй че ценя въможностите на тази версия за ръчен контрол, макар че това със сигурност прави процеса по-бавен.
Collapse


 
Georgi Kovachev
Georgi Kovachev  Identity Verified
Bulgaria
Local time: 23:36
Member (2010)
English to Bulgarian
+ ...
Купете си софтуер и поискайте повишение на цената Mar 12, 2018

Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина щ�
... See more
Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина ще отделяте по-малко време за странична дейност. Аз лично ползвам PDF Transformer Pro 2.0, който е предишната версия на PDF Transformer+.

Бих искал да Ви обърна внимание на цената. Опитът ми от последните месеци показва, че получавам все по-малко документи в текстови формат – както е и при Вас, както и че агенциите не са склонни да отделят време и ресурс, за да се занимават с подготовка на документите за превод – разбирайте преобразуване в текстови формат и сравняване на резултата с оригиналния текст.
Затова преди време поисках от една от агенциите по-висока цена за сканирани документи или за такива в PDF формат, при които преобразуването в текстови формат е по-лошо, най-вече заради необходимото допълнително време за обработка (за друга давам цена за всеки текст, като уговорката ми е, че за сканирани файлове тя е по-висока по подразбиране). Не постигнах по-висока цена с първата агенция, но вече пестя време, като предавам само текст и не се занимавам да копирам и нагласявам изображенията от оригиналния файл – знаете, че техническите ръководства са пълни с такива.

Установявам обаче, че запитванията, свързани със сканирани/PDF файлове, ми отнемат все повече време, а не всички от тях биват потвърждавани. Решението, което ползвам от скоро, е да преобразувам в .txt формат (с PDF Transformer Pro 2.0), съвсем набързо да събера цели изречения, които са на отделни редове, да изтрия излишните интервали и да анализирам текста с преводаческата програма. Това става по-бързо в сравнение с преобразуване в doc(x) формат, тъй като няма колони, таблици, символи за край на реда, параграф или страница – поне такова усещане имам от последната седмица. Вярно е, че няма таблици, но за даване на първоначална информация за срока на изпълнение и стойността на превода върши работа.

Моля, ако някой колега има по-ефективно решение в тази връзка, да го сподели

Поздрави!
Георги

П. С. Не се притеснявайте да искате компенсация за повечето отделено време за странична дейност. Ще установите, че колкото по-често казвате „Не“ (на нахални предложения да работите повече за същото възнаграждение), толкова повече ще постигате една от Вашите цели – по-голямо заплащане за повече положен труд или същото заплащане, но без допълнителен труд
Collapse


 
etale
etale
Local time: 22:36
Spanish to Bulgarian
+ ...
TOPIC STARTER
Благодаря Mar 13, 2018

Ще опитам пробната версия на ABBYY FineReader и след това вероятно ще го купя.
Документите, които ми изпращат, в повечето случаи съдържат лични данни и затова онлайн конвертирането е изключено.
Поисках да ми ги изпращат в подходящ формат [както казвахме едно време: във вид удобен за логаритмуване], но любезно ми отказаха.
Благодаря за отзивчивостта, колеги.
Желая Ви приятен ден!


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

SDL Trados - разпознаване на текст в сканирани PDF документи.






TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »