Небольшой мануальчик по вёрстке для CAT
Thread poster: mikhailo

mikhailo
Local time: 18:18
English to Russian
+ ...
May 8, 2018

Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, чит
... See more
Видя живой интерес к вопросу со стороны отдельных лиц, набросал небольшую инструкцию по верстке документов для программ автоматизированного перевода (CAT).
Старался кратенько, ибо если тему разжёвывать до мелочей и с иллюстрациями может получиться хороший гроссбух, читать который современная молодёжь вряд ли станет.

Как всегда замечания и предложения по усовершенствованию are welcome.
http://transfiles.ru/g5453
Collapse


 

A.Petrova

Local time: 18:18
English to Russian
Повторите, пожалуйста Jun 6, 2018

Не могли бы Вы еще раз выложить файл, пожалуйста!

 

VIP9N
Local time: 18:18
Russian to English
+ ...
Ссылка Jun 6, 2018

A.Petrova wrote:
Не могли бы Вы еще раз выложить файл, пожалуйста!


Надеюсь, Михайло не обидится. Я скачал созданный и предлагаемый им материал по ссылке в Городе переводчиков и полностью прочёл его.
https://mega.nz/#!ithBAA6C!mtOaQBSdLGeaSQ95w9mveFndX2dkFsEbJFNw4k5f6QY
Скажу, что направление и посылы очень верные.

Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.


 

A.Petrova

Local time: 18:18
English to Russian
Спасибо! Jun 6, 2018

Огромное спасибо, Михайло и VIP9N! Интересный материал.
VIP9N wrote:
Единственно, кто бы ещё начинающим втолковал, что правильное использование OCR-систем для САТ-ов подразумевает исключительно сохранение сути распознанного (чистый ТХТ с последующим форматированием руками), а не формы, когда «распознанный» ворд невозможно нормально дальше обрабатывать в САТ-ах.

Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


 

VIP9N
Local time: 18:18
Russian to English
+ ...
Бывают, конечно Jun 7, 2018

A.Petrova wrote:
...Думаю, те, кто работает с этими самыми начинающими и растолковывают, по мере возникновения соответствующих проблем)) А бывают и начинающие догадливые...


Только, как показывает моя личная статистика последних лет 15-20 (когда началось действительно массовое использование OCR), этих догадливых, обычно, процентов 10-12 из 100 набирается.

Как правило, диалоги со случайными заказчиками идут вот так:
- Здравствуйте, нам вас рекомендовали такие-то. У нас есть в перевод такие-то документы. Страниц 20-30 по такой-то цене до такого-то числа. Возьмёте?
- Да, здравствуйте. Сроки нормальные. А в каком виде виде у вас исходный оригинал?
- В электронном. Можем прислать на почту.
- Это хорошо, но я спрашиваю в редактируемом или нет. Это Ворд или картинка, картинка в пдф?
- Ну, в пдф. А какая разница? Кидаете в Файнридер и через 10 секунд у вас редактируемый Ворд.
- Не всё так просто. Вам же нужно качественно и достаточно быстро сделать, правильно? В общем, вы отправьте на электронку, я гляну и вам отпишусь.

А дальше всё просто. Если там какая-нибудь мелочь с несложным форматированием (например, устав компании «Рога и копыта» или бухбаланс табличный или договор и т.д.) и цена-сроки устраивает, то соглашаешься, ибо форматирования там немного. Но если, например, это кредитное соглашение, страниц на 150-200, которое юридические секретари «вылизывали» пару дней (со всеми перекрёстными ссылками-сносками), а потом отдали в срочный перевод на сторону в виде пдф (пусть и реального, не графического), то от такого заказа лучше воздержаться. Просто только от трети до половины предлагаемого срока потребуется на то, чтобы воспроизвести такой док в Ворде. Да и не особо интересно мне форматированием заниматься, если честно. У форматирования лишь один существенный плюс. Пока форматируешь, успеваешь изучить весь документ в целом.

Бывает и известные в Москве бюро присылают настолько отвратительно распознанные доки (с кучей паразитных кодов и битыми строками (когда одно предложение оказывается разнесённым на несколько несвязанных строк)), что диву даёшься. Случалось, когда в работу присылали документы на французском без диакритики вовсе (а зачем, у нас ведь «ё» тоже как бы на отшибе живёт, так же, наверное, и у французов, не? Они что, все эти значки реально над буквами пишут? ) и с кучей ошибок распознавания. Объяснения, что эти моменты замедляют работу (вам приходится намного больше раз прочитывать одно и то же, догадываться что там изначально было написано, а сегменты ваших TMX просто не видятся системой) просто не катят. Процентов 10 заказчиков только смутно понимают о чём вообще речь идёт.

Поэтому наставление от Михайло - хороший документ, как ни крути.


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Небольшой мануальчик по вёрстке для CAT

Advanced search


Translation news in Russian Federation





TM-Town
Manage your TMs and Terms ... and boost your translation business

Are you ready for something fresh in the industry? TM-Town is a unique new site for you -- the freelance translator -- to store, manage and share translation memories (TMs) and glossaries...and potentially meet new clients on the basis of your prior work.

More info »
SDL Trados Studio 2019 Freelance
The leading translation software used by over 250,000 translators.

SDL Trados Studio 2019 has evolved to bring translators a brand new experience. Designed with user experience at its core, Studio 2019 transforms how new users get up and running and helps experienced users make the most of the powerful features.

More info »



Forums
  • All of ProZ.com
  • Term search
  • Jobs
  • Forums
  • Multiple search