Варианты сегментации в САТ
Thread poster: DZiW (X)
DZiW (X)
DZiW (X)
Ukraine
English to Russian
+ ...
May 19, 2015

Приветствую.

Сегодня постоянный клиент прислала ТМ и задание на перевод EN>RU.
С текстом ничего особенного, подключение прошло без нюансов, НО сегментация ТМ выполнена по абзацам 2-5 предложений.

Я в курсе, что есть различные варианты и цели, но вот какая п�
... See more
Приветствую.

Сегодня постоянный клиент прислала ТМ и задание на перевод EN>RU.
С текстом ничего особенного, подключение прошло без нюансов, НО сегментация ТМ выполнена по абзацам 2-5 предложений.

Я в курсе, что есть различные варианты и цели, но вот какая польза?
Согласен, иногда с вариантом в контексте легче сориентироваться, но как-то напряжно, ведь кроме заниженного индекса совпадения (fuzzy match) приходится ещё обрезать. Наловчиться вполне реально, но стоит ли оно того...

Подскажите, я один такой устаревший с настройками по умолчанию или действительно есть какое-то преимущество?

Спс.
Collapse


 
Mikhail Kropotov
Mikhail Kropotov  Identity Verified
Germany
Local time: 08:38
English to Russian
+ ...
Ячейки из Excel? May 19, 2015

Если сегментация делается по целым ячейкам, это может быть вполне оправданно. Смотря что за текст.

А что обрезать приходится?

[Edited at 2015-05-19 11:31 GMT]


 
Andrej
Andrej  Identity Verified
Local time: 12:38
Member (2005)
German to Russian
+ ...
Across May 19, 2015

Возможно, память экспортирована из Across, в котором, скажем мягко, сегментация идиотская. В том числе и целыми абзацами.

 
DZiW (X)
DZiW (X)
Ukraine
English to Russian
+ ...
TOPIC STARTER
Хм May 19, 2015

Спасибо, Михаил.
А ведь вполне может быть, что дело в Excel. Тогда всё не так уж и загадочно.

Это обычный .DOCX файл, где "по-абзацный" ТМ заказчика выдаёт довольно низкий match именно из-за того, что на одно fuzzy предлагается совпадение с пачкой предложений (исходный абзац ил�
... See more
Спасибо, Михаил.
А ведь вполне может быть, что дело в Excel. Тогда всё не так уж и загадочно.

Это обычный .DOCX файл, где "по-абзацный" ТМ заказчика выдаёт довольно низкий match именно из-за того, что на одно fuzzy предлагается совпадение с пачкой предложений (исходный абзац или ячейка). Вот и приходится либо копировать нужную часть, либо обрезать лишнее даже у 100% match с нагрузочными предложениями, что превращается где-то в 52% match.

Суть в том, что такая нетрадиционная, в смысле - альтернативная разбивка на сегменты мне не особо помогает в Computer-Aided/Assisted Translation, а должно бы...

Ладно, раз дело ясное, что дело тёмное, то надо бы как-то пересегментировать и/или заново сопоставить/выровнять ТМ почти на 5,5МБ. Коллеги, есть предложения пока я не привык к абзацам?)


Андрей, а вы не подскажете, если я импортирую в бесплатный Across, то будет легче или fuzzy match останется "блочный"?

Благодарю.

[Edited at 2015-05-19 12:06 GMT]
Collapse


 
Mikhail Kropotov
Mikhail Kropotov  Identity Verified
Germany
Local time: 08:38
English to Russian
+ ...
Align May 19, 2015

Если я правильно Вас понял, сегментация по абзацам -- в ТМ. Следовательно, нужно настроить сегментацию и рабочего документа тоже по абзацам.

Если наоборот, то, соответственно, наоборот.


 
boostrer
boostrer  Identity Verified
United States
Local time: 02:38
Member (2007)
English to Russian
+ ...
* May 19, 2015

Либо ТМ сделана из таблицы, либо образовалась при переводе сайта.
Если пользуетесь МемоКу, то сочетания из 2-3 предложений не проблема. Если абзацы больше, то да, сложно.
С другой стороны, чужая ТМ помогает мало и редко, так что все равно проблем нет - и зачем стулья ломать?


 
DZiW (X)
DZiW (X)
Ukraine
English to Russian
+ ...
TOPIC STARTER
одно из условий заказа May 19, 2015

сохранить лексику и стилистику автора ТМ. То есть, скорее всего это продолжение перевода, а не работа с чистого листа. Я глянул текст, оценил примеры перевода в ТМ и согласился на условия, но не ожидал подвоха с сегментацией.

В принципе, в такой "поблочной" сегментации
... See more
сохранить лексику и стилистику автора ТМ. То есть, скорее всего это продолжение перевода, а не работа с чистого листа. Я глянул текст, оценил примеры перевода в ТМ и согласился на условия, но не ожидал подвоха с сегментацией.

В принципе, в такой "поблочной" сегментации тоже есть свой некий шарм - не такой сильный отрыв от кон/текста, но никакущий match пока только усложняет процесс сверх ожидаемого - иногда в TU более пяти предложений.

Работа не срочная, так что для начала распечатаю пару страниц для образца и параллельно гляну варианты стандартизации для более построчной сегментации. Так смотри - и заказчик к тому времени что-то рациональное подскажет.

Век живи, век учись)
Collapse


 
Maxim Manzhosin
Maxim Manzhosin  Identity Verified
Russian Federation
Local time: 09:38
English to Russian
Align May 19, 2015

DZiW wrote:

заново сопоставить/выровнять ТМ


Так как в ТМ одному предложению оригинала не обязательно соответствует ровно одно предложение перевода, придется выравнивать в полуавтоматическом режиме: проверять результаты машинного выравнивания и исправлять ошибки. То есть это мало чем отличается от обычного выравнивания двух файлов с оригиналом и переводом.

Экспортируйте ТМ в формат «текст, разделенный табуляцией», откройте этот файл в Excel, вырежьте столбец с переводом и вставьте в другой файл. У вас останется оригинал в одном файле, а перевод в другом. Скормите эти два файла Studio/WinAlign/ABBY Aligner/вашей любимой программе и надейтесь, что ошибок выравнивания будет не очень много.


 
DZiW (X)
DZiW (X)
Ukraine
English to Russian
+ ...
TOPIC STARTER
Ну, более-менее May 20, 2015

Заказчик не смогла уточнить почему такая сегментация ТМ и в какой САТ выполнялась, но согласилась дополнительно оплатить почасовую правку ТМ как за редактуру.

Учитывая, что у меня нет скидок за повторы и с меня требуют только в сроки сдать чистовик, то это весьма неплохо) Хотя иногда вот попадаются разорванные тегами предложения, но это уже терпимо.

Всем спасибо.


 
Maxteams
Maxteams
English to Russian
Варианты сегментации в САТ May 20, 2015


Экспортируйте ТМ в формат «текст, разделенный табуляцией», откройте этот файл в Excel,...


Дальше можно сделать еще проще:
1) Копируйте первый столбик (target), вставляете в Word и сохраняете
2) Копируйте второй столбик (source), вставляете в Word и сохраняете
3) Затем выравниваете (align или alignment) два файла. Это можно сделать в Trados, MemoQ, ABBY Aligner. (Зависит от того с какой программой вы работаете)
4) Сохраняете выравненный файл в нужном формате и загружаете в TM
И будет вам счастье.
На все это потребуется не более 10-15 мин.


 
boostrer
boostrer  Identity Verified
United States
Local time: 02:38
Member (2007)
English to Russian
+ ...
Счастья не будет May 21, 2015

[quote]Maxteams wrote:


Экспортируйте ТМ в формат «текст, разделенный табуляцией», откройте этот файл в Excel,...
На все это потребуется не более 10-15 мин.


Это если в ТМ пара сотен сегментов. Если больше, то править выравнивание вручную - это кошмар и ужас, лучше не связываться. Уйдет несколько часов или дней.

[Edited at 2015-05-21 20:30 GMT]


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Варианты сегментации в САТ


Translation news in Russian Federation





CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »