Как сделать TM из двух файлов с "мусором"?
Thread poster: Igor Savenkov
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 04:14
Member (2007)
English to Russian
May 31, 2015

Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, к�
... See more
Имеется два файла - один с исходным текстом, другой - с переводом. Проблема в том, что тексты "замусорены". Например, в исходном файле есть строчка:
chat_destination_all = "All"
Ей соответствует перевод:
chat_destination_all = "Все"
Соответственно, здесь chat_destination_all = - мусор, которого не должно быть в ТМ. Причем весь "мусор" имеет аналогичную структуру "чего-то_там =".
Я понимаю, что алгоритм для удаления простой: "С начала каждой строчки удалить весь текст до знака = и один пробел после него". Только как и где его реализовать, чтобы сделать это удаление автоматически?
Collapse


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 04:14
English to Russian
+ ...
Автозаменой May 31, 2015

Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
... See more
Заменить все ненужные комбинации на ничего.
Если комбинации очень разнообразны, то заменить "AnyChraracterAnyChraracterAnyChraracterAnyChraracter = " на ничего.
Количество AnyChraracter после каждой замены уменьшать.

Если в поле "Найти" вводить текст вручную, то, например:
^?^?^?^?^?^?^? =
или
???????? = (при включенном Use Wildcards, Подстановочные знаки).

[Edited at 2015-05-31 11:40 GMT]

[Edited at 2015-05-31 11:41 GMT]

[Edited at 2015-05-31 12:11 GMT]
Collapse


 
mk_lab
mk_lab  Identity Verified
Ukraine
Local time: 04:14
Member (2004)
English to Russian
+ ...
В Word'е May 31, 2015

Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Ч
... See more
Команда "Заменить"
В окне "Найти и заменить" включаем "Подстановочные знаки" и вводим в поле "Найти:" такое "^l*= ", а в поле "Заменить на:" вводим "^l", где ^l - это знак разрыва строки.
"Enter"

Если все строки имеют такую структуру, то получится все, кроме первой строки.
Чтобы получилась и первая строка, нужно добавить перед ней еще одну произвольную строку.

Если в исходном тексте стоит знак переноса строки, а не разрыва строки (как тут это получилось, возможно случайно), то используем его

[Edited at 2015-05-31 11:26 GMT]
Collapse


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 04:14
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Михаил! May 31, 2015

Признаюсь, что не знал, что в Word можно использовать подстановочные знаки (стыд и позор).
Сейчас попробовал по-вашему - не получилось: видимо, у меня не "разрыв строки", а "перенос строки", а символа "перенос строки" я не вижу среди символов "Специальный".
Будем думать дальше.


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 04:14
English to Russian
+ ...
Проблема в том, что May 31, 2015

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, мне такой фокус не удавался в моих вордах.

[Edited at 2015-05-31 15:37 GMT]


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 04:14
Member (2007)
English to Russian
TOPIC STARTER
Официальное подтверждение May 31, 2015

Alexander Matsyuk wrote:

"^l" и "^p" с подстановочными знаками не работают.
Во всяком случае, у меня такой фокус не удавался в моих вордах.


Да, действительно, в справке Office так и написано:
^p (не действует в поле Найти, если установлен флажок Подстановочные знаки) или ^13

(https://support.office.com/ru-ru/article/Замена-текста-с-использованием-подстановочных-знаков-5cda8b1b-2feb-45a6-af0e-824173d3d6e4?ui=ru-RU&rs=ru-RU&ad=RU)

 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 04:14
English to Russian
+ ...
Количество ^? нужно сначала задать разумно максимально May 31, 2015

а потом уменьшать.
Я сначала неправильно написал. Исправил.
По идее, не может их быть больше, скажем, двадцати.
Если и останутся какие-то супердлинные, их можно в конце удалить вручную.


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 04:14
English to Russian
+ ...
"^l" в принципе работает May 31, 2015

но не "отбивает" нужный конец строки.

 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 04:14
Member (2007)
English to Russian
TOPIC STARTER
Да, должно сработать May 31, 2015

Alexander Matsyuk wrote:

Количество ^? нужно сначала задать разумно максимально, а потом уменьшать.


но хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 04:14
English to Russian
+ ...
Мне тоже ) May 31, 2015

Igor Savenkov wrote:
хотелось бы решение "поизящнее", тем более что количество ^? у меня может достигать 30.


Хотя я обычно удовлетворяюсь малоизящным.

Поизящнее так:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 04:14
Member (2007)
English to Russian
TOPIC STARTER
Спасибо, Александр! May 31, 2015

Alexander Matsyuk wrote:

Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).


Работает


 
mk_lab
mk_lab  Identity Verified
Ukraine
Local time: 04:14
Member (2004)
English to Russian
+ ...
А. ну да, действительно, May 31, 2015

^p при включенных подстановочных знаках не работает.

Alexander Matsyuk wrote:
Если вы уверены, что в тексте нет символа $, сначала выполняем замену ^p на $.
(Вместо $ можно взять что-то другое. Например ***)

Затем производим замену в режиме подстановочных знаков: "$* = " на "$"

Если все ок, выполняем обратную замену $ на ^p (уже снова в обычном режиме замены).

Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньше


 
Alexander Matsyuk
Alexander Matsyuk  Identity Verified
Ukraine
Local time: 04:14
English to Russian
+ ...
Да, так хитрее May 31, 2015

mk_lab wrote:
Можно было также не заменять ^p на $, а просто вставить $ после ^p (при отключенных подстановочных знаках), а затем заменить "$* = " на "" (пусто) при включенных подстановочных знаках. На одну операцию меньше


но внутренне еще беспокойнее


 
boostrer
boostrer  Identity Verified
United States
Local time: 21:14
Member (2007)
English to Russian
+ ...
Поздно увидел тему, Sep 27, 2015

но для следующих поколений:

нужно было сделать простой макрос: поиск " = " > стрелка вправо > выделение от места курсора до начала строки > удалить > вернуться в начало макроса.

Дальше можно его либо просто запустить и со временем, когда все уже будет удалено, выключить, или добавить в конец макроса выход по достижении конца текста.


 
Igor Savenkov
Igor Savenkov  Identity Verified
Russian Federation
Local time: 04:14
Member (2007)
English to Russian
TOPIC STARTER
Невероятно! Sep 27, 2015

Как раз сейчас мне опять потребовалось провести подобную чистку - и тут пришло последнее сообщение! Спасибо, boostrer, помогло - и так проще всего (заодно и освоил макросы в Word ).

 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Как сделать TM из двух файлов с "мусором"?


Translation news in Russian Federation





Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »
CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »