Pages in topic:   < [1 2 3 4] >
Compreno...
Thread poster: Michael Zapuskalov
Gennady Lapardin
Gennady Lapardin  Identity Verified
Russian Federation
Local time: 22:10
Italian to Russian
+ ...
Классный маркетинг ABBYY Feb 29, 2012

QUOTE
"Compreno" со слов Сергея Андреева и Татьяны Даниэлян. По словам Сергея Андреева опасность подстерегает при уходе в предметные области на массовых направлениях, потому что параллельных текстов становится сильно меньше, чем в бытовой и разговорной тематике. ABBYY и
... See more
QUOTE
"Compreno" со слов Сергея Андреева и Татьяны Даниэлян. По словам Сергея Андреева опасность подстерегает при уходе в предметные области на массовых направлениях, потому что параллельных текстов становится сильно меньше, чем в бытовой и разговорной тематике. ABBYY изначально отказалась от Rule Based Translation Model, 15 лет разрабатывала Универсальную Семантическую Иерархию (УСИ). На сегодняшний день 70 тысяч понятий в универсальной части когнитивной модели, более 80 тысяч - в русской, более 90 - в английской.
UNQUOTE

Мне кажется, здесь имеется какой-то смысл?

То есть, для перевода по трансцендентно-эзотерической тематике?
Collapse


 
Andrej
Andrej  Identity Verified
Local time: 22:10
Member (2005)
German to Russian
+ ...
--- Feb 29, 2012

Если отбросить весь написанный там бред, то речь идет о создании компьютерной модели языка-посредника. Кратко: исходник раскладывается на куски, эти куски соотносятся с соответствующими элементами языка-посредника, после чего эти элементы соотносятся с кусками языка пер�... See more
Если отбросить весь написанный там бред, то речь идет о создании компьютерной модели языка-посредника. Кратко: исходник раскладывается на куски, эти куски соотносятся с соответствующими элементами языка-посредника, после чего эти элементы соотносятся с кусками языка перевода. Модель не нова, новым является только использование компьютера. Основная сложность (не будем говорить про грамматику, игры с разными кусками и прочее, это все и так ясно) заключается в однозначном соотнесении всех элементов друг с другом, для чего требуются очень точные описания/дефиниции элементов. А создать таковые очень сложно, структуры получаются гигантские. Это мы и видим в статье на рисунке с древовидными структурами, посмотрите туда внимательно, там как раз такая детализация и представлена. Уже молчу о семантических полях и их наложении друг на друга, это вообще почти нерешаемо, во всяком случае, сейчас.

Предположим, что грамматические вопросы более или менее решены. Но в любом случае весь затык все равно в семантике, потому эта штука и называется у них универсальной семантической иерархией, а не как-то еще. Машина в любом случае не может понять, про что текст, и не может соотнести его с имеющимися фоновыми знаниями, как своими (каковых у нее нет), так и из сторонних источников.

ЗЫ Примеры с двойными отрицаниями, которые якобы представляют собой гигантский ступор, без особых проблем решаются rule-based системами, было бы правило, а сделать его на самом деле не так уж сложно.

[Edited at 2012-02-29 09:57 GMT]
Collapse


 
Gennady Lapardin
Gennady Lapardin  Identity Verified
Russian Federation
Local time: 22:10
Italian to Russian
+ ...
... Feb 29, 2012

Andrej wrote:
...в любом случае весь затык все равно в семантике...



тогда им надо переходить на варианты семантических моделей: Модель 1 - в тельняшке, Модель 2 - во фраке и т.д. до посинения


 
Kirill Semenov
Kirill Semenov  Identity Verified
Ukraine
Local time: 22:10
Member (2004)
English to Russian
+ ...
"Сумма технологии" Feb 29, 2012

Язык - это не мышление, а мышление - это не язык (то есть оно не
обязано быть т_о_л_ь_к_о языковым). "Значение", конечно, является
отношением, соответствием, имеет характер континуума, все это так, но это
прежде всего переживание. Фраза, высказывание, предложе�
... See more
Язык - это не мышление, а мышление - это не язык (то есть оно не
обязано быть т_о_л_ь_к_о языковым). "Значение", конечно, является
отношением, соответствием, имеет характер континуума, все это так, но это
прежде всего переживание. Фраза, высказывание, предложение означает
что-либо, если она порождает мысль, выражением которой является. Могут
существовать бессмысленные фразы, но нет бессмысленных мыслей. Значение не
"спрятано" во фразе: оно возникает в уме, когда эту фразу слушают или
читают. Нельзя говорить о фразе, будто она и е_с_т_ь значение. Говорят, и
правильно, что фраза имеет (определенное) значение. Она обладает им;
поэтому в языке, оторванном от существ, его понимающих, отсутствуют и
значения. Поэтому фразу сравнивают с формой, которую мысль наполняет
значением, вливаясь в нее; смысловым содержанием фраза наполняется в
психическом процессе. Если форму подвергнуть исследованию, то вскоре
окажется, что она не является "точной". Гипсовую форму можно оттиснуть в
ином материале, не утратив при этом чисто механическом переносе никаких
существенных деталей. Но невозможно "оттиснуть" достаточно развернутую
фразу в материале другого языка, пользуясь механическими средствами чисто
алгоритмического перевода. Фраза не просто форма мысли, а форма
обедненная, сокращенная и в то же время неоднозначная - ее можно
по-разному понимать, толковать множеством способов, по-разному "ворочать в
уме". Психические процессы, которые формируют значение, не являются
пассивным восприятием определенной цепочки сигналов и сопоставлением их со
"словарем" и синтаксисом. Можно услышать совершенно непонятную фразу, даже
если знаешь данный язык, его словарь и синтаксис. Я, например (из-за
умственной неполноценности, конечно), не понимаю многих фраз в текстах
Хайдегера или Гуссерля, они для меня ничего не значат.
Я говорю вполне серьезно. Фразы являются программой действий, но с
большими пробелами и очень расплывчатой; они "понятны" лишь потому, что
мозг располагает предпрограммированием, полученным за все время своего
существования. Перевод с одного языка на другой подобен попытке установить
взаимооднозначное соответствие между скелетами двух различных позвоночных.
Никакое чисто "формальное" сравнение не даст такого соответствия, если ему
не будет сопутствовать знание анатомии и физиологии, а также экологии этих
животных. Как догадаться о функциональном различии между хвостом кита и
хвостом слона, если не знаешь, что первый живет в океане, а второй -
сухопутное животное? Семантика является для языка тем же, чем для
остеологии - гравитация, ибо и тот и другой "скелет" формируют факторы,
лежащие вне их самих. Язык живет в "экологической" среде человеческого
мозга, начало которой лежит в природе и которая простирается в пределах
общественных систем. Значения находятся в психических процессах, вне фраз,
как мышцы - вне скелета или рука скульптора - вне глины. Они - оркестр, а
фразы - только партитура. Партитура симфонии - это еще не симфония, хотя,
конечно, и оркестр не сыграет симфонии без партитуры. По языковой
трудности тексты располагаются в непрерывный спектр, к тому же этот спектр
неодномерен; практически для каждого человека можно указать текст, который
он поймет на столь низком уровне, что при приеме будет утрачена
значительная часть содержащейся в тексте информации. Большинство людей
вообще не понимает слишком трудного или специализированного текста, из
чего можно заключить, что хорошая машина-переводчик должна была бы
демонстрировать незаурядный коэффициент интеллектуальности; но неизвестно,
как создать машинную программу, которая повышала бы этот коэффициент тем
больше, чем более трудный текст предстоит переводить.
Не случайно одним из самых свирепых критиков идеи "алгоритмически
переводящих машин" оказался Таубе - специалист в области программирования;
он-то прекрасно знает, какая пропасть лежит между реальными возможностями
программ перевода и тем, что можно прочесть в несчетных работах на эту
тему, работах тем более смелых по формулировкам, чем более они абстрактны.
В этих работах мозговые явления, природа которых до сих пор остается
загадкой, втискивают в корсет "физикалистской" терминологии, которая якобы
должна устранить всякую загадочность; там можно прочесть об "энтропии
сознания и подсознания", о "понятийных" и "эмоциональных кодах", об
"эстетической информации", там натягивают кибернетические маски на
психоанализ, отождествляют творческие процессы с методом проб и ошибок,
ставя знак равенства между созданиями ученых-теоретиков и шизофреников
(причем, по-видимому, неимоверно научным, то бишь "кибернетическим",
считается чисто формальный подход к "информационной оригинальности" -
смысл уравнивается в правах с бессмыслицей, ибо ведь ни тот, ни другая "не
имеют никакого отношения к алгоритмам"). Положение прямо противоположно
тому, которое существовало во времена братьев Райт. Они начинали уже
полеты на аппарате тяжелее воздуха, а почти никто из специалистов, или так
называемых специалистов, не верил в возможность осуществления таких
полетов. Напротив, профессионал-программист знает, чего можно ожидать от
цифровых машин, и знает алгоритмическую ограниченность программ; зато его
окружает рой "специалистов", которые нисколько не помогают ему в
преодолении трудностей, а попросту отрицают их своими многочисленными
совершенно голословными декларациями. Ясно, что подобное кибернетическое
"шаманство" не может привести ни к чему, кроме некоего смятения умов.
Личности, которые на досуге измышляют "новые виды" информации, или машины,
которые "все могут" и даже издают книжки с обилием схем, указующих, как с
инженерных позиций имитировать человеческий мозг, со спокойной совестью
предаются своим радостным занятиям, потому что всем их "открытиям" и
"изобретениям" не угрожает никакая экспериментальная проверка.
Между тем проблема существует, и никакими "терминологическими"
заклинаниями ее преодолеть нельзя. Неимоверно трудоемкие структурные
исследования указывают на то, что каждый микроскопический шаг на пути
улучшения качества примитивных машинных переводов должен быть куплен ценой
непропорционально огромного усложнения применяемых алгоритмических
структур. Одно дело - запрограммировать большую цифровую машину так, чтобы
она переводила фразы типа "Там стоит стул", "Падает снег", "Дети идут в
школу", и совсем иное - создать программу, с помощью которой машина может
перевести фразу вроде следующей: "Первичный способ преподнесения объекта
включает "изоляцию" объекта не только в смысле ограниченности, но также и
в том смысле, что объект лишь "извне" доступен для познающего субъекта,
каковой при этом в едином акте постигает его как целое либо же только
предвосхищает". Перевод этой фразы "без понимания вообще" представляется
невозможным. Человеку, который захочет ее перевести, надлежит изучать не
синтаксис, а скорее феноменологистские журналы. И он наверняка не сможет
"схватить" их стиль ни в каком алгоритме, дающем перевод хотя бы с
некоторым приближением к оригиналу. Можно задать вопрос, почему проблему
нельзя решить вероятностными методами. Текст книги можно сравнить с
информацией, содержащейся в хромосомах. Текст задает "смысл", как генотип
- зрелую особь. В обоих случаях имеет место вероятностное предопределение.
Известно, что фенотип организма отклоняется от генотипа, и аналогично
"фенотип" литературного произведения или философской работы способен
колебаться в определенном (зависящем от индивидуумов) диапазоне предельных
значений. Но этот вероятностный разброс ни в коей мере не является
хаотичным. Статистический подход подразумевает аппроксимацию,
асимптотическое приближение к предельному значению "идеальной точности", о
чем нельзя говорить в случае перевода, ибо класс "точных переводов"
данного текста содержит различные "типы точности", которые не вполне
сравнимы друг с другом. Хороший перевод отражает оригинал и в то же время
несет в себе черты собственного стиля переводчика. Машина, способная на
такой перевод, также проявила бы собственный стиль, а это означало бы, что
она имеет определенную индивидуальность, а не является всего лишь одной в
точности воспроизводимой ипостасью "единого алгоритма". Мы интуитивно
приходим к выводу - впрочем, хорошо известному, - что если процедуре
нельзя придать однозначность, то ее нельзя также и формализовать. Пусть
так, скажет кто-нибудь, пусть хорошие переводы образуют множество, может
быть, даже потенциально бесконечное, но можно справиться и с этим,
использовав понятие континуума. Это понятие подсовывает кибернетикам,
между прочим, и Таубе. Оно благородного рода, ибо происходит от
математики, но конструкторы, помня предостережение timeo Danaos et dona
ferentes 16, не хотят - осмотрительно! - принимать столь великодушный
подарок. Одно дело - почтенный, хоть и бессильный синонимический словарь,
и совсем другое - пресловутый континуум, чья бесконечность способна
разворотить любые словари. Разумеется, мы, когда беседуем, не страшимся
этого континуума - ведь мы-то п_о_н_и_м_а_е_м, ч_т_о г_о_в_о_р_и_м.

(...)

Не представляется, однако, возможным эффективно
использовать операциональный язык до конца в качестве орудия перевода в
сфере языков дискурсивных - мыслительных. Либо машины будут действовать
"понимающе", либо по-настоящему эффективных машин-переводчиков не будет
вовсе.


-- Станислав Лем, "Сумма технологии", 1963

P.S. Прошу прощения за пространную цитату.
Collapse


 
Jarema
Jarema  Identity Verified
Ukraine
Local time: 22:10
Member (2003)
German to Russian
+ ...

Moderator of this forum
Очевидно, Feb 29, 2012

Gennady Lapardin wrote:

Andrej wrote:
...в любом случае весь затык все равно в семантике...



тогда им надо переходить на варианты семантических моделей: Модель 1 - в тельняшке, Модель 2 - во фраке и т.д. до посинения


что это тупиковый путь. А если этого не понимает Голубицкий, очень жаль. Будет полноценный искусственный интеллект, тогда и поговорим. Пока это фантазии.

[Edited at 2012-02-29 10:09 GMT]

[Edited at 2012-02-29 10:13 GMT]


 
Andrej
Andrej  Identity Verified
Local time: 22:10
Member (2005)
German to Russian
+ ...
... Feb 29, 2012

Gennady Lapardin wrote:

Andrej wrote:
...в любом случае весь затык все равно в семантике...



тогда им надо переходить на варианты семантических моделей: Модель 1 - в тельняшке, Модель 2 - во фраке и т.д. до посинения


Это не имеет смысла, тогда их система не будет универсальной, и какой тогда в ней прок? Здесь могу, а там не могу? Подход как раз и заключается в том, чтобы создать некие универсальные описания для семантики неких понятий. Что "мальчик" - это вот такое-то нечто, описываемое такими-то атрибутами. Но: любой из нас опознает стол в любом столе, будь это кухонный стол, будь это стол на одной ножке или вообще без ножек, будь это рабочий стол какого-нибудь станка, будь это стол, который вообще не предназначен для того, чтобы на него что-то клали, и так далее без конца. И от стула мы его тоже легко отличим, даже если стол не является в общем смысле столом, а стул представляет собой, например, вовсе даже и памятник стулу, а не предмет для сидения на нем (и при этом мы опять же легко поймем, что это памятник стулу, а не стул). Проблема в том, что машина опознать стол в любом столе не сможет, так как ей не хватает дефиниций. Вот они и хотят набрать некую критическую массу таких дефиниций, чтобы распознавание происходило более или менее точно.

[Edited at 2012-02-29 10:17 GMT]


 
Gennady Lapardin
Gennady Lapardin  Identity Verified
Russian Federation
Local time: 22:10
Italian to Russian
+ ...
... Feb 29, 2012

Andrej wrote:

тогда их система не будет универсальной, ...набрать некую критическую массу ...дефиниций, чтобы распознавание происходило более или менее точно.



По своей темности понимаю это как составление тезауруса с корневыми словами. Желаю наиблагополучнейшего успеха в сием!


 
Andrej
Andrej  Identity Verified
Local time: 22:10
Member (2005)
German to Russian
+ ...
... Feb 29, 2012

Gennady Lapardin wrote:

По своей темности понимаю это как составление тезауруса с корневыми словами. Желаю наиблагополучнейшего успеха в сием!


Гораздо сложнее, на порядки. Опять же: посмотрите на те детализации, что представлены в рисунках в статье. Там разворачивать и разворачивать можно без конца, как видно по всем этим линиям, плюсикам и прочему.


 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 22:10
Member (2004)
English to Russian
+ ...
А еще чуток подождать и Feb 29, 2012

появится живой Пушкин-2 -- недавно по ТВ объявили, что клонируют с помощью добытого ДНК. Вот только кто будет отэц?

 
Vitali Stanisheuski
Vitali Stanisheuski
Belarus
Local time: 22:10
Member (2005)
English to Russian
+ ...
SITE LOCALIZER
- Feb 29, 2012

Лучше бы они занимались биороботами или имплантировали микросхемы в мозг человека, может быть, быстрее получилось бы. (Возможно, и не шутка)

 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 22:10
Member (2004)
English to Russian
+ ...
Лучше бы получше лечили людей Feb 29, 2012

и изобрели лучшие способы лечения от неизлечимых болезней

 
Vitali Stanisheuski
Vitali Stanisheuski
Belarus
Local time: 22:10
Member (2005)
English to Russian
+ ...
SITE LOCALIZER
- Feb 29, 2012

Vitali Stanisheuski wrote:

Лучше бы они занимались биороботами или имплантировали микросхемы в мозг человека, может быть, быстрее получилось бы. (Возможно, и не шутка)

в смысле - в рамках создания своей переводческой суперсистемы


 
Radian Yazynin
Radian Yazynin  Identity Verified
Local time: 22:10
Member (2004)
English to Russian
+ ...
Вечный двигатель Feb 29, 2012

Из рассказа Щедрина о крестьянине-сибиряке, изобретателе-самоучке, Александре Щеглове:
- Слышали мы, что вы закон вечного движения к практике применили? - начал я.
- Не знаю, как доложить, - ответил он, сконфуженно, - кажется, словно бы...
...- Должно бы, кажется, вертеться
... See more
Из рассказа Щедрина о крестьянине-сибиряке, изобретателе-самоучке, Александре Щеглове:
- Слышали мы, что вы закон вечного движения к практике применили? - начал я.
- Не знаю, как доложить, - ответил он, сконфуженно, - кажется, словно бы...
...- Должно бы, кажется, вертеться. Капризится будто...
- Можно отнять запорку?
...- Трения, может быть, в расчет не приняли?...
- Кабы колесо из настоящего материалу было сделано, а то так, обрезки кой-какие".

[Edited at 2012-02-29 12:34 GMT]
Collapse


 
Michael Zapuskalov
Michael Zapuskalov  Identity Verified
Russian Federation
Local time: 00:10
English to Russian
+ ...
TOPIC STARTER
еще пара ссылок Feb 29, 2012

новость
+
комментарии одного господина (без партнеров) и других товарищей (доставляют)


 
Alexey Ivanov
Alexey Ivanov  Identity Verified
Russian Federation
Local time: 22:10
English to Russian
и... Feb 29, 2012

Natalie wrote:

Ну, почему же. Может, и выйдет. Когда-нибудь.


что-нибудь, но совсем не то, что они обещают.


 
Pages in topic:   < [1 2 3 4] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Compreno...


Translation news in Russian Federation





Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »
Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »