Адрес для входа в РФ: exler.world
Голосовой транслятор
Microsoft представила на конференции в Калифорнии Skype Translator технологию, которая позволяет понимать друг друга людям в режиме реального времени, даже если они говорят на разных языках. (Отсюда.)
Ну, прям идут в ногу со временем, в Google Translator такое уже лет пять существует, если не больше (в мобильной версии можно наговорить текст, он его переведет, там можно нажать значок динамика - он перевод воспроизведет, причем это делается, как правило, именно носителем языка). Только толку с этого - ноль. Автоматические переводчики более или менее пристойно работают только при переводе с очень близких языков (как, например, русский и украинский, испанский и каталанский), а во всех остальных случаях показывает результаты от "ниже среднего" до "реальный ужас".
И что толку, что вот этот кошмар будет воспроизводиться с голоса? Сначала система распознавания голоса будет конкретно лажать (они все лажают), потом вот это не слишком правильно распознанное будет кошмарно переводиться кошмарным автоматическим переводчиком, потом то же самое будет делаться с противоположной стороны.
ВООБРАЖАЮ! (с) Хоботов
P.S. Ролик об этой технологии. Где-то с 1:15 идет демонстрации. На демонстрации все красиво (что неудивительно, фразы долго подбирали заранее), но на демонстрациях всегда все красиво.
Т.е., если сказать "I'm sorry", то будет распознано с любым акцентом, а вот если сказать: "I sorry", то он никогда не напишет "sorry", а напишет, например, "I soy", или "I saw you" (это часть более длинной тестовой фразы, но работает и по отдельности).
Суть тут именно в том, что этот сервис будет встроен в скайп, наверняка будет использовать для перевода те же узловые сервера, через которые проходит трафик, либо которые можно задействовать. Сейчас есть разные аддоны, которые, например, позволяют записывать разговор или голос менять, но что-то, настолько многообещающее, но встроенное нативно - всегда лучше, чем какая-то гуглонедоделка, которую гугл все равно скоро закроет.
не люблю за глючную и нелогичную винду, которой время от времени приходится пользоваться. гугл я не люблю еще больше, но смарт у меня на андроиде. но по удобству сделать звонок (а особенно, сбросить до включения автоответчика) или фото старый смарт на винмобайле лучше, ибо для всего этого есть кнопки. а вообще, я в последние годы затрудняюсь что-то техническое любить. все глючат, все факапятся, все развиваются к худшему. больше ненужных фич, больше ресурсов и т.д. все, кто производил что-то хорошее, продаются худшим, которые не перенимают их качество (пример - винты от самсунга и хитачи). или стараются перенять от них все худшее. (пример - файрфокс vs. хром). хоть вешайся или становись отшельником. но без инета жизнь тоже не мила.
Это старость.
(Правда, за что они систему назвали Сири (по-японски - жопа) и не переименовали ее в японском варианте, я не знаю. Ну, наверное, не смущает...)
Согласен, английский стоит учить Впрочем, я не проверял качество, например, китайско-японского перевода. Ну и опять же, зависит от типа использования: если просто, чтобы поржать - это одно. Если ты знаешь, что пишешь по делу, и что переводить будет машина - то можно и ограничить себя в идиоматике и постараться изъясняться понятно.
Согласен. Вот выше товарищ из Бинга правильно сказал, если нельзя объять необъятное, то стоит выделить важную нишу и сделать в ней конфетку. Бизнес-переписка как раз такой нишей и является, а если учесть что МС Офис нацелен на ту же аудиторию, то Майкрософту сам Бог велел уметь переводить деловую лексику лучше всех.
А вот переводчики конечно лажают, это бесспорно. Так что лажающий транслятор и правда мало кому нужен.
Многие американские коллеги утверждают, что понять текст, переведенный электронным переводчиком легче, чем английский написанный тем же китайцем или японцем. Т.е. они просят присылать письма на родном языке, во избежание недоразумений. Зная, как пишут некоторые мои японские коллеги, мне тоже кажется, что лучше машинный перевод... Да и вежлевее получается 😉
1. В случае перевод Скайп-разговора перевод в первую очередь заточен под перевод "разговорной лексики", а не любого текста. Это позволяет в достаточной степени ограничить контекст для проведения семантического анализа.
2. В основе данного решения машинного перевода лежит "глубокая нейронная сеть" (точнее -- несколько таких сетей, для разных подзадач), задача которой и основана на том, чтобы произвести адекватное распознавание аудиосигнала, искользую при необходимости коррекцию на основе данных семантического анализа. Опять таки ограничение перевода разговорной лексикой позволяет ограничить домены лексики и морфологии вполне определенным контекстом.
3. В отличие от классического машинного перевода, где после разбора фразы на исходном языке начинается перевод отдельных лексем на другой язык и потом синтез фразы с учётом грамматики, в данном решении упор сделан на перевод именно частых разговорных фраз, с акцентом либо на бытовую лексику, либо на деловые переговоры.
Гугл тоже идёт в том же направлении, и мне сложно сравнимать качество его перевода, но важно понять, что качество перевода будет прямо пропорционально тому, как часто то или иное выражение встречается в сети в документах с параллельным переводом (например в статьях вики на разных языках). Чем фраза более специфическая и редкая, тем менее точным будет её машинный перевод.
Теперь по поводу немецкого языка. В немецком языке действительно есть много сложносоставных слов (Composita) и в речи возможно спонтанное образование нового слова. Однако этот феномен есть и во многих других языках (например финском), и в несколько изменённом виде и в европейских языках -- например употребление нескольких существительных подряд в английском (screen saver, keyboard layout, browser window). В немецком за счёт того, что слово пишется вместе его сложнее разбить, но даже современные средства проверки орфографии это умеют делать, не говоря уже о системах машинного перевода.
Перевод представленный на демо вполне адекватный. Конечно, это подобранные фразы, но фразы вполне естественные для делового разговора по Скайпу (где и предлагается услуга этого переводчика). Конечно, стихи Блока или хокку вряд ли будет адекватно переведено -- для этого нужно понять смысл фразы, а это пока еще не доступно искусственному интеллекту. Но для деловой беседы "для бедных" (когда нет денег или времени на человеческого переводчика) -- это вполне приятная фича, которая как раз и оптимизирована под данную нишу услуг.
По требованию юристов компании я обязан в публичных обсуждениях добавлять, что я работаю на Майкрософт (подразделение Bing), однако никак не связан с разработкой данной функции, и все вышесказанное -- моё частное мнение.
:)
- Так Вы согласны подписать контракт?
- Да, наверное, нет.
- So, do you agree to sign a contract?
- Yes, maybe, no.
Вы не знаете, использует ли Майкрософт сейчас, или планирует использовать в будущем подобное решение?
Термин, который Вы ищете, называется "агглютинация". 😄
Не буду повторять, что то же самое правило распространяется на все языки. И понятно, что разработка ведется в первую очередь для английского. Потом испанский, французский, немецкий, японский, китайский. До русского очередь дойдет после нидерландского (чисто из маркетинговых соображений). Так о чем спор? О том, что система плохо воспринимает рашен-инглиш, или плохо воспринимает российский-русский? О первом спорить глупо, о втором бессмысленно.
Все эти системы голосового ввода заточены под носителей языка. Если вы китаец, система поймет ваш китайский (пекинский или шанхайский) очень хорошо, если вы изучали китайский на курсах в питере - даже не пытайтесь.
Не буду повторять, что то же самое правило распространяется на все языки. И понятно, что разработка ведется в первую очередь для английского. Потом испанский, французский, немецкий, японский, китайский. До русского очередь дойдет после нидерландского (чисто из маркетинговых соображений). Так о чем спор? О том, что система плохо воспринимает рашен-инглиш, или плохо воспринимает российский-русский? О первом спорить глупо, о втором бессмысленно.
Вообще не о том...
+1005000
+ over 9000
....ответить не в состоянии ибо рыдаю и валяюсь пацталом 😄))))
Вся фишка именно про перевод в режиме реального времени, при разговоре в Skype.
Хм.. любопытно. Надо будет пробовать. А вдруг... ) Вроде, там что-то говорят про семантику. Остается вопрос: Когда оно выйдет и будет ли русский язык?
Глянул. Обычная демонстрация. Я тоже могу так подобрать фразы, чтобы их автоматический переводчик терпимо переводил. И что? А уж по поводу немецкого - это вообще ржачка, немецкий автоматическому переводу из-за их манеры склеивать слова вообще почти не поддается 😉
XineF: Вся фишка именно про перевод в режиме реального времени, при разговоре в Skype.
Так у Google это тоже фактически в режиме реального времени работает, наверняка можно такой режим сделать (сейчас просто два раза надо кнопку нажимать). Только смысл-то какой? Качество перевода все равно неудовлетворительное.
ABBYY, вроде, начал движение в этом направлении со своим Compreno .
Именно.
Пока не будет семантического анализа текста, любой машинный перевод будет никудышний.
ABBYY, вроде, начал движение в этом направлении со своим Compreno .
Семантический анализ был уже в 80х, в лаборатории машинного перевода в ИППИ и в Институте Востоковедения. Просто не очень совершенный 😉
Но прогресс все-таки есть: например, в коне 90х HP Laser Jet переводился как "лазерный самолет лошадинной силы". А сейчас так уже ни один переводчик не лажается 😉 Хотя и понять, что он там наперевел, бывает трудно.
А до этого с семантическим анализом текста танцевала компания Stocona. Выпустили свой поисковик "Stocona Search", сейчас это проект AskNet, ru.wikipedia.org , но что-то особого успеха не видно.
А так: alternathistory.org.ua
В мобильной версии GT нажимаешь на микрофон. Произносишь фразу. Он ее переводит. Нажимаешь на динамик - он ее воспроизводит, причем, как правило, голосом носителя языка.
А мужикам очень полезно матчасть изучить, а то так и помрут дураками.
И что мне такого интересного расскажет оригинал? Мне рассказы не интересны. Мне интересно, как это будет работать. А работать это будет конкретно херово, что очевидно.