Адрес для входа в РФ: exler.world
Голосовой переводчик в Skype
Некоторое время назад компания Microsoft запустила в Skype тестовую версию автоматического перевода - как для сообщений, так и для разговоров. Соответствующая пиктограмма появилась в правом верхнем углу, там функцию перевода можно активировать для каждого абонента, указав при этом, на каком языке общаетесь вы и на каком абонент.
В технических изданиях, авторы которых в курсе современного состояния дел с машинным переводом, об этой новости писали очень спокойно, потому что понимали, что тут не только никакой "революции" не произошло, но и говорить о нововведении можно разве что только как об игрушке, в которую поначалу немного поиграются, а потом забросят ввиду почти полной непригодности.
Зато в глянцевых изданиях и в телевизоре понеслась разлюли-малина из серии "больше не нужно учить иностранные языки", "все границы общения стерты", "профессия переводчика стала невостребована" и прочая полнейшая чушь.
Мне как бы наплевать на все это, однако друзья и родственники начитались и наслушались передач на данную тему и теперь всерьез считают, что этим автоматическим переводчиком можно пользоваться.
Ну, ладно, решил посмотреть, как это все работает. Сначала погонял автоматический перевод чата - это проще всего.
С одной стороны - русский, с другой - испанский. Получается обычный машинный перевод. Цитирую из пресс-релиза MS:
В отличие от других переводчиков, данный сервис переводит не отдельные слова, а целиком предложения, учитывая морфологию и принцип построения фраз.
Так вот. Во-первых, морфологию и принцип построения фраз переводчик Google начал учитывать минимум лет за пять до того, как был написан данный пресс-релиз. Во-вторых, да и Google до сих пор все это дело учитывает более чем криво, а уж у MS переводчик еще более примитивный (ну, оно и понятно). Что в итоге получается? Простейшие идиомы не понимает (фраза сверху - "¡A tomar por culo!"; впрочем, Google ее еще круче переводит - "Для того, чтобы задницу!"), элементарнейшие фразы, как правило, переводит нормально, как только текст чуть сложнее - уже плывет или совсем уплывает. Какая-то морфология тут проявляется крайне редко. У Google с этим делом, кстати, слегка получше.
Так что, как обычно с машинными переводчиками, все это дело можно использовать для понимания хотя бы общего смысла, однако тут все сильно зависит от исходного текста. Простейшие тексты - да, можно понять, но когда текст уже более сложный - начинаются проблемы. А если собеседник будет использовать всякие идиомы, сокращения, молодежный сленг и так далее - все это превращается в совершенно нечитаемую кашу.
Ну, в общем, это знают все, кто более или менее плотно работал с машинными переводчиками.
Да, ну и еще, конечно, многое зависит от исходных языков. Потому что, например, английский-испанский и наоборот - работает намного лучше, чем английский-русский/русский-английский.
Но с переводами чатов - и так все понятно. Мне интересно было попробовать широко разрекламированную возможность автоматического голосового перевода. Но вот тут началась веселуха. Потому что тут распознавалка голоса работала, мягко говоря, очень криво.
Для чистоты эксперимента сначала мы включили просто распознавание с русского на русский. Программа пыталась понять, что мы говорим, и выдавала это в виде текста. Разговор получился, как видите, более чем содержательный.
А это уже с той стороны идет испанский, который распознается и делается перевод на русский. Красота!
Ну, в общем, если с чатом еще туда-сюда, то с переводом с голоса - вилы полные и прежде всего - из-за системы распознавания, которая работает очень криво. Что странно: у того же Google клавиатурная распознавалка работает более или менее пристойно, я ее иногда использую, когда текст совсем простой.
Так что тут о переводе живого текста не может быть и речи. Ну, конечно, кроме ситуаций, когда вы просто хотите чисто поржать. Потому что очень кривое распознавание, а потом еще и очень кривой перевод-подстрочник - на выходе будет только Чак в Бразилии и лыжи Бога, я понимаю.
По Сети в рекламных целях гоняют всякие смешные ролики, вроде того, с детишками, где англоговорящая девочка легко объясняется с испаноговорящей. Ну, таких роликов, как вы понимаете, наснимать можно хоть тыщу, делов-то. Более того, если долго посидеть, то можно составить, например, испано-английский диалог, в котором переводчик будет работать почти идеально. Если очень-очень долго посидеть. Но для живой речи - пока вообще никак. А уж радостные ролики про беседы англоязычных с китайцами - это, конечно, ржачка полнейшая.
Да вы сами попробуйте, это все довольно забавно.
"30 сентября, в 9:25 ученые и инженеры центра изучения плазмы Массачусетского технологического института сделали шаг вперед в погоне за чистой энергией. Команда установила новый мировой рекорд по давлению плазмы в токамаке Alcator C-Mod. Давление плазмы является ключевым элементом для производства энергии в процессе ядерного синтеза, новый результат MIT достиг более 2 атмосфер.
Пресс-служба MIT "
Так что дело движется потихоньку
news.mit.edu
Я так понимаю, это отсюда. Молоцы, что работают. Конечно, полезно ставить достижимые задачи. О количестве энергии на выходе я не нашел, только пишут, что давление -- 2/3 задачи. Надеюсь, это так. Часто трудность задач нелинейна, и смотря как сформулировать... Можно сказать, что долететъ до Марса -- 50% задачи. По затратам, и сложности, полет обратно -- самое трудное (не помню чисел... 99%?), а не 50%. Т.е. вторая половина в 50 раз сложнее первой. 😄
Именно. Только системы искусственного интеллекта, иначе никак.
Дело в том чтобы перевести фразу, нередко (а то всегда) нужно понять смысл. Это думаю отрицать не будем? Вот как раз в слове "понять" и начинаеться все, т.к. это уже упирается в проблему AI.
AI в узкоспециализированных областях уже дает неплохие результаты - тот же распознаватель речи например. За последние 10 лет - очень серьезный сдвиг.
Пока не сделают спелчекер, способный исправлять -тся/ться - не поверю, что компутерная программа может достойно переводить с одного языка на другой.
А если сделают для языков без -тся/ться, а на последние вообще забьют, тоже не поверите?
Морфеус, ты как здесь?
geektimes.ru
https://geektimes.ru/post/281652/
Читал. Позволил себе не поверить.
>еще одна крем ее водит другой язык. Вы.
Великолепно! запомню эти коаны! ))
invisible999( 24.10.16 13:04 )
Это врятьли (с) тов. Сухов
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.
Такие же прогнозы десятилетиями крутятся вокруг сильного искуственного интеллекта и квантовых компьютеров. Они все будут "завтра", ага...
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.
Посмеялся, спасибо! Мне об этом ещё семнадцать лет назад об этом навешивали 😄
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.
неисключено подтянется за счет изменения текста в сторону более пригодного для перевода
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.
Да-да, это последние лет 25 мне рассказывают.
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.
Только за десять лет можно три-четыре языка самому выучить
Я думаю, умение писать ться тся у людей быстрее подтянется.
Главное не сам перевод, а распознавание звуков. Перевод набитых текстов работал уже в конце 90-х, что можно было примерно понять, о чем речь идет.
Я бы сказал -- позорище. Artificial Intelligence my ass.
А в том диалоге с русского на русский что реально говорилось никак нельзя посмотреть? А то что-то догадалка отказывает...
Увы, это только звук можно было записать.
С английским языком работает хорошо по очень простой причине - он выбран в качестве базового языка. Поэтому, при переводе с испанского на русский и обратно, на самом деле имеем цепочку испанский - английский - русский в одну сторону, и русский - английский - испанский в другую. С соответствующим результатом
А тогда всегда будет такой результат, что очевидно 😉