Google использует искусственный интеллект для коренного усовершенствования переводчика Translate Tool
Обучение машин тому,
чтобы они могли по-настоящему понимать естественный язык, было одной из
самых сложных задач, стоящих перед компьютерными учеными, работающими
над продвижением искусственного интеллекта. Компания Google смогла
добиться реального прогресса в том, чтобы компьютеры рассматривали язык
как нечто большее, чем просто набор слов, и эти достижения в настоящее
время внедряются во все их продукты.
Например, с внедрением нейронного машинного перевода (NMT) коренным
образом преобразовался переводчик Google Translate. Уже сегодня можно
заметить значительные улучшения качества любых переводов с хинди,
русского и вьетнамского языков. Это стало очередным шагом вслед за
первым использованием NMT в Translate в ноябре прошлого года, когда
претерпели улучшения переводчики с английского, французского, немецкого,
испанского, португальского, китайского, японского, корейского и
турецкого.
«У нас всего 103 языка, и наша цель состоит в том, чтобы они все
работали с нейронными сетями», — сказал официальный представитель
Google. Он добавил, что переводы с остальных языков будут включены ещё
не скоро, и точное время неизвестно, потому что Google запускает каждый
новый язык только тогда, когда достигнут высокий уровень, превосходящий
возможности существующей системы. Иногда это получается быстро, как с
сегодняшними версиями переводчиков с хинди, русского и вьетнамского.
Переводчик Google всегда считался полезной штукой, но в целом был
слабоват. С его помощью можно было ещё понять, что означает на другом
языке какое-то слово, но он уже не мог точно переводить отдельные фразы.
Теперь с этим новым подходом переводы на Google Search,
translate.google.com, в приложениях Google и, в конечном счёте,
автоматический перевод страниц в Chrome станет значительно совершеннее и
будет, наконец, отражать особенности естественного языка.
«Нейронный перевод намного лучше, чем наша предыдущая технология,
потому что теперь мы одновременно переводим целые предложения, а не их
куски», — написал в новостной ленте блога Барак Туровский, являющийся
ведущим специалистом по Google Translate.
Ранее Google полагался на технологию фразового машинного перевода
(PBMT), предусматривающую разбитие входных предложений на слова и фразы,
которые потом переводятся независимо друг от друга. Однако, новый NMT
перевод рассматривает все предложение как единую структуру и переводит
его с учётом этой целостности. NMT использует глубокие нейронные сети,
которые позволяют компьютеру понимать ситуации, с которыми он при
обучении не сталкивался прежде, благодаря новой информации. В данном
случае некоторые наборы, используемые программой для обучения — это
данные из сообщества Google Translate Community, где обычные
пользователи со всего мира переводят предложения со своих языков.
Не все языки будут подключены в течение ближайших месяцев, но следующая их партия ожидается уже через несколько недель. Источник: gearmix.ru.
Рейтинг публикации:
|