Компания Microsoft заявила о разработке системы на основе искусственного интеллекта, которая переводит с китайского языка на английский не хуже человека. Вместо привычной методики статистического машинного перевода, которая заключается в обучении программы на примере заготовленных лингвистами фраз, инженеры обратились к технологии глубоких нейросетей, которые дает более точные и естественные результаты.
Алгоритм тренировали на заметках из китайских СМИ, сравнивая переводы машины и человека. В частности, специалисты прибегли к методам регуляризации (переводу предложений слева направо и справа налево) и двойного обучения, когда ИИ сначала предложили выполнить перевод на английский, а после проверки лингвистом — обратно на китайский.
"Достижение паритета с человеком в области машинного перевода — это мечта, которая была у всех нас, — сказал главный научный сотрудник по речевым технологиям Microsoft Сюэдон Хуан. — Мы просто не понимали, что это произойдет так скоро".
Оценить качество перевода, если вы знаете оба языка, можно по этой ссылке. Пока инициатива остается исследовательским проектом, но в будущем технология может быть включена в "Переводчик Microsoft".
Прошлым летом технология распознавания голоса, разработанная в Microsoft, впервые достигла уровня точности, сопоставимого с человеком. Инженеры Microsoft Research смогли снизить долю ошибок, совершаемых компьютерными алгоритмами, до 5,1%, в то время как у человека этот показатель варьируется от 5 до 6%.
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Чтобы писать комментарии Вам необходимо зарегистрироваться либо войти на сайт под своим именем.
» Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации. Зарегистрируйтесь на портале чтобы оставлять комментарии
Материалы предназначены только для ознакомления и обсуждения. Все права на публикации принадлежат их авторам и первоисточникам. Администрация сайта может не разделять мнения авторов и не несет ответственность за авторские материалы и перепечатку с других сайтов. Ресурс может содержать материалы 16+