Сделать стартовой  |  Добавить в избранное  |  RSS 2.0  |  Информация авторамВерсия для смартфонов
           Telegram канал ОКО ПЛАНЕТЫ                Регистрация  |  Технические вопросы  |  Помощь  |  Статистика  |  Обратная связь
ОКО ПЛАНЕТЫ
Поиск по сайту:
Авиабилеты и отели
Регистрация на сайте
Авторизация

 
 
 
 
  Напомнить пароль?



Клеточные концентраты растений от производителя по лучшей цене


Навигация

Реклама

Важные темы


Анализ системной информации

» » » Компьютеры наконец услышат людей

Компьютеры наконец услышат людей


21-10-2013, 17:51 | Наука и техника / Новости науки и техники | разместил: Редакция ОКО ПЛАНЕТЫ | комментариев: (1) | просмотров: (1 832)

Разработан новый алгоритм идентификации личности и распознавания речи, который может совершить революцию в способах управления компьютером. Впервые машины смогут узнавать людей, говорящих на любом языке, а в перспективе и понимать их.

 

Исследователи из Массачусетского технологического института нашли новый способ анализировать различия между голосами разных людей, что позволяет надежно идентифицировать людей по голосу, отсеивать несущественную для распознавания смысла сказанного информацию. Новый алгоритм не требует значительных вычислительных ресурсов и может работать без дополнительного обучения компьютера.

В настоящее время все мало-мальски надежные системы идентификации и распознавания речи требуют обучения. Проще говоря, сначала человек произносит слова, дает возможность машине узнать особенности произношения конкретного человека, после чего возможно распознавание его речи. Точность идентификации по речи и распознавания при этом зависит от того, сколько времени и сил потратил человек на обучение своего электронного помощника. Понятно, что данная методика очень трудоемка, к тому же она почти бесполезна во многих очень перспективных сферах применения, например обеспечении доступа по голосовому паролю и переводе беседы двух людей.

Для решения этой проблемы нужен алгоритм, который мог бы отсеивать индивидуальные особенности речи людей. Однако, для создания звукового портрета одного оратора, современные компьютеры анализируют более 2000 различных звуков, многие из которых могут соответствовать искомым согласным и гласным звукам, а многие нет. Для описания каждого из этих звуков, компьютеру может понадобиться около 60 переменных, таких, например, как сила акустического сигнала в различных частотных диапазонах. В результате, за каждую секунду речи система должна обрабатывать 120 000 значений, что требует больших вычислительных возможностей, недоступных мобильным устройствам. Поэтому и требуется индивидуальное обучение компьютера распознаванию речи.

Исследователи из MIT продемонстрировали новый алгоритм, сокращающий число переменных, и позволяющий распознавать речь без необходимости обучения. Суть технологии заключается в особом методе распознавания индивидуальных особенностей речи, названном i-vector. Новая технология дает такое же качество анализа голоса, как и системы, требующие обучения.

Чтобы приблизительно понять, как работает i-vector, представьте график, например показывающий зависимость потраченных на работу часов от полученной заработной платы. Обычный график – это диагональная линия в двумерном пространстве. А теперь представьте, что график повернули вокруг своей оси таким образом, что все линии стали параллельны линии взгляда. Таким образом, все линии графика слились в одну, линия Y стала не нужна, и все изменения в графике описываются одной линией X.

Схожим образом i-vector обнаруживает новые оси для описания информации, которая характеризует звуки речи в 120000-мерном пространстве. Сначала алгоритм находит ось, которая описывает большую часть акустической информации, затем следующую ось, содержащую наибольшее количество информации и так далее. В результате количество информации, добавляемой с каждой новой осью, постепенно уменьшается.

В ходе экспериментов, ученые MIT установили, что новому алгоритму достаточно всего 100-мерной акустической картинки, чтобы описать все возможные комбинации звуков человеческой речи. Более того, в определенных случаях с помощью i-vector можно уменьшить количество этих измерений до 3-х.

 

 

Для каждой секунды речи, i-vector создает одну виртуальную точку в трехмерном пространстве, а затем определяет границы кластеров точек, которые характеризуют особенности речи. Следующий шаг заключается в определении границ кластеров точек (эти кластеры соответствуют речи определенного оратора). Затем алгоритм выявляет кластеры, которые близки друг другу и сливает их в один, постепенно остаются лишь очень непохожие кластеры, которые наверняка являются речью разных людей.

Технология i-vector позволяет идентифицировать говорящего за время менее 30 секунд. Понятно, что новую технологию прежде всего будут применять спецслужбы: для обнаружения скрывающихся людей или автоматического просеивания сетей в поисках конкретных собеседников и конкретных тем. Новый алгоритм найдет широкое применение и в повседневной жизни, например компьютеры смогут опознать хозяина по голосу, а значит отпадет проблема забытого пароля. Также система анализа особенностей речи может помочь в разработке новых технологий распознавания речи и автоматического перевода звуковых сигналов речи в электронные: команды или буквы на мониторе.



Источник: cnews.ru.

Рейтинг публикации:

Нравится0



Комментарии (1) | Распечатать

Добавить новость в:


 

 
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Чтобы писать комментарии Вам необходимо зарегистрироваться либо войти на сайт под своим именем.

  1. » #1 написал: Vct (22 октября 2013 12:46)
    Статус: Пользователь offline |



    Группа: Посетители
    публикаций 0
    комментариев 90
    Рейтинг поста:
    0
    Скорее всего, это действительно прорыв.

       
     






» Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации. Зарегистрируйтесь на портале чтобы оставлять комментарии
 


Новости по дням
«    Декабрь 2024    »
ПнВтСрЧтПтСбВс
 1
2345678
9101112131415
16171819202122
23242526272829
3031 

Погода
Яндекс.Погода


Реклама

Опрос
Ваше мнение: Покуда территориально нужно денацифицировать Украину?




Реклама

Облако тегов
Акция: Пропаганда России, Америка настоящая, Арктика и Антарктика, Блокчейн и криптовалюты, Воспитание, Высшие ценности страны, Геополитика, Импортозамещение, ИнфоФронт, Кипр и кризис Европы, Кризис Белоруссии, Кризис Британии Brexit, Кризис Европы, Кризис США, Кризис Турции, Кризис Украины, Любимая Россия, НАТО, Навальный, Новости Украины, Оружие России, Остров Крым, Правильные ленты, Россия, Сделано в России, Ситуация в Сирии, Ситуация вокруг Ирана, Скажем НЕТ Ура-пЭтриотам, Скажем НЕТ хомячей рЭволюции, Служение России, Солнце, Трагедия Фукусимы Япония, Хроника эпидемии, видео, коронавирус, новости, политика, спецоперация, сша, украина

Показать все теги
Реклама

Популярные
статьи



Реклама одной строкой

    Главная страница  |  Регистрация  |  Сотрудничество  |  Статистика  |  Обратная связь  |  Реклама  |  Помощь порталу
    ©2003-2020 ОКО ПЛАНЕТЫ

    Материалы предназначены только для ознакомления и обсуждения. Все права на публикации принадлежат их авторам и первоисточникам.
    Администрация сайта может не разделять мнения авторов и не несет ответственность за авторские материалы и перепечатку с других сайтов. Ресурс может содержать материалы 16+


    Map