Федеральная служба безопасности (ФСБ) в лице одного из ее подразделений - войсковой части 68240 - объявила конкурс на создание "автоматизированного атласа национальных языков России". Силовикам нужно, чтобы введя в компьютер звукозапись, можно было определить язык, на котором говорит человек, пишет газета "Маркет".
Цель - создать методику и базу образцов для анализа записанных разговоров. Распознавание требуется продемонстрировать на примере шести языков Северного Кавказа: аварском, ингушском, кабардино-черкесском, карачаевском, балкарском и даргинском. Объект исследования - исключительно мужчины в возрасте от 20 до 60 лет, отмечает издание.
По словам специалистов, подобные задачи еще не научились решать без участия человека, но техника может значительно сэкономить время экспертам. На эту работу спецслужбы готовы выделить 24 млн рублей (стартовая цена конкурса).
Кроме этого, тем же подразделением проводится еще несколько конкурсов на научно-исследовательские работы в области анализа речи. Силовики хотят научиться определять по голосу эмоциональное состояние говорящего, обстановку, в которой он находится (размер комнаты, марку автомашины и т. п.). Анализ голосов популярен во всем мире
Органы госбезопасности СССР изучали идентификацию голоса еще в 1940-х. Это описано в романе Александра Солженицына "В круге первом". Как рассказала журналистам исполнительный директор Российского акустического общества Елена Юдина, сейчас в России данными проблемами занялись новые группы иссследователей - в коммерческих фирмах.
По словам менеджера по продуктам петербургской компании "Центр речевых технологий" Дмитрия Ивченко, компьютерный анализ речи необходим не только силовикам. В call-центрах используются системы, определяющие эмоциональное состояние оператора: если, по мнению компьютера, он грубо общается с клиентом, к разговору подключается руководитель. В некоторых компаниях анализ голоса используется для идентификации сотрудников.
Силовые структуры, по словам Ивченко, интересуются анализом речи во многих странах мира. Когда расследуется похищение людей или наркоторговля, бывает, что иных доказательств, кроме записи голоса, просто нет.
Определять пол человека по голосу компьютер научился с 99-процентным успехом, рассказывает Ивченко. Возраст, рост, вес и т. д. вычислять еще не научились - хотя есть экспериментальные разработки в этой области. Язык, на котором говорит человек, сегодня детектируют в полуавтоматическом режиме: ответ на вопрос дает эксперт, но компьютер сильно упрощает ему работу. Однако научить технику самостоятельно определять язык вполне возможно, считает менеджер. Источник: inline.ru.
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Чтобы писать комментарии Вам необходимо зарегистрироваться либо войти на сайт под своим именем.
» #1 написал: VP (11 августа 2010 17:09) Статус: |
Федеральная служба безопасности проводит конкурс на создание программного обеспечения, которое позволит идентифицировать кавказские языки при телефонных разговорах. В первую очередь заказчика интересует автоматическое распознавание «аварского, ингушского, кабардино-черкесского, карачаевского, балкарского и даргинского языков».
На сайте zakupki.gov.ruразмещен лот на «Создание автоматизированного атласа
На сайте zakupki.gov.ru размещен лот на «Создание автоматизированного атласа национальных языков РФ». Речь идет о создании системы, способной при автоматическом анализе телефонных разговоров идентифицировать язык, на котором ведется общение.
Техническое задание
Анализ документов, опубликованных в описании лота, дает представление о том, на что готов потратить заказчик 24 миллиона рублей. Речь идет о создании программного обеспечения, способного анализировать аудиозапись речи носителя языка и идентифицировать этот язык.
Программа должна работать в операционной системе «Windows XP и выше», содержать базу данных звуковых примеров, толковый словарь, инструкцию пользователя, обеспечивать возможность импорта/экспорта и пополнения данных.
В задании перечислены языки, которые должны отрабатываться программным комплексом: «аварский, ингушский, кабардино-черкесский, карачаевский, балкарский и даргинский» (названия языков процитированы из опубликованного документа).
База данных и звуковые примеры собираются на основе спонтанной речи и прочитанных вслух текстов так называемыми информантами-носителями, которыми должны являться только мужчины от 20 до 60 лет, с образованием не ниже среднего.
Заказчик хочет получить 20 дисков с программным обеспечением с возможностью инсталляции софта на неограниченное количество компьютеров. Инсталляционные комплекты не должны иметь ограничений срока действия, при этом срок гарантийного обслуживания составит три года.
Заказчик и исполнители
В описании лота указан заказчик – войсковая часть 68240, а также имена, телефоны и электронные адреса контактных лиц. Несложный анализ этих данных с применением популярных поисковых сервисов позволяет идентифицировать заказчика как одно из подразделений ФСБ РФ.
Войсковая часть 68240 известна также заказами на разработку программы автоматического распознавания тревожных ситуаций по индивидуальным особенностям поведения и внешнего облика человека за 15 миллионов рублей; на разработку носителей данных для архивного хранения за 45 миллионов рублей; на монокуляр ночного видения за 2 миллиона.
Не останутся без внимания ФСБ и носители русского языка. Та же войсковая часть разместила заказ на «Создание автоматизированного атласа современного русского языка» стоимостью 24 миллиона рублей, а также на «Создание автоматизированного справочника дефектных особенностей в русской речи» за 12 миллионов рублей.
Заявки на участие в конкурсе представили Московский государственный лингвистический университет, ООО «Центр речевых технологий» из Санкт-Петербурга и ростовское НИИ «Спецвузавтоматика».
Материалы предназначены только для ознакомления и обсуждения. Все права на публикации принадлежат их авторам и первоисточникам. Администрация сайта может не разделять мнения авторов и не несет ответственность за авторские материалы и перепечатку с других сайтов. Ресурс может содержать материалы 16+
Статус: |
Группа: Гости
публикаций 0
комментариев 0
Рейтинг поста:
текст: Андрей Сидельников /Infox.ru
Федеральная служба безопасности проводит конкурс на создание программного обеспечения, которое позволит идентифицировать кавказские языки при телефонных разговорах. В первую очередь заказчика интересует автоматическое распознавание «аварского, ингушского, кабардино-черкесского, карачаевского, балкарского и даргинского языков».
На сайте zakupki.gov.ruразмещен лот на «Создание автоматизированного атласа
На сайте zakupki.gov.ru размещен лот на «Создание автоматизированного атласа национальных языков РФ». Речь идет о создании системы, способной при автоматическом анализе телефонных разговоров идентифицировать язык, на котором ведется общение.
Техническое задание
Анализ документов, опубликованных в описании лота, дает представление о том, на что готов потратить заказчик 24 миллиона рублей. Речь идет о создании программного обеспечения, способного анализировать аудиозапись речи носителя языка и идентифицировать этот язык.
Программа должна работать в операционной системе «Windows XP и выше», содержать базу данных звуковых примеров, толковый словарь, инструкцию пользователя, обеспечивать возможность импорта/экспорта и пополнения данных.
В задании перечислены языки, которые должны отрабатываться программным комплексом: «аварский, ингушский, кабардино-черкесский, карачаевский, балкарский и даргинский» (названия языков процитированы из опубликованного документа).
База данных и звуковые примеры собираются на основе спонтанной речи и прочитанных вслух текстов так называемыми информантами-носителями, которыми должны являться только мужчины от 20 до 60 лет, с образованием не ниже среднего.
Заказчик хочет получить 20 дисков с программным обеспечением с возможностью инсталляции софта на неограниченное количество компьютеров. Инсталляционные комплекты не должны иметь ограничений срока действия, при этом срок гарантийного обслуживания составит три года.
Заказчик и исполнители
В описании лота указан заказчик – войсковая часть 68240, а также имена, телефоны и электронные адреса контактных лиц. Несложный анализ этих данных с применением популярных поисковых сервисов позволяет идентифицировать заказчика как одно из подразделений ФСБ РФ.
Войсковая часть 68240 известна также заказами на разработку программы автоматического распознавания тревожных ситуаций по индивидуальным особенностям поведения и внешнего облика человека за 15 миллионов рублей; на разработку носителей данных для архивного хранения за 45 миллионов рублей; на монокуляр ночного видения за 2 миллиона.
Не останутся без внимания ФСБ и носители русского языка. Та же войсковая часть разместила заказ на «Создание автоматизированного атласа современного русского языка» стоимостью 24 миллиона рублей, а также на «Создание автоматизированного справочника дефектных особенностей в русской речи» за 12 миллионов рублей.
Заявки на участие в конкурсе представили Московский государственный лингвистический университет, ООО «Центр речевых технологий» из Санкт-Петербурга и ростовское НИИ «Спецвузавтоматика».
© ООО "Инфокс-Интерактив" 2008-2010 г.