ЦРУ представила технологии "извлечения данных"...

        Отдел современных информационных технологий, входящий в состав управления науки и техники Центрального разведывательного управления США, продемонстрировал общественности технологии "извлечения данных" ("data mining"), используемые для поиска значимой информации среди огромного количества страниц документов и в радио- и телепередачах на различных языках, сообщила Yahoo! News.
        Поиск ведется как по систематизированным, так и по случайным источникам, причем объектами поиска являются тексты в печатных изданиях и в цифровом виде, графические изображения, аудиоинформация на 35-ти языках. Для отсеивания аудиоинформации используется методика "Oasis", которая распознает речь и превращает ее в текст. При этом технология позволяет отделять мужские голоса от женских, а также голоса, принадлежащие разным людям, и записывать их в виде диалогов.
        Методика "Oasis" позволяет выделять из аудиопотока только те голоса или ту конкретную информацию, которая заложена в настройках поиска. Пока существует только англоязычная версия "Oasis", но ЦРУ планирует вскоре создать версии на китайском, арабском и других языках, а также усовершенствовать программу, чтобы она смогла распознавать не только отдельные слова, но и их синонимы и синонимические словосочетания.
        Другая компьютерная технология под названием "FLUENT" позволяет искать информацию в текстовых документах. Эта технология подразумевает поиск по ключевым словам, причем вводится слово или сочетание на английском языке, которое тут же переводится на целый ряд других языков, и найденная информация из базы данных на разных языках поступает исследователю после автоматического перевода.
        FLUENT может переводить на английский с китайского, корейского, португальского, русского, сербско-хорватского, украинского и других языков.
        Еще одна программа, Text Data Mining, позволяет автоматически создавать предметные указатели для текстовых документов, а также получать данные по частоте употребления тех или иных слов в документах.
        Все эти технологии ЦРУ уже использует в отслеживании незаконных финансовых операций и наркотрафика.

Новости партнеров

Выбор читателей