Искусственный интеллект под Android с открытым API / Хабр

Приложения на основе ии для андроид

Предлагаем посмотреть ТОП-5 интересных приложений для Андроид, которые используют ИИ:

  1. JAESA. Это электронная женщина в вашем смартфоне за небольшие деньги. Она умеет: размышлять, выслушивать, давать советы, оказывать помощь при работе со смартфоном, а также самообучаться. Помимо этого, она способна делать простые вещи: отслеживать календарь, контролировать подключение по WiFi или Bluetooth, переводить текст на нужный язык и др.

  2. Moments. Тем, кто любит делать по паре сотен фото в день, а потом выбирать, какие из них лучшие, эта программа очень пригодится. Она способна выбрать лучшие фотографии из всех сделанных, также она может отослать их вашим друзьям или опубликовать в Фейсбуке. Помимо этого, она способна распознавать лица на фото. К примеру, вы можете задать фото знакомого человека, а программа отберет все фото, где изображен этот человек.

  3. Picai. Программа с ИИ для Андроид-камеры. Она способна распознать объекты и легко различает происходящую сцену, поэтому может предложить лучшие из возможных настроек съемки.

  4. Musixmatch. Если вы любите слушать музыку и заучивать песни, то это приложение может вам помочь. Это плеер, который способен найти тексты к песням, которые он проигрывает. Если нужно, то он переведет вам текст песни с иностранного языка. Людям, которые играли в казино со смартфона или планшета через браузер, использование отдельного приложения способно существенно облегчить жизнь. Поэтому, если не хочешь расставаться со своим любимым гаджетом, и иметь доступ с любого устройства, переходи в онлайн казино пин ап и наслаждайся круглосуточным доступом к лучшим игровым слотам и оперативным выводом денег. В казино Пин Ап существуют определенные лимиты на денежные выплаты, ознакомиться с ними можно в тематическом разделе.

  5. AMdroid. Отследите свой сон. Это «умный» будильник, который не только точно вас разбудит, но и подскажет, что вам пора ложиться спать, чтобы вы успели выспаться.

Читайте про операторов:  Mobile communication modem MMC-04 (communicator KMD-1) - buy in bulk on Qoovee Market

Что в итоге?

Не стоит сомневаться по поводу заявленных возможностей искусственного интеллекта и нейронных сетей в процессорах нового поколения. Они действительно сделают наши смартфоны умнее, но о настоящем искусственном интеллекте внутри мобильного устройства речи не идет.

Искусственный интеллект, ИИ

Например, Huawei уже рекламирует свой следующий флагман Mate 10 не как смартфон, а как «интеллектуальную машину». Без злых шуток в сторону Apple с ее A11 Bionic не обошлось, но что значит это словосочетание? На деле Mate 10 окажется таким же iPhone 8 — флагманским смартфоном с процессором, умеющим работать с искусственным интеллектом. Huawei переигрывает.

А что думают читатели Pixel Story о процессорах на базе ИИ? Выведут ли они производительность и эффективность современных смартфонов на новый уровень? Пишите в комментариях!

Что умеет api

За счет API “Ассистента на русском” можно создавать и гораздо более интересные варианты, где функциональность ассистента выходит за пределы устройства, на котором он работает. Например, стороннее приложение “

АссистентКоннект

”, используя API нашего ассистента, дает возможность управлять голосом различными устройствами “умного” дома и домашним кинотеатром.

Так что же такое искусственный интеллект?

Для начала нужно определиться, какие системы можно называть интеллектуальными и чем они отличаются от обычной компьютерной программы.

Обычная программа представляет собой неизменяемый набор инструкций, единожды записанных человеком. Т. е. человек придумал алгоритм и объяснил его машине. Но может ли сама машина понять или придумать, что нужно делать для решения какой-то конкретной задачи?

Именно таким вопросом задались люди в 1940-х годах и с тех пор перепробовали множество разных методов, основной целью которых является научить машину мыслить, как человек, хотя бы для решения одной конкретной задачи. То есть искусственный интеллект — это способность машины решать некоторые задачи так, как это делал бы размышляющий над их решением человек.

Одним из логичных подходов в решении этой задачи является попытка скопировать мыслительную деятельность человека. Например, мы привыкли, что видеть и распознавать предметы — это легко. Наш мозг справляется с этим без особых усилий, потому что однажды этому научился.

В 1966 году группа ученых и студентов Массачусетского технологического института решила летом не ехать на каникулы, а остаться в кампусе и математически решить задачу распознавания объекта на картинке. Т. е. решить одну из задач компьютерного зрения — научить машину по картинке определять, что на ней изображено.

Студенты назвали свою работу The summer vision project, подразумевая, что это настолько простая задача, что ее можно решить всего за одно лето. Сейчас, спустя более чем 50 лет, мы знаем, что это сложная задача, в решении которой ученые-исследователи и технические гиганты все еще соревнуются.

Если самые яркие фантастические книги об ИИ были написаны в 50-х, а компьютер вошел в повседневность еще в 90-х, то почему прорыв применительно к системам искусственного интеллекта мы наблюдаем только сейчас, в последние 5–10 лет?

Благодаря исследованиям нейробиологов сейчас у нас есть некоторое представление о том, как устроен человеческий мозг. Это огромный набор мозговых клеток — нейронов, каждый из которых выполняет одну очень простую функцию — получает сигнал от других нейронов, и при определенных условиях комбинации этих сигналов происходит так называемая активация нейрона и он выпускает сигнал дальше.

Несмотря на всю простоту работы одного нейрона, их совокупность (а их количество в нашем мозгу исчисляется миллиардами) позволяет нам занимать место самых умных существ на этой планете, или хотя бы считать себя таковыми. Когда мы чему-то учимся, будь то ходить, кататься на лыжах, говорить или считать, нейроны головного мозга изменяют свою функцию активации, т. е. условия, при которых они пропускают сигнал дальше.

Но вот вопрос: если люди занимаются этими задачами с 40-х годов прошлого века, самые яркие фантастические книги об ИИ были написаны в 50-х, а компьютер вошел в повседневность еще в 90-х, то почему прорыв применительно к системам искусственного интеллекта мы наблюдаем только сейчас, в последние 5–10 лет? Для ответа на этот вопрос нужно посмотреть на историю.

Основы

Для внедрения библиотеки с API ассистента в свое приложение вам не понадобится изучать никаких новых языков программирования или технологий. Все, что вам нужно — это

и IDE для разработки. Мы предлагаем использовать

. Подключение библиотек осуществляется просто указанием зависимостей в файле

build.gradle

4 этапа в процессе разработки

  • Сбор и разметка данных – один из главных компонентов машинного обучения. От размера обучающей выборки и качества её разметки зависит то, что выучат наши модели.

    При разметке данных можно использовать такие инструменты, как Яндекс.Толока. На ресурсе можно поручить разметку сторонним людям. Это актуально при работе с данными, где для разметки не требуется знаний в узкой предметной области.

  • Выбор подходящей модели и её обучение. Выбор архитектуры модели зависит от того, будет ли она запускаться непосредственно на телефоне или на серверной стороне.

    Для мобильных платформ существуют такие специально адаптированные семейства моделей, как MobileNet, для работы с изображениями.

    Для уменьшения размера файла с весами модели, уменьшения самого приложения и ускорения его работы могут применяться различные варианты прунинга (урезания параметров) и квантизации весов.

    Для записи на телефон речи / видео / изображения и их распознавания на сервере можно использовать готовые решения от производителей фреймворков TensorFlow Serving, TorchServe, и производителей видеокарт Nvidia-Triton.

  • Разработка алгоритмов обработки предсказаний моделей. Для таких задач, как трекинг объектов / распознавание жестов, кроме самих моделей необходимо реализовать алгоритмы для постобработки данных. Алгоритмы необходимо самостоятельно реализовывать на одном из языков программирования (желательно чтобы это был кроссплатформенный язык как C или kotlin) или же можно взять готовое решение из MLKit или MediaPipe.
  • Отслеживание работы моделей и создание обратной связи с пользователем. Для того, чтобы понять, насколько хорошо ваши модели справляются с задачами, кроме изучения аналитики приложения необходимо дать пользователю возможность указывать на ошибки срабатывания моделей (неправильно понятая фраза, некорректно распознанное изображение и т.д.). И на основе собранных ошибок заново запустить процесс обучения.

Cortana – голосовой ассистент с ии

Cortana — известное приложение среди всех пользователей Windows. Приложение, которое ранее было доступно на Windows Phone, теперь доступно на Android. Вы можете использовать Cortana для отправки электронных писем, поиска нужных продуктов в Интернете.

Google allo

Google Allo — это приложение для смарт-сообщений, которое помогает вам больше говорить и делать больше. Лучшая часть этого приложения — это легко поможет вам в решении ваших задач. Это приложение не только отвечает на ваши запросы, оно может даже шутить.

Hound – голосовой поиск и помощник

Hound — лучший способ поиска по вашему голосу. Самый быстрый и простой способ получить информацию, развлечения и услуги связи, которые вы хотите, Hound построен для вашей занятой жизни, позволяя вам получить то, что вам нужно, и двигаться дальше. Это приложение похоже на голосовой поиск Google.

Recent news

Recent — это приложение для смарт-новостей, которое предоставляет ваши новости. Оно основано на искусственном интеллекте, который изучает ваши интересы, предлагает соответствующие статьи и предлагает темы, которые вы, возможно, захотите прочитать. Это быстрый и лучший способ оставаться в курсе тем, которые вы любите.

Как мы уже говорили, искусственный интеллект — это умный и эффективный способ сэкономить ваше драгоценное время и поможет вам быть продуктивным на всем пути. Эти приложения помогут вам изучить потенциал искусственного интеллекта.

Так что ты думаешь об этом? Поделитесь своими взглядами в поле комментариев ниже.

Robin – голосовой помощник с ии

Робин — ваш голосовой помощник на дороге, прочитает вам текстовые сообщения, местную информацию, навигацию по GPS и даже шутки. Кроме того, у нее больше индивидуальности, чем у других продуктов для обработки голоса, помощников, чатов или ботов. Робин дает вашему смартфону более умный характер.

Агенты и модули


Ассистент заранее извлечет все необходимые данные из текста фразы и предоставит их агенту в виде семантического дерева разбора — Токена. Это происходит благодаря специальным грамматикам (Модулям), которые вам нужно сформировать для вашего сервиса.

Модуль — это набор команд с шаблонами (Паттернами) фраз, на которые должен реагировать ваш агент (синтаксис паттернов детально описан в документации к API). Агент в любой момент может ограничить набор таких модулей, доступных пользователю, тем самым сформировав контекст диалога. Вот пример простейшего модуля:

Ассистент на русском

Искусственный интеллект под Android с открытым API / Хабр

Наша небольшая группа инициативных разработчиков взялась за проект, известный ныне как

Стоит заметить, что создание подобной голосовой платформы предполагает наличие знаний в таких специализированных областях как технологии распознавания (ASR) и синтеза речи (TTS), а также NLP, позволяющего извлекать смысл из пользовательской речи и управлять контекстом диалога.

Именно этот компонент является связующим для любой системы искусственного интеллекта и позволяет не просто превратить речь в текст, но и понять, чего хочет пользователь. Это и отличает технологию распознавания речи от технологии искусственного интеллекта.

Нашей целью было сделать доступный инструмент для использования этих технологий.

К моменту запуска приложение умело решать повседневные задачи пользователя с помощью речи. А пользователи Android версии JellyBean могли выполнять голосовые команды без подключения к интернету.

Ассистент-диагност

В компанию МТС входит сеть клиник и медицинских центров Медси. Подразделение «Искусственный интеллект» строит для сети симптом-чекер, который является разговорным интерфейсом и будет помогать в работе с клиентами. «Это пока преддиагностический диалоговый робот, который собирает предварительные данные о пациенте, делает предположение, с каким врачом этого человека надо связать.

Аналогичным образом делается фармацевтический справочник, который будет помогать подбирать препараты. «Мы движемся к некоему комплексному медицинскому ассистенту, который про вас все знает, помогает вам с вашим здоровьем, тренировками, питанием, врачами, покупками в аптеке», – говорит Аркадий Сандлер.

Возвращение нейронных сетей

Так почему же нейронные сети вернулись, да еще с таким успехом? И почему именно сейчас наступил их рассвет? Как люди решили все описанные выше проблемы и научились обучать глубокие сети?

Основу для возвращения нейронных сетей заложил в 2006 году все тот же Джеффри Хинтон. Он изучил методы математической статистики, используемые в теоретической физике, и применил их к нейронным сетям. Раз уж нам не удается обучать глубокие сети, распространяя ошибку с конца в начало сети, решил он, то давайте обучаться от начала к концу.

Необходимость использования больших объемов данных приводит к тому, что под каждую задачу нужно искать индивидуальное решение. Чаще всего используют «краудсорсинг» — привлечение большого числа наемных работников для разметки имеющихся данных и формирования большой базы обучающих примеров.

Для того чтобы первые слои обучались при обратном распространении ошибки, были придуманы новые функции активации нейронов, благодаря которым влияние ошибки не затухает. А еще чуть позже придумали ResNet — архитектуру сетей, при которой каждый N-й слой связан не только с последующим слоем, но и с окончательной ошибкой напрямую.

В 2022 году Хинтон и его студенты придумали метод, который напоминает работу мозга во время похмелья

Время шло, а api у siri не появлялось

Искусственный интеллект под Android с открытым API / Хабр

Надо отметить, что большинство путает просто

распознавание речи

и собственно возможности ассистента как

искусственного интеллекта

. Между этими двумя понятиями огромная разница — решения по распознаванию речи (speech-to-text) присутствуют на рынке уже давно (к примеру, в ОС Android она доступна всем желающим), а вот создать открытую технологию диалоговой системы (с поддержанием контекста, извлечением смысла и т.д.) не удавалось еще никому.

Идея создать голосового ассистента с открытым и доступным для всех API “искусственного интеллекта” уже витала на тот момент в наших головах, и мы решили ее осуществить.

Вызовы для ии

Эксперты заметили, что искусственному интеллекту еще далеко до самостоятельной генерации алгоритмов, его все еще обучает человек. И для улучшения качества работы системы требуется постоянно расширять алгоритмы. Одно из самых больших несовершенств работы ИИ, например, в социальных сетях – это «информационный пузырь».

Елизавета Шляпникова, Ольга Александрова

#искусственный интеллект, #нейросеть, #специальность, #кадры

Дизайнер и защитник от спама

Оказывается, виртуальные подарочки в соцсетях уже давно рисуют роботы. По словам представителя «Одноклассников»,нейросеть может сгенерить индивидуальный подарок со скоростью 0,025 секунды. «Пользователи их даже покупают и дарят», – хвастает Александр.

Также ИИ хорошо распознает нежелательный контент, спам-контент, может легко понять, что ваш аккаунт взломали, или вычислить бота, маскирующегося под аккаунтом человека.

Зачем в мобильные процессоры вставляют нейронные сети

Виртуальные голосовые ассистенты стали прорывной технологией в мире программного обеспечения. В их основу легли искусственный интеллект, нейронные сети и различные алгоритмы глубокого обучения, позволяющие помощникам самостоятельно обучаться. Теперь искусственный интеллект пришел в процессоры и начинает развиваться на аппаратном уровне. Это выглядит намного более впечатляюще, чем вы можете себе представить.

Компания Apple представила в этом году свой новый флагманский процессор для мобильных устройств — Apple A11 Bionic со встроенной нейронной системой, предназначенной для отдельной работы с искусственным интеллектом.

Технологический гигант Huawei стал первым среди конкурентов после Apple, кто показал аналогичную разработку — Kirin 970 может похвастаться специальным процессором нейронной обработки. По слухам, Samsung тоже ведет работу над подобным чипом. Ожидается, что таким будет следующий флагман линейки Exynos и, возможно, он дебютирует в Galaxy S9.

Другие известные производители, включая Intel, NVIDIA и прочих также работают над процессорами, поддерживающими работу с искусственным интеллектом. Искусственный интеллект быстро набирает популярность и все больше проникает в привычные для нас технологии, выводя их функциональность на новый уровень и в то же время упрощая работу с ними.

Но, как это обычно бывает, производители смартфонов используют различные маркетинговые уловки, чтобы выставить себя в лучшем свете. Сегодня мы разберемся, существует ли искусственный интеллект в мобильных чипах на самом деле и как это работает в действительности.

Ии в действии

Технологии ИИ будут широко использоваться для анализа выбора клиента, автоматизации, оптимизации использования ресурсов, генерации автоматических ответов на запросы и повышения коэффициента конверсии. На основе возможностей AI, ML, NLP пользователи получают персонализированный опыт.

С помощью алгоритмов анализа больших данных (Big Data) специалисты используют статистику для дальнейшего прогнозирования. Amazon Pinpoint – сервис многоканальных маркетинговых коммуникаций и мобильной аналитики работает на алгоритмах Big Data.

ИИ в разработке мобильных приложений для розничной торговли помогает анализировать покупательское поведение и увеличивать продажи за счет предоставления соответствующих рекомендаций по продуктам.

Технологии играют важную роль в процессе персонализации. Наиболее яркий пример приложения, обеспечивающего индивидуальный подход к пользователю с помощью ИИ – My Starbucks. Пользователи могут заказать напиток на ходу. Чат-бот составляет рекомендации на основе предпочтений клиента.

ИИ применяется и в спортивных проектах. Например, в Японии к Олимпийским играм создали систему визуализации фехтования. С разработкой стало возможным отследить движения меча и воссоздать его траекторию с помощью дополненной реальности.

В теннисе есть проект OSAI – он предназначен для организации прямых трансляций и работает на технологии смешанной или гибридной реальности. Болельщикам OSAI позволяет обеспечить большую вовлеченность, а судьям – принимать правильные решения на основе точных оцифрованных данных.

Подобные решения требуют специального оборудования: камер, лидаров и других технологических устройств. Они недоступны для новичков и спортсменов любителей, в то время как в процессе обучения очень важно отслеживать прогресс и анализировать ошибки.

Для оцифровки и анализа шахматных партий создано мобильное приложение idChess. С помощью технологий машинного обучения и нейронных сетей idChess распознает действия на игровой доске из видеопотока и переводит их в 2D графику. idChess позволяет сохранять и делиться играми в мессенджерах, а также транслировать партии в режиме реального времени на цифровых носителях.

Как получить api

Попробовать API в своих собственных проектах можно уже сейчас, скачав его с

. Сейчас мы даем только краткое описание того, как можно его использовать. В следующих статьях мы более детально опишем технические подробности реализации всей платформы “Ассистента на русском”, а также расскажем о нюансах использования самого API.

Данная статья — самый первый шаг по публикации API ассистента. В ближайшем будущем многое будет меняться, мы планируем предоставить больше возможностей, в том числе каталог дополнений, с помощью которого пользователь сможет находить в PlayStore все приложения с поддержкой функции голосового управления, а также коммерческое SDK для создания собственных голосовых ассистентов.

Консультант

Еще роботу под силу подбирать персональный видео-контент для каждого пользователя на основании его предпочтений, того, что он смотрел ранее, как с ним взаимодействовал. Теперь ему поставили задачу – не только угадать с предпочтениями, но и повысить время смотрения.

Кроме видео нейросеть способна рекомендовать интересное именно вам чтиво для расширения кругозора, и даже предлагать новых друзей, но не рандомно, как может показаться, а с умыслом. «Анализируются тысячи факторов: как вы с этими людьми взаимодействовали, комментировали ли вы их фотографии, есть ли у вас общие интересы, и так далее», – поясняет Тоболь.

Аркадий Сандлер, руководитель подразделения “Искусственный интеллект” в МТС, проиллюстрировал эффективность еще одного вида консультирования с помощью ИИ – речь о чат-боте в колл-центре:

  • С 55 секунд до 2 секунд сократилась длительность ожидания клиентом начала разговора,
  • С 8 до 2 минут сократилась длительность разговора, окончившегося успешным решением проблемы.

Все большую популярность набирает использование чат-ботов в продажах и в подборе персонала. А также в самых разнообразных сферах, где уместно применение разговорных интерфейсов.

«Поэтому мы активно работаем над совершенствованием использования ИИ в анализе данных, в помощи рекрутерам в работе с воронкой, в построении предиктивного анализа. Все это помогает нам предсказать, как долго человек проработает в компании, что именно его мотивирует.

Нейронные сети — новые типы вычислений (npu)

Возможно, самый большой вопрос, на который предстоит ответить: почему компании внезапно внедрили искусственный интеллект в АО? В чем заключается работа ИИ в процессоре? Почему именно сейчас?

Наверняка вы заметили, что в этом году популярность нейронных сетей, машинного обучения и гетерогенных вычислений значительно возросла. О них говорят везде и всюду, как о будущем мира технологий.

Все это связано с развитием вариантов использования NPU для пользователей смартфонов. Для них эти технологии помогают расширять уже известные возможности. Обработка аудио, изображений и голоса, прогнозирование человеческой деятельности, обработка языков, ускорение результатов поиска, расширенное шифрование данных — и это еще неполный список того, в чем сегодня задействованы системы ИИ.

Это новый уровень вычислений, требующий больше мощности. Большинство современных 64-битных процессоров не особенно хорошо справляется с искусственным интеллектом. 8- и 16-битная математика с плавающей запятой, сопоставление шаблонов, поиск базы данных, манипуляции с битовыми полями и высокопараллельная обработка — вот лишь некоторые примеры, которые работают быстрее на специализированном оборудовании, чем на ЦПУ общего назначения.

Чтобы учесть рост вычислений и новых вариантов использования, имеет смысл разработать процессор нового типа, который лучше подходит для таких задач. Именно поэтому ИИ теперь внедряется в мобильные чипы для смартфонов. Он даст разработчикам базовый уровень для программного обеспечения нового поколения.

Нейросети в вашем смартфоне

А теперь взгляните на свой смартфон. Сколько раз в день вы используете алгоритмы на основе нейросетей, не подозревая об этом? Смартфон распознает вашу речь, когда вы общаетесь с голосовым помощником или называете конечную точку маршрута. Он использует методы отделения полезного сигнала от шума при записи звука. Распознает лица или выравнивает баланс цветов на фотографии.

Использовать нейросети в смартфонах можно одним из двух способов. Первый способ: получить исходную информацию (фотографию или звуковую дорожку), отправить ее на удаленный сервер (как говорится, в облако), там обработать и затем загрузить ответ обратно в смартфон.

Этот способ имеет ряд минусов. Во-первых, нужно иметь стабильное соединение с интернетом достаточно высокой скорости. Во-вторых, постоянная пересылка фотографий на сервер не очень нравится людям с точки зрения приватности. Поэтому более предпочтительным является второй способ — использование нейросетей непосредственно на самом смартфоне, без пересылки информации через интернет.

Однако реализация этого влечет за собой другие трудности: необходимо где-то взять дополнительные ресурсы для проведения расчетов; большое количество вычислений (пусть даже параллельных) потребляет много энергии, и это тоже не очень нравится пользователям.

Смартфон наконец начинает оправдывать слово «смарт» в своем названии, получив процессор, ускоряющий решение задач искусственного интеллекта

Именно поэтому производители смартфонов в настоящее время разрабатывают и внедряют специальный вид процессоров — NPU (neural processing unit), которые также называют ускорителями искусственного интеллекта (AI accelerator). Они призваны увеличить производительность выполнения параллельных вычислений аналогично GPU и потреблять меньше энергии. Эти процессоры наряду с GPU и обычными CPU устанавливаются на одном и том же чипе внутри смартфона.

К примеру, одним из первых чипов с внедренным ускорителем искусственного интеллекта является процессор Kirin 970 производства компании Huawei, который был представлен в сентябре 2022 года. Сейчас такой процессор установлен в новом смартфоне Honor View 10, поступившем в продажу в России в феврале 2022 года. Производитель заявляет, что уже сейчас этот чип выполняет ряд функций, что называется, «на борту»:

  1. Распознавание сцены при съемке фотографии, которая адаптирует параметры камеры к объекту на переднем плане.
  2. Анализ действий пользователя и адаптация к тому, как он использует смартфон, с целью минимизации энергозатрат.
  3. Машинный перевод, выполняемый предустановленной программой от Microsoft, использует neural processing unit для своей нейросети.
  4. Специальная нейронная сеть для подавления шума в записываемых звуковых сигналах.

Итого, что мы имеем? Смартфон наконец начинает оправдывать слово «смарт» в своем названии, получив процессор, ускоряющий решение задач искусственного интеллекта. Уже сейчас он напичкан множеством алгоритмов, которые решают сложные технические задачи иногда даже лучше, чем если бы их решал человек.

При этом одной из таких задач является анализ действий владельца. Кажется, что еще чуть-чуть — и ваш смартфон будет знать о вас больше, чем родная мать. Будущее уже тут. И если вы думаете, что восстание машин начнется, когда skyNet объявит охоту на Джона Коннора, то вы ошибаетесь. Оно уже началось. И оно, быть может, уже сейчас в вашем кармане под видом привычного гаджета.

Открытое api искусственного интеллекта


С первого дня каждый сервис “Ассистента на русском” создавался на основе той же платформы, которую мы планировали открывать для всех в будущем. Этот принцип по-английски называется “

”. Таким образом мы могли параллельно проектировать голосовую архитектуру и функциональность самого ассистента.

Результатом нашей работы стало приложение с открытым API и “гибридной” технологией NLP, которая, с одной стороны, дает возможность программировать голосовой интерфейс без всяких серверов, с использованием только вашего девайса и Android SDK, а с другой стороны, переносить часть решений в облако по необходимости.

Все сервисы ассистента создавались разными программистами, часть которых не имеют специальных знаний в области ASR, TTS или NLP. При этом особых сложностей в использовании API нашего “Ассистента” не было, так как мы ставили себе задачу сделать открытую, доступную и понятную всем платформу.

“Ассистент на русском” использует возможность межпроцессного взаимодействия (IPC) в ОС Android, так что сам ассистент выступает в роли голосового интерфейса между пользователем и вашим собственным приложением. При этом ваше приложение может отображать свой GUI в интерфейсе ассистента — для этого используются RemoteViews и другие похожие техники.

Перцептрон и две зимы искусственного интеллекта

Первой попыткой смоделировать деятельность мозгового нейрона был предложенный в 1943 году искусственный нейрон Маккалока — Питтса — математическая модель естественного, т. е. человеческого нейрона. Так же как в реальном нейроне, в искусственный нейрон поступает сигнал (число 0 или 1), и после простых вычислений нейрон так же выпускает сигнал (0 или 1).

Сеть из таких нейронов могла решать простейшие логические задачи — так было положено начало методу нейронных сетей. Правда, для сети нейронов Маккалока — Питтса еще не было придумано методов ее обучения, и поэтому все внутренние вычисления в каждом нейроне вручную настраивались человеком.

Первая модель нейрона, которая имела свой метод обучения на множестве входных данных и желаемых результатах, был так называемый перцептрон, описанный Фрэнком Розенблаттом в 1958 году.

Обе эти модели нейрона в качестве функции активации использовали самую простую — линейную функцию. Это сильно ограничивало их способности в решении сложных задач.

Метод, придуманный Хинтоном и Румельхартом, заключается в том, чтобы сравнить полученный ответ с желаемым, понять, насколько мы ошиблись, а затем последовательно, в обратном порядке пройти по слоям и переобучить нейроны

В 1969 году в свет вышла работа Минского и Пейперта, в которой математически было доказано, что увеличение размеров сети, состоящей из перцептронов, не ведет к улучшению ее способностей, т. е. не увеличивает ее интеллект. Несмотря на то что этот вывод касался только конкретной модели нейрона — перцептрона, это сильно повлияло на интерес научного сообщества к нейронным сетям в целом.

Конец первой зиме искусственного интеллекта пришел, когда группа канадских ученых (среди которых были Дэвид Румельхарт и, как сейчас говорят, дедушка нейронных сетей Джеффри Хинтон) в 1986 году придумала универсальный метод обучения нейронных сетей для любых, даже самых сложных функций активации нейронов.

Если представить нейронную сеть как последовательность слоев из нейронов, то поступающий сигнал (например, картинка или звуковой файл с речью человека, если мы говорим о распознавании) проходит сквозь слои нейронов один за другим, и на последнем слое мы получаем ответ (текстовое описание того, что изображено на картинке, или текст, который был сказан человеком).

Метод, придуманный Хинтоном и Румельхартом, заключается в том, чтобы сравнить полученный ответ с желаемым, понять, насколько мы ошиблись, а затем последовательно, в обратном порядке пройти по слоям и переобучить нейроны, чтобы они лучше работали на выбранном примере картинки/звука.

Полученный метод обучения сетей позволил создавать многослойные сети со сложными нелинейными зависимостями. Теперь, казалось бы, дело за малым — нужно использовать как можно больше нейронов с нелинейной функцией активации и как можно больше слоев, и тогда компьютер сможет обучиться чему угодно. Но оказалось, что не все так просто.

При обратном распространении ошибки хорошо обучались последние слои, а первым почти ничего не доставалось, т. к. влияние ошибки затухало по мере распространения назад

Во-первых, стало очевидно, что для того, чтобы качественно обучать сети с большим количеством нейронов, необходимо большое количество обучающих примеров.  Во-вторых, для глубоких сетей (т. е. состоящих из большого количества слоев) обучение переставало быть таким эффективным, а именно: при обратном распространении ошибки хорошо обучались последние слои, а первым почти ничего не доставалось, т. к. влияние ошибки затухало по мере распространения назад.

В-третьих, большое число нейронов означает большое число параметров, и велика вероятность переобучения: имея так много степеней свободы, сеть идеально подстраивается под обучающие примеры, но начинает сходить с ума и показывать ерунду на новых задачах.

Продолжение следует

В этом посте мы очень кратко привели основы использования нашего API, описав базовые принципы работы с ним. Конечно, библиотека ассистента предоставляет множество более сложных функций: удаленные и нечеткие паттерны, RemoteViews, динамическое изменение контента ответа, извлечение данных из фраз и многое другое. Все это описано в

, которую мы будем дополнять по ходу доработок в самой библиотеке.

Мы предлагаем вам попробовать голосовое управление в ваших собственных проектах, вступить в сообщество разработчиков и помочь в улучшении этого инструмента.

Психолог в маркетинге

Игорь Волжанин, основатель DataSine рассказал, что для определения характеристик личности алгоритмы, разработанные в его компании, используют технологический фреймворк, который типирует человека по пяти параметрам. «Каждый из нас — это набор из пяти чисел (вы можете быть интровертом, экстравертом или где-то посередине, но все равно будет фактор, который немного доминирует).

Собрав пять факторов, мы можем сказать, кто человек. Например, я: экстраверт, довольно добросовестный, но люблю иногда посоревноваться с другими. Это уже о чем-то говорит, мы уже можем предположить, что я люблю, что мне нравится. Психология позволяет строить портрет человека гораздо точнее, чем сегментирование», – говорит Игорь Волжанин.

Что делает робот, чтобы разгадать характер человека? Он по-прежнему собирает и анализирует данные текстов из картинок, которые использует человек в Сети, в своих письмах. Умудряется понять, как человек относится к чужому контенту, и на основе этого всего делает выводы об основных предпочтениях аудитории. Зачем это нужно и где можно использовать?

«Мы работали с банком, меняя в его почтовых рассылках тексты и оформление (картинки, количество смайлов, цвета). Переделывали лэндинги и посты в социальных сетях под предпочтения аудитории, которые мы выявили при помощи наших алгоритмов.

Мы увеличили количество подписавшихся клиентов на 80%. Также мы давали рекомендации французскому колл-центру о том, как общаться с разными типами клиентов, меняли скрипт под разные типы клиентов. Меняли, например, первые 30 секунд разговора (кому-то говорили “здравствуйте!”, а кому-то “привет!”).

Роботы вокруг нас

Сейчас уже можно с уверенностью сказать, что роботы и машины, использующие технологию нейронных сетей, широко внедряются в повседневную жизнь человека. В Японии, например, роботов начали использовать в качестве обслуживающего персонала в гостиницах: роботы на ресепшн на нескольких языках могут ответить на вопросы гостей, выдать ключи и рассказать об отеле.

А вот на производствах часто используется связка «человек — машина», когда система с искусственным интеллектом сначала обучается тому, как человек, например, закручивает гайки (с какой амплитудой или усилием), и только после этого повторяет его действия.

Пристальное внимание направлено в последние несколько лет на беспилотный транспорт: от такси, которое может доставить из одной точки города в другую, до грузоперевозок на огромные расстояния без непосредственного участия человека.

И конечно, одна из самых интересных задач — непосредственное взаимодействие ИИ с человеком в повседневной его жизни, день за днем и час за часом — взаимодействие при помощи гаджетов.

Телефонист

Нейросеть «Одноклассников» умеет выравнивать качество связи во время видеозвонка. «С одной стороны, вы можете сделать видеозвонок максимально качественным с точки зрения возможностей мобильной сети, но, если вы зайдете за дерево, например, у вас может начать пропадать картинка и звук.

Задача нейросети выяснить, какой комфортный уровень связи доступен данным сети, спрогнозировав на базе оценок пользователей по звонкам, на базе потерянных данных, на базе статистической информации, имеющейся по этому пользователю», – рассказал Александр Тоболь.

Эффективность — это ключ

Новые чипы с искусственным интеллектом не просто обеспечивают большую вычислительную мощность. Они также создаются для повышения эффективности в трех основных областях: размер кристалла, уровень вычислений и энергоэффективность.

Сегодняшние системы на чипе топового класса комплектуются десятками компонентов, начиная от драйверов для дисплея и заканчивая встроенным модемом связи. Все это должно вписаться в один маленький кристалл без ограничений по мощности, не обходясь при этом в кругленькую сумму (читайте о законе Мура для получения дополнительной информации).

Выделенный процессор искусственного интеллекта (NPU) в системе на чипе смартфона разработан для вычислительной энергоэффективности и определенного подмножества математических задач.

Вместо создания новых, более мощных ядер лучше разработать отдельный выделенный компонент, который может эффективно обрабатывать определенный набор задач.

Искусственный интеллект, ИИ

Мы видели подобное уже много раз за всю историю развития процессоров (вспомните дополнительные модули с плавающей точкой в первых чипах и, например, процессор обработки сигналов Hexagon DSP во флагманских моделях Qualcomm). Сейчас DSP не так популярны из-за быстрой смены вычислительной мощности, однако повышение энергоэффективности и машинное обучение восстанавливают этот спрос.

Заключение

Искусственный интеллект, на самом деле, уже очень плотно зашел в наши Андроид-смартфоны. Приложений, которые используют нейросеть, уже очень много.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *