Google се опитва да възпроизвежда човешкото възприятие

В света на изкуствения интелект (AI) Gemini – неотдавнашното творение на Google DeepMind, предизвиква шум. Тази иновативна разработка има за цел да се справи със сложното предизвикателство за възпроизвеждане на човешкото възприятие, по-специално способността му да интегрира различни сензорни данни.

Човешкото възприятие, по своята същност мултимодално, използва множество канали едновременно, за да разбере околната среда. Мултимодалният изкуствен интелект, черпейки вдъхновение от тази сложност, се стреми да интегрира, разбира и разсъждава относно информация от различни източници, имитирайки човешките възможности за възприятие.

Google Gemini , представен на 6 декември 2023 г., е семейство от мултимодални AI модели, разработени от отдела Google DeepMind на Alphabet в сътрудничество с Google Research. Gemini 1.0 е проектиран да разбира и генерира съдържание в спектър от типове данни, включително текст, аудио, изображения и видео.

Въпреки че изкуственият интелект напредна в управлението на индивидуалните сензорни режими, постигането на истински мултимодален AI остава огромно предизвикателство. Настоящите методи включват обучение на отделни компоненти за различни сетивности и свързването им заедно, но те често не успяват при задачи, изискващи сложни и концептуални разсъждения.

В стремежа си да възпроизведе човешкото мултимодално възприятие, Google Gemini се очерта като обещаващо решение. Това творение предлага уникална гледна точка към потенциала на изкуствения интелект да декодира елементи от човешкото възприятие. Gemini използва отличителен подход, като по своята същност е мултимодален и преминава през предварително обучение. Чрез по-нататъшна фина настройка с допълнителни данни, Gemini усъвършенства ефективността си, давайки оптимизъм за разбирането на различни входящи данни.

Gemini има способността безпроблемно да обработва и разсъждава върху различни типове данни като аудио, изображения и текст. Може да интерпретира ръкописни бележки, графики и диаграми за справяне със сложни проблеми. Архитектурата му поддържа директното поглъщане на текст, изображения, аудио звуци и видео форми.

Gemini може да се похвали с набор от модели, пригодени за конкретни случаи на употреба и сценарии за внедряване. Моделът Ultra, предназначен за изключително сложни задачи, се очаква да бъде достъпен в началото на 2024 г. Моделът Pro дава приоритет на производителността и скалируемостта, подходящ за стабилни платформи като Google Bard. За разлика от това, моделът Nano е оптимизиран за използване на устройства, включително смартфона Google Pixel 8 Pro.

Случаи на употреба

Появата на Gemini породи набор от случаи на употреба, някои от които са следните:

  • Gemini се отличава с усъвършенствано мултимодално разсъждение, като едновременно с това разпознава и разбира текст, изображения, аудио и др. Този всеобхватен подход подобрява способността му да схваща нюансирана информация и да превъзхожда в обясненията и разсъжденията, особено в сложни теми като математика и физика.
  • Gemini се отличава с разбирането и генерирането на висококачествени компютърни програми на широко използвани езици. Може да се използва и като двигател за по-усъвършенствани системи за кодиране, както е демонстрирано при решаването на конкурентни проблеми с програмирането.
  • Мултимодалните възможности за обработка на данни на Gemini могат да отбележат промяна в медицинската диагностика, като потенциално подобрят процесите на вземане на решения чрез предоставяне на достъп до различни източници на данни.
  • Gemini променя финансовото прогнозиране чрез интерпретиране на различни данни във финансовите отчети и пазарните тенденции, предоставяйки бърза информация за вземане на информирани решения.

Google потвърди своя ангажимент да подобри Gemini, като го даде възможност за бъдещи версии с напредък в планирането и паметта. Освен това компанията има за цел да разшири контекстния прозорец, позволявайки на Gemini да обработва още повече информация и да предоставя по-нюансирани отговори. Докато очакваме с нетърпение потенциални пробиви, отличителните възможности на Gemini предлагат обещаващи перспективи за бъдещето на изкуствения интелект, пише д-р Техсен Зия, който е доцент в университета Comsats в Исламабад, притежаващ докторска степен по изкуствен интелект.

Gemeni 

 

новини Стара Загора  www.infoz.bg