Що таке AI-камера і як працює редагування фотографій AI?

Штучний інтелект (ШІ) є скрізь, і якщо Ви ще не отримали смартфон із ШІ, швидше за все, скоро це зробите. Навіть програмне забезпечення вашого телефону використовує ШІ для прийняття рішень від вашого імені. Щойно запущена камера Photoshop від Adobe використовує ШІ для ідентифікації об’єктів та сцен на ваших фотографіях та пропонування „об’єктивів” (цифрових ефектів) для комічного та творчого впливу.

Це все лише маркетингова надмірність, чи штучний інтелект у смартфоні - і особливо у його камері - те, що ми всі повинні прагнути мати? З огляду на те, що термін ШІ все частіше використовується не лише у телефонах із камерою, а й у всіх видах камер, варто знати, що ШІ насправді робить для ваших фотографій.

ШІ розмив межі між захопленням зображення, покращенням зображення та маніпулюванням ним. Він використовується для редагування фотографій, щоб поєднати, покращити та `` доповнити '' реальність, зробити більш розумний вибір об'єктів, підібрати параметри обробки до об'єкта та допомогти вам автоматично знаходити зображення на основі того, що на ваших фотографіях, а не за ключовими словами вручну та описи. Він уже дивиться на те, що ви фотографуєте, і приймає власні рішення щодо того, як з цим поводитися.

Ласкаво просимо в новий сміливий світ камер AI.

Що таке ШІ?

ШІ - це жанр інформатики, який досліджує, чи можемо ми навчити комп’ютер думати чи, принаймні, вчитися. Як правило, це поділяється на підмножини технологій, які намагаються наслідувати те, що роблять люди, такі як розпізнавання мови, диктування голосу в текст, розпізнавання зображень та сканування обличчя, комп'ютерний зір та машинне навчання.

Навколо цієї теми існує ціла група модних слів. „ШІ”, „глибоке навчання”, „машинне навчання” та „нейтральні мережі” переплітаються в цій новій галузі технологій.

Що це спільного з камерами? Обчислювальна фотографія та економія часу на редагування фотографій, ось що. І голосова активація.

Голосові камери

Здатність комп’ютера розуміти людську мову є формою ШІ, і вона прокрадається на камери останні кілька років.

Смартфони пропонують Google Now і Siri вже кілька років, поки Alexa заходить додому через динаміки Amazon Echo. За останні роки екшн-камери підскочили, адже екшн-камери GoPro і навіть відеореєстратори здатні виконувати дії, коли ви вимовляєте прості фрази, такі як "запустити відео", "сфотографувати" тощо.

Все це має сенс, особливо для екшн-камер, де робота в режимі “вільні руки” значно полегшує їх використання, але чи справді це ШІ? Технічно це так, але донедавна гаджети з голосовою активацією називали просто "розумними". Деякі тепер дозволяють говорити цілком конкретні речі, наприклад, "робити повільне відео" або "робити слабку освітленість", але камері ШІ потрібно зробити трохи більше, ніж це заслуговує назви.

Програмне забезпечення для штучного інтелекту

ШІ стосується нових видів програмного забезпечення, спочатку для заповнення відсутності у смартфонів зум-об’єктивів. "Програмне забезпечення стає все більш важливим для смартфонів, оскільки у них фізично не вистачає оптики, тому ми спостерігали зростання обчислювальної фотографії, яка намагається відтворити оптичний зум", - говорить аналітик Арун Гілл, старший аналітик ринку Futuresource Consulting. . "У топових смартфонах все частіше використовуються подвійні об'єктиви, але Google Pixel 3 використовує єдиний об'єктив камери з обчислювальною фотографією, щоб відтворити оптичний зум і додати різні ефекти".

Починаючи з Pixel 3, багатокамерні масиви та обчислювальні зображення об’єдналися, створивши гібридну технологію, яка повторює багато ефектів глибини різкості та об’єктивів, отриманих від більших камер. Телефон з камерою - це вже не просто "камера". Це пристрій для обчислення, аналізу та «мислення», який не просто захоплює сцену такою, якою вона є, а те, як вона вважає, що ти хочеш, щоб вона була, або як вона вважає, що ти повинен хотіти, щоб це було …

ШІ може бути схожий на того, щоб мати знайомого асистента. Через деякий час ви можете почати задаватися питанням, хто насправді відповідає.

Світ не завжди готовий до повних наслідків камер ШІ. Google використовував AI на своїй носійній камері Google Clips, яка використовувала AI для зйомки та збереження лише особливо пам’ятних моментів. Він використовував алгоритм, який розумів основи фотографії, тому не витрачав часу на обробку зображень, що точно не призведе до остаточного вирізання барабана з основними моментами. Наприклад, він автоматично видаляв фотографії пальцем у кадрі та розфокусовані зображення, а також надавав перевагу тим, які відповідають загальній концепції правила третіх щодо того, як зробити кадр фотографії.

Жахливий і контрольний? Дехто так думав. У будь-якому випадку, Google витягнув камеру в 2022-2023 році. Питання полягає не в тому, чи є ШІ достатньо потужним для того, щоб робити те, що ми хочемо, а в тому, чи готові ми ще передати стільки влади машині … чи компанії, яка володіє та керує алгоритмами ШІ, що стоять за ним.

Що таке обчислювальна фотографія?

Обчислювальна фотографія - це цифрова техніка обробки зображень, яка використовує алгоритми для заміни оптичних процесів, і вона намагається поліпшити якість зображення за допомогою машинного зору для ідентифікації вмісту зображення.

"Йдеться про те, щоб отримати студійні ефекти, яких ви досягаєте за допомогою Lightroom і Photoshop, і зробити їх доступними для людей одним натисканням кнопки", - говорить Саймон Фіцпатрік, старший директор з управління продуктами FotoNation, який надає значну частину обчислювальних технологій брендам камер.

"Таким чином, ви зможете розгладити шкіру і позбутися від плям, але не просто розмивши її - ви також отримаєте текстуру". Раніше технології, що стоять за режимами «гладка шкіра» та «краса», по суті, стосувалися розмиття зображення, щоб приховати недоліки. "Зараз мова йде про створення вірогідного зовнішнього вигляду, і ШІ відіграє в цьому ключову роль", - говорить Фіцпатрік. "Наприклад, ми використовуємо ШІ для навчання алгоритмів щодо особливостей облич людей".

Ще до телефону LG V30S ThinQ LG використовувала ШІ для візуалізації. Це дозволяє користувачеві вибрати професійне зображення у своєму додатку Graphy та застосувати однаковий баланс білого, витримку, діафрагму та ISO. LG також представила Vision A, механізм розпізнавання зображень, який використовує нейронну мережу, навчену 100 мільйонами зображень, яка рекомендує, як налаштувати камеру. Він навіть виявляє відображення на знімку, кут пострілу та кількість доступного світла.

Датчики глибини та розмиті фони

Останніми роками ми бачили, що багатокамерні телефонні камери використовують дві або більше лінз для створення естетично приємних зображень, які мають розмитий фон навколо основної теми. Люди (і, отже, Instagram) люблять розмиті фони, але замість того, щоб використовувати камери з двома об'єктивами або брати дзеркальний дзеркальний фотоапарат та маніпулювати глибиною різкості вручну, тепер ШІ може це зробити за вас.

Машинне навчання, яке зазвичай називають ефектом "боке" (японське - розмиття), ідентифікує об'єкт і розмиває решту зображення. "Тепер ми можемо імітувати боке, використовуючи алгоритми на основі ШІ, які сегментують людей з переднього та заднього планів, щоб ми могли створити ефект, який починає дуже нагадувати портрет, зроблений у студії", - говорить Фіцпатрік. Найновіші смартфони дозволяють це робити для фотографій, зроблених задньою або передньою (селфі) камерою.

«Люди називають це боке, але ви не отримуєте справжнього розмиття, яке ви отримуєте за допомогою дзеркальної камери, де ви можете змінити глибину; за допомогою телефону ви можете лише розмити фон », - говорить Гілл. "Але невелика кількість зростаючих фотографів справді вражена цим і використовує iPhone X для повсякденної зйомки, і лише коли вони працюють на професійних роботах, вони отримають свою дзеркальну камеру".

Камери AI можуть автоматично поєднувати зображення HDR при яскравому освітленні, переходити в режим зйомки кількох зображень при слабкому освітленні та використовувати магію обчислювальних зображень, щоб створити ефект плавного збільшення з двома або більше модулями камери.

А як щодо дзеркальних дзеркальних фотокамер та інших „належних” камер?

Автоматичне видалення ефекту червоних очей використовується у дзеркальних фотокамерах роками, як і розпізнавання обличчя, а останнім часом навіть розпізнавання посмішки, завдяки чому селфі автоматично робиться, коли об'єкт тріщить усмішкою. Все це ШІ. Чи приймуть подібні Nikon та Canon коли-небудь вдосконалений ШІ для своїх флагманських дзеркальних дзеркальних фотокамер? Зрештою, пройшло багато років, щоб WiFi і Bluetooth з’явилися на дзеркальних дзеркальних камерах.

Поки ми чекаємо, фінансується Kickstarter аксесуар «розумний асистент камери» під назвою «Арсенал» хоче заповнити цю прогалину. "Арсенал - це аксесуар, який дозволяє бездротово керувати камерою зі змінним об'єктивом (наприклад, дзеркальною дзеркальною камерою) з мобільного пристрою, з алгоритмами машинного навчання, які використовуються для ідеального знімка", - говорить Гілл. "Він робить порівняння поточної сцени з тисячами минулих зображень, використовуючи розпізнавання зображень для розпізнавання конкретного об'єкта та застосовуючи правильні налаштування, наприклад, швидку витримку, якщо вона розпізнає дику природу".

Тим часом Canon сильно спирається на технологію штучного інтелекту для передової системи автофокусування в EOS-1D X Mark III. Або, якщо бути точнішим, "глибоке навчання". Складність алгоритмів однакова (система навчається з використанням професійних фотографій), але глибоке навчання - це кінцевий результат … штучний інтелект - це здатність машини продовжувати навчання самостійно.

Однак відокремити справжній ШІ від складної автоматизації може бути важко. Протягом багатьох років виробники компактних камер пропонують різні сюжетно орієнтовані сюжетні режими, які камера може вибрати автоматично. Це «інтелект», чи просто дещо вдосконалена реалізація вимірювання експозиції, руху об’єкта та відстані фокусування? У багатовимірних системах вимірювання, як правило, використовується складне вимірювання розподілу світла на основі тисяч реальних фотографій, і вони використовували процес "глибокого навчання" до того, як цей термін був винайдений.

Для кого призначена фотографія ШІ?

Всім. Для початку мова йде про демократизацію фотографії. "У минулому фотографія була сферою діяльності тих, хто має досвід використання дзеркальної дзеркальної фотокамери для створення різних типів зображень, і що ШІ почав робити, це зробити ефекти та можливості більш вдосконаленої фотографії доступними для більшої кількості людей", - говорить Фіцпатрік. .

То чи це означає, що Photoshop і Lightroom Adobe скоро не працюватимуть? Абсолютно не; ШІ є додатковою технологією і вже робить редагування фотографій набагато автоматизованішим. Одним з партнерів FotoNation є Athen Tech, технологія якого на основі «Ідеально чіткого» AI здійснює автоматичні пакетні корекції, що імітують людське око. Плагін для Lightroom, він спеціально спрямований на зменшення того, як довго фотографи сидять перед комп’ютерами, редагуючи їх вручну. "Професійні фотографи заробляють гроші, коли вони беруть фотографії, а не коли обробляють зображення", - говорить Фіцпатрік. "ШІ робить творчі ефекти професійного вигляду більш доступними для користувачів смартфонів і допомагає професійним фотографам максимізувати свої можливості заробляти на життя".

ШІ швидко стає надмірно вживаним терміном у світі фотографії. Зараз це в основному стосується камер для смартфонів, але неймовірні алгоритми та величезний рівень автоматизованого програмного забезпечення, що дозволяє ця технологія, незабаром виявляться непереборними для більшості з нас. Можливо, ще не час вибити цифровий дзеркальний фотоапарат, але, схоже, ШІ повинен змінити спосіб фотографування.

Мало того, але незабаром він може взяти на себе відповідальність за редагування та курацію наших існуючих бібліотек фотографії. Цей процес уже розпочався. Lightroom CC використовує серверну систему розпізнавання об’єктів Sensei на основі Adobe, щоб ідентифікувати зображення за тематикою, так що вам більше не доведеться витрачати години на додавання ключових слів вручну. ШІ може бути надмірно розкрученим терміном і часто скороченням того, що є не що інше, як останнє, найкраще вдосконалене програмне забезпечення, але ШІ обіцяє зробити щось неймовірне для фотографів; це звільнить більше вашого часу, щоб ви могли робити більше, а краще, фотографій.

Чому деякі телефони мають дві камери з одного боку? Пояснення подвійних конструкцій камер

Skylum Software - один з лідерів програмного забезпечення для редагування фотографій на основі ШІ. Він представив AI Sky Replacement у Luminar, щоб усунути всі ручні маскування, необхідні для цього вручну, AI Augmented Skies для додавання хмар, планет, блискавки та іншого до ваших зображень, інструменти вдосконалення портрета AI, які можуть автономно ідентифікувати людські особливості, та структуру AI додати визначення лише до тих областей зображення, де це доречно.

Використання доповненої реальності у фотографії ще може виявитися суперечливим. З часу винаходу редакторів зображень стало можливим спотворення, викручування та «винахід» реальності, але ШІ обіцяє зробити це настільки простим і настільки переконливим, що для цього не потрібні особливі навички (чи совість).

• Найкращі телефони з камерою, які ви можете придбати сьогодні
• Найкраще програмне забезпечення для редагування фотографій зараз
• Як завантажити Photoshop
• Як завантажити Lightroom

Цікаві статті...