Fordító szemüveg és digitális mentorok: így költözik be az MI az életünkbe

Fordító szemüveg és digitális mentorok: így költözik be az MI az életünkbe
Kép: Pixabay

Példátlan időket élünk: soha nem volt ekkora a globális népesség, ennyire magas az átlagéletkor és ilyen gyors a kommunikáció. A látványos fejlődés új fejezeteként jelent meg a mesterséges intelligencia (MI) terjedése az élet szinte minden területén. Milyen új, a hétköznapi ember által is használható MI-eszközökről beszélhetünk? Cikksorozatunk harmadik része.

A technikai újításoknak már se szeri, se száma. Egy MI-kalkuláció (Copilot) alapján ebből a szempontból eddig a 2025-ös év volt a legdinamikusabb, mintegy 5%-os növekedést mutatva, ezt elsősorban az ázsiai térségnek köszönhetünk. A gép az alábbi területeken határozta meg az év áttöréseit:

  • MI-ügynökök: autonóm rendszerek, amelyek emberi beavatkozás nélkül hoznak döntéseket.
  • Kisméretű nyelvi modellek (SLM): hatékony, eszközön futtatható MI-modellek.
  • Kvantum-alapú MI: a kvantumszámítás és a gépi tanulás ötvözése.
  • Zöld acélgyártás: szén-dioxid-mentes ipari megoldások.
  • Mágneses tranzisztorok: gyorsabb és energiatakarékosabb félvezetők.
  • Robotaxik és autonóm logisztika: a közlekedés automatizálásának szintlépése.
  • Személyre szabott terápiák: MI által tervezett fehérjék és őssejt-terápiák.
  • Bio-számítástechnika: biológiai rendszerek integrálása a digitális feldolgozásba.
  • Térbeli intelligencia: az AR/VR és az MI kombinációja környezeti érzékeléshez.
  • Fenntartható repülőgép-üzemanyag: tisztább légi közlekedést biztosító megoldások.

De milyen olyan MI-alkalmazások léteznek ma, amelyeket akár a hétköznapi ember is alkalmazhat?

Ilyen az, amikor a szemüvegünk fordít

Az okosszemüvegek évek óta az újítások fókuszában állnak, és a nagy szereplők, mint a Meta és a HTC úttörő termékei már előkelő helyet harcoltak ki maguknak ebben a piaci szegmensben. A HTC VIVE Eagle okosszemüvegek, számos olyan funkciót kínálnak, amelyek kifejezetten a mindennapi élethez lettek tervezve: egy nagy teljesítményű MI hangasszisztenst és egy kamerát is tartalmaznak az okosszemüvegeknél átlagosnak mondható 49 grammos össztömeg mellett.

A legfőbb erősség a fordítási funkció: az eszközt megkérhetjük, hogy fordítsa le azt, amit például éppen nézünk. A 13 különböző nyelv bőségesnek mondható, és ha ez az újítás kevés lenne, a fordítást hangalapon oldja meg. Képzeljük el, hogy egy kínai körutazáson veszünk részt és csupa ismeretlen feliratot látunk mindenhol, vagy éppen egy étterem étlapját nézzük Nápolyban. A szemüveggel a fejünkön nem kell aggódnunk a nyelvi korlátok miatt, ugyanis viselésével azonnal meg is tudhatjuk, mit olvasunk.

A Meta pedig az Oakley-vel együttműködve mutatta be az Oakley Meta HSTN-t, egy okosszemüveg-kollekciót, melyet kifejezetten a sportolók és a szabadtéri tevékenységek szerelmesei számára terveztek. Ez a szemüveg beépített MI-asszisztenssel van felszerelve, amely válaszol a kérdésekre, ellenőrzi az időjárást, és segít kapcsolatban maradni, mindezt kézhasználat nélkül.

A szemüveg videókat rögzíthet, zenét hallgathatunk vele, sőt üzeneteket is küldhetünk anélkül, hogy elővennénk a telefonunkat. Mindkét eszköz egy olyan jövőbe mutat, ahol a segítség már nem az asztalunkon vagy a zsebünkben van, hanem közvetlenül az arcunkon – segítve a nyelvi akadályok leküzdését és a mindennapi feladatok sokkal könnyebbé tételét.

Appba zárt fotóasszisztens

A telefonok kameráinak képességei lassan utolérik a dedikált (egyetlen céllal megépített) fényképezőgépekét, és talán már csak az utolsó szakadékot kell átugraniuk, a fotós személyének képzettségét. Az Adobe, a Photoshop és a Lightroom mögött álló cég ezt a szakadékot szeretné áthidalni új Project Indigo névre keresztelt alkalmazásával, amely ingyenesen elérhető iPhone-okon, amíg az Androidos verzió egyelőre ígéret tárgyát képezi.

A Project Indigo több mint egy újabb kameraalkalmazás. Manuális vezérlést biztosít a fényképeink felett, nagyjából úgy, mint egy DSLR, de egy csipetnyi mesterséges intelligenciával. Az alkalmazás MI-t használ minden felvétel optimalizálására, a jelenetnek megfelelő beállításokat módosítva, hogy professzionális minőségű képeket készíthessünk, függetlenül a képzettségi szinttől.

Akár portrét, naplementét vagy gyermekünk trambulinos ugrását fotóznánk, az Indigo célja, hogy minden alkalommal éles, kiegyensúlyozott fotót biztosítson. Az alkalmazást egy olyan csapat fejlesztette, amelynek a tagja az Adobe munkatársa, Marc Levoy, a Google Pixel telefonjait híressé tevő számítógépes fényképezési funkciók mögött álló elme.

Az Indigo zökkenőmentesen működik az Adobe más alkalmazásaival, mint például a Lightroom és a Photoshop, így a remekművek szerkesztése éppen olyan egyszerű, mint maga a lefényképezésük. „Van például egy gombunk a tükröződések eltávolítására. A funkció lehetővé teszi, hogy a visszatükröződéseket eltávolítsa, így azonnal meg is oszthatjuk az ablakon keresztül készült fényképeinket” – írta Levoy és Florian Kainz, a projekt vezető kutatója egy Adobe blogbejegyzésben.

Beszélgetés a történelem legnagyobb alakjaival

Képzeljük el, hogy vezetői útmutatást kérünk Konfuciusztól. A Historic Mentor egy új, MI által vezérelt platform, mely életre kelti ezt az ötletet azáltal, hogy lehetővé teszi a felhasználók számára „élő” beszélgetések lefolytatását a történelem legnagyobb elméivel. A platformon olyan történelmi óriások közül választhatunk, mint Marcus Aurelius, Leonardo da Vinci vagy éppen Benjamin Franklin.

Kép: Pixabay

A felhasználók kérdéseket tehetnek fel, sőt, minden virtuális „mentor” hivatkozik is majd később a felhasználó profiljára, így fel tudja idézni a korábbi csevegéseket, ezáltal a felhasználónak sokkal személyre szabottabb élményben lehet része. A Historic Mentor platform azt ígéri, hogy a múltból való tanulást interaktívvá és mélyen relevánssá teszi a modern kihívások szempontjából, akár filozófiai gondolkodásmódot, kreatív inspirációt vagy gyakorlati problémamegoldást keresünk.

Videó egyetlen fotóból

2025 nyarán a Midjourney, amely szürreális MI-művészetéről híres, elindította első videógeneráló modelljét: a V1-et. Elég feltölteni egy képet, és a V1 animált klippé alakítja. A Midjourney megközelítése leginkább a kreativitásról szól, mint csak a kereskedelmi tartalomról. David Holz vezérigazgató szerint a nagyobb álom a „valós idejű, nyitott világú” szimulációk, mesterséges intelligencia által történő megalkotása. Az eredményekkel kapcsolatban érdemes felhívni a figyelmet arra, hogy az elkészült tartalmak nem fotorealisztikusak – inkább álomszerűek, összhangban a Midjourney jellegzetes megjelenésével.

Bármi is legyen a feladat, a mesterséges intelligencia itt van, hogy segítsen nekünk, embereknek. Habár továbbra is eszközként érdemes tekinteni a technikai újításokra, azonban azt sem szabad szem elől téveszteni, hogy egyre inkább elmosódik a határ a mesterséges és természetes intelligencia között – talán már a jövő sem a régi.

Forrás: National Geographic Magyarország

Mit ad nekünk az MI? A mesterséges intelligencia legújabb eredményeit és gyakorlati alkalmazásait bemutató cikksorozatunk eddig megjelent részei: Így válhat a mesterséges intelligencia az orvosok eszközévéGondolatolvasóvá válhat a mesterséges intelligencia.