Appleovo istraživanje umjetne inteligencije: ovo je njihova strategija

  • Apple Intelligence kombinira modele na uređaju i privatnog oblaka s revizijom i šifriranjem.
  • Siri dobija kontekst, pisanje i radnje u aplikacijama; pisanje, fotografije i slike su poboljšani umjetnom inteligencijom.
  • Opcionalna integracija sa ChatGPT (GPT-4o) sa zaštitom privatnosti i skrivenom IP adresom.
  • Appleove studije otkrivaju ograničenja u modelnom zaključivanju i napretku u fuziji senzora.

Appleovo istraživanje umjetne inteligencije

Apple je uložio sve napore kako bi u svoje uređaje uveo umjetnu inteligenciju bez ugrožavanja njene ključne karakteristike: privatnosti. Posljednjih godina, kompanija je predstavila niz unapređenja, od modela koji se pokreću na samom uređaju čak i prilagođeno dizajniran privatni oblak za zaštitu vaših podataka, kao i objavljivanje studija koje dovode u pitanje granice rasuđivanja u najmodernijim modelima.

Pored svih vijesti, prava inovacija se zove Apple Intelligence: lični sloj umjetne inteligencije s generativnim mogućnostima, razumijevanjem konteksta i radnjama unutar aplikacije. Integrira se s iPhoneom, iPadom i Macom, kombinirajući lokalnu obradu s namjenskom serverskom infrastrukturom. Obećanje je jasno: prava korisnost u svakodnevnom životu, uz najmanje moguće izlaganje vaših informacija.

Privatnost i arhitektura: Apple Intelligence i Private Cloud Compute

Arhitektura i privatnost Apple Intelligencea

Osnovna tehnička osnova Apple Intelligence-a zasniva se na jednostavnoj ideji: sve što može da se pokrene na vašem iPhoneu, iPadu ili Macu, radi i tamo. Modeli na samom uređaju Oni obavljaju mnoge jezičke i slikovne zadatke bez napuštanja računara, smanjujući rizik od izloženosti u korijenu.

Kada zahtjev zahtijeva veći kapacitet, na scenu stupa Private Cloud Compute (PCC), serverski oblak sa M4 i M4 Max čipovi Appleov sigurnosni dizajn se veoma razlikuje od uobičajenog. Prije nego što uređaj komunicira s oblakom, PCC kriptografski verificira Apple navodi da je serverski softver javno dostupan za pregled, što omogućava nezavisnim stručnjacima da ga revidiraju. Apple dalje navodi da se podaci ne pohranjuju niti dijele.

Ova hibridna arhitektura omogućava skaliranje između modela na uređajima i većih modela baziranih na serverima. Prema samom Appleu, njihovi osnovni modeli su lokalni. jednake ili veće od malih ekvivalenata od drugih proizvođača, dok su modeli servera iznad GPT-3 i oko performansi GPT-4, uvijek s kontrolom privatnosti kao prioritetom.

Ukratko, Apple Intelligence nastoji razumjeti vaš lični kontekst kako bi vam bio od pomoći, ali to čini uz tehničke i organizacijske barijere koje pokušavaju osigurati da Vaši podaci će ostati zaključani. i na uređaju i u privatnom oblaku.

Jezik i produktivnost: pišite bolje, čitajte manje

Alati za pisanje i produktivnost u Apple Intelligenceu

Apple je uveo ugrađene alate za redigovanje u iOS, iPadOS i macOS sistemima kako bi vam pomogao u prepisivanju, reviziji i sažimanju teksta u aplikacijama poput Mail, Notes, Pages i aplikacija trećih strana. Možete zatražiti prilagođavanje tona, poljska gramatika i vokabular ili pretvoriti blok teksta u tačke s nabrajanjem, tabele ili kratke sažetke.

U odjeljku "Prioritetne poruke" naći ćete odjeljak koji stavlja hitne poruke u prvi plan (pozivnica za danas, karta za ukrcavanje itd.). Osim toga, lista e-pošte može prikazivati generirani sažeci umjesto prvih nekoliko redova, a pametni odgovori otkrivaju neriješena pitanja tako da ništa ne ostane bez odgovora.

Obavještenja također postaju pametnija. Prioritetna obavještenja prikazuju važne poruke na vrhu, a sažeci sažimaju vrlo duge razgovore na zaključanom ekranu. S načinom rada za smanjenje prekida, sistem dozvoljava prolaz samo određenim porukama. ono što zahtijeva hitnu pažnjupomažući u održavanju fokusa kada je to potrebno.

Bilješke i Telefon sada uključuju snimanje s transkripcijom i sažetkom. Ako snimite poziv, svi učesnici će automatski biti obaviješteni, a kada prekinete poziv, Apple Intelligence generira sažetak ključnih tačaka. To je praktičan način da dokument razgovora bez dodatnog rada.

Kreativnost: Igralište slika i Genmoji

Za vizualnije aspekte, Apple Intelligence uključuje Image Playground, okruženje za kreiranje slika za nekoliko sekundi sa stilovima poput animacije, ilustracije i skice. Radi unutar Poruka i sadrži... samostalna aplikacija eksperimentisati bez ograničenja, budući da se generiranje vrši na uređaju.

Tok rada je vođen: birate koncepte po kategorijama (teme, lokacije, dodaci, kostimi), opisujete šta tražite ili čak birate nekoga iz svoje fotogalerije koga ćete uključiti u kreaciju. U Porukama, sistem predlaže ideje. vezano za razgovor tako da ono što kreirate odgovara kontekstu.

U aplikaciji Notes, alat Image Wand u Apple Pencilu pretvara skice u slike jednim dodirom, pa čak i koristi kontekst stranice za popunjavanje praznog prostora. Osim toga, Image Playground API omogućava trećim stranama da integriraju ove mogućnosti u aplikacije poput Glavni govor, slobodni oblik i stranice.

Izražavanje ide korak dalje sa Genmojijem: napišite opis, a sistem kreira vaš vlastiti emoji, s mogućnošću da ga bazirate na nečijem licu s vaših fotografija. Možete ih koristiti kao naljepnice, reakcije (Tapback) ili ih umetnuti online, tako da vaš stil komunikacije može biti jedinstven. još ličnije.

Pametne fotografije i prirodne pretrage

Aplikacija Fotografije dobija poboljšanja usmjerena na kontrolu i brzinu u pronalaženju onoga što tražite. Možete pretraživati ​​prirodnim jezikom poput "Laura vozi skejtbord sa majica s printom" ili "Sara sa naljepnicama na licu", a u videu, preskočite direktno na relevantni trenutak.

Novi alat za čišćenje detektuje neželjene elemente pozadine i uklanja ih bez uticaja na glavni subjekt. To je suptilan način za uklanjanje smetnji bez složenih alata, uz zadržavanje realizam snimanja.

Sjećanja stvaraju priče iz pisanog opisa. Apple Intelligence odabire najbolje fotografije i videozapise, strukturira narativ u poglavlja i predlaže pjesme s Apple Musica koje odgovaraju raspoloženju. Cijeli ovaj proces se obavlja uz... privatni tretman na uređaju.

Cilj nije samo brže pronalaženje stvari, već i automatsko transformiranje vaše biblioteke u smislene priče, gdje sistem razumije šta se dešava na slikama i kada se to dogodilo kako bi ih izgradio. emocionalnije iskustvo.

Siri: sposobnija, kontekstualnija, a također i u pisanju

Siri je obnovljena iznutra i izvana. Poboljšano je njeno razumijevanje prirodnog jezika, može pratiti vaše misli čak i ako se ispravljate u hodu i uzima u obzir kontekst prilikom upućivanja zahtjeva. Također možete prebacivati ​​između glasa i teksta po potrebi; a vizualno, tu je i novi sjaj oko ekrana. označava kada je aktivan.

Asistent razumije šta se nalazi na ekranu i može komunicirati sa sadržajem iz drugih aplikacija. Ako primite nečiju adresu u Porukama, jednostavno recite "dodaj ovu adresu na njihovu karticu" i Siri će uraditi ostalo. Također može pokrenuti složene radnje poput "pošalji fotografije sa subotnjeg roštilja...". María» bez potrebe da išta otvarate.

Još jedna nova funkcija je njena uloga kao vodiča za korisnike uređaja: Siri odgovara na hiljade pitanja tipa "kako da...?" o iPhoneu, iPadu ili Macu, od zakazivanja e-pošte u aplikaciji Mail do aktiviranja tamnog načina rada. A uz Apple Intelligence, postaje proaktivna prilikom povezivanja. lični podaci i kontekst"Pusti podcast koji je Jaime preporučio" ili "U koje vrijeme mama sleti?" su primjeri zahtjeva koji su riješeni bez potrebe da pamtite gdje se informacije nalaze.

Važno je da vještačka inteligencija pristupa potrebnom kontekstu kako bi vam pomogla, ali uz obećanje privatnosti: većina se obrađuje na samom uređaju, a kada se skalira na Appleov oblak, to čini pod tehničkim garancijama privatnog računarstva u oblaku, koje ograničavaju... izloženost podacima.

ChatGPT unutar ekosistema: kako, kada i sa kojim ograničenjima

Apple integrira pristup ChatGPT-u u sistemska iskustva: Siri može konsultovati model kada je to prikladno, uvijek tražeći vašu dozvolu prije slanja zahtjeva (i priloga kao što su slike ili dokumenti). Odgovori stižu. bez napuštanja toka sistema iOS, iPadOS ili macOS.

Privatnost se također uzima u obzir: IP adrese su skrivene, a OpenAI ne sprema zahtjeve prema zadanim postavkama. Ako povežete svoj ChatGPT račun, primjenjuju se njihove politike i možete pristupiti plaćenim funkcijama iz sistema. Integracija koristi GPT‑4o, sa besplatnim pristupom bez kreiranja računa.

Nadalje, Appleovi alati za pisanje omogućavaju vam korištenje ChatGPT-a za generiranje slika i teksta kada to želite. Apple je ostavio otvorena vrata za integraciju drugih modela (na primjer, Gemini) u budućnosti i već je predvidio da će, ako njegova umjetna inteligencija... Ne mogu se nositi s nečimPredložit će vam opcionalno korištenje modela treće strane.

Dostupnost i kompatibilni uređaji

Apple Intelligence je besplatan i dostupan u beta verziji za iOS 18, iPadOS 18 i macOS Sequoia. Uvođenje je započelo na engleskom jeziku (Sjedinjene Američke Države) i širilo se u fazama. Na iPhoneu su mnoge funkcije stigle s iOS-om 18.4, a uvođenje u Španiji je počelo u aprilu 2025. godine. español, još uvijek u beta verziji.

Hardverski zahtjevi: iPhone 15 Pro i 15 Pro Max, plus iPad i Mac sa M1 čipom ili novijim. Za neke početne funkcije, Siri i jezik uređaja morali su biti podešeni Engleski (SAD)U ekosistemu Maca i iPada, kompatibilnost počinje sa Apple Siliconom.

  • Kompatibilni Mac računari: MacBook Air (M1, 2020) ili noviji; MacBook Pro (M1, 2020) ili noviji; Mac mini (M1, 2020) ili noviji; Mac Studio (M1 Max/Ultra, 2022) ili noviji; iMac (M1, 2021) ili noviji; Mac Pro (M2 Ultra, 2023).
  • Kompatibilni iPad uređaji: iPad Air (5. generacije) ili noviji; iPad Pro (5. generacija) ili kasnije.
  • Kompatibilni iPhone uređaji: iPhone 15 Pro i 15 Pro Max; porodica iPhone 16 (uključujući 16, 16 Plus, 16e, 16 Pro i 16 Pro Max).

Ovo smanjenje je posljedica memorijskih i računarskih zahtjeva modela na uređaju, što objašnjava zašto ne širi se na iPhone uređaje prije A17 Pro modela.

Apple istraživanje i razvoj: Fuzija senzora sa LLM-om kako biste razumjeli šta radite

Apple je objavio studiju koja pokazuje kako spojiti podatke senzora, poput zvuka i pokreta, kako bi se prepoznale svakodnevne aktivnosti (kuhanje, pranje rublja, vježbanje) bez treniranja specifičnog modela za svaki zadatak. Ključ leži u «kasna fuzija"Prvo, mali modeli obrađuju svaki signal zasebno i generiraju tekstualne opise/oznake; zatim, veći LLM integrira te sažetke kako bi odlučio šta se događa."

Ovo otkriće je značajno jer funkcioniše čak i sa signalima sa šumom i smanjuje potrebu za izgradnjom ad hoc modela za svaki scenario. Takođe je pozitivno za privatnost: LLM ne prihvata sirovi zvuk, ali... tekstualni opisi prethodno obrađeno. U Apple ekosistemu, ovo bi se moglo prevesti u preciznije otkrivanje vježbanja na Apple Watchu ili prepoznavanje aktivnosti na iPhoneu uz manju potrošnju energije.

Izazov će, kao i uvijek, biti plasiranje na tržište. Iako Apple objavljuje više istraživanja nego prije, neki u zajednici smatraju da kompanija treba brže prevesti ove napretke u vidljive funkcije, što je područje... gdje su očekivanja visoka.

Šta nam Apple govori o obrazloženju iza ovih modela?

Druga linija istraživanja u Appleu analizira specijalizirane modele zaključivanja (LRM) i podvrgava ih klasičnim zagonetkama poput Hanojske kule, prijelaza rijeka i preskakanja pločica, povećavajući složenost korak po korak. Rezultat je jasan: nakon određenog praga, tačnost pada na nulučak i ako se doda više računarske snage.

Istraživači su uočili tri režima: pri niskoj složenosti, konvencionalni LLM-ovi rade bolje i efikasnije; pri srednjoj složenosti, LRM-ovi imaju prednost; a pri visokoj složenosti, oba se urušavaju. Nadalje, kako su se približavali kritičnom pragu, modeli su iznenađujuće... Smanjuju svoj trud (manje "žetona misli") čak i ako je problem teži.

Analiza "tragova zaključivanja" otkriva dva ponašanja: u jednostavnim problemima, modeli pronalaze rješenje, ali nastavljaju istraživati ​​pogrešne puteve ("pretjerano razmišljanje"); u srednjoj složenosti, isprobavaju mnogo pogrešnih puteva prije nego što pronađu ispravan; a u visokoj složenosti, ispravna međustanja se više ne pojavljuju. Čak i kada im se algoritam pruža korak po korak, modeli... oni stalno ne uspijevaju ako složenost premaši svoj prag.

Krhkost u matematici u osnovnoj školi: GSM8K i simboličke varijante

Apple je također procijenio opće LLM-ove - uključujući GPT-4o, o1-mini i o1-preview, kao i Llama3-8B, Phi-3, Gemma2-9B i Mathstral-7B - na matematičkim zadacima školskog nivoa (GSM8K). Korištenjem novog testnog paketa (GSM-Symbolic) koji generira kontrolirane varijante, uočeno je da trivijalne promjene u imenima ili nebitne informacije Mogu uništiti tačnost.

Kada se povratne informacije daju "korak po korak", performanse se poboljšavaju, ali male promjene u vrijednostima ili strukturi izjave dovode do značajnih padova. Zaključak je uznemirujući: modeli često repliciraju obrasce uočene tokom obuke, umjesto da istinski razmišljaju, što se prevodi u nestabilnost u suočavanju s poremećajima naizgled bezopasno.

Alati za razvojne programere: Xcode i osnovni modeli

Za programere aplikacija, Apple je predstavio osnovne modele za aplikacije na uređajima i serverima, s fokusom na specijalizirane adaptere za zadatke poput sumiranja ili podešavanja tona. Prema internoj evaluaciji, modeli na uređajima nadmašuju ili su jednaki malim ekvivalentima trećih strana, a modeli na strani servera... nadmašiti GPT-3 i ostaju približno na nivou GPT-4.

Xcode 16 uvodi prediktivno dovršavanje koda na uređaju, pokretano modelom posebno obučenim za Swift i Appleove API-je. Zahtijeva Mac sa najmanje 16 GB RAM-a. Osim toga, Swift Assist - funkcija chata koja koristi modele zasnovane na oblaku - generira, uređuje i objašnjava poruke. Swift kod unutar IDE-a.

Tim i talenat: ovako Apple provodi istraživanje

Apple održava više istraživačkih i proizvodnih timova za umjetnu inteligenciju: od infrastrukture za mašinsko učenje (računarstvo, podaci i pohrana u velikim razmjerima) do stručnjaka za duboko učenje i učenje s pojačanjemsa istraživačkim linijama koje obuhvataju nadzirano i nenadzirano učenje, generativne modele, multimodalno učenje i teoriju odlučivanja. Također rade s opremom za obradu prirodnog jezika i govornim tehnologijama.

Još jedno ključno područje su tehnologije obrade prirodnog jezika i govora: mašinsko prevođenje, prepoznavanje entiteta, odgovaranje na pitanja, segmentacija tema, TTS i ASR. To uključuje rad s velikim količinama podataka i metode dubokog učenja da podrži više jezika i slučajeva upotrebe u stvarnom svijetu. Pored toga, bilo je i poteza talenata kao što je Meta je preoteo šefa za umjetnu inteligenciju od Applea.

Strategija i sljedeći koraci

Na WWDC 2025, Apple je naglasio da umjetna inteligencija više nije dodatak, već srce ekosistema. Sa A18 Pro, M4 i čip M5Dio obrade je pojačan na uređaju, a funkcije kao što su prevođenje poziva u stvarnom vremenuAutomatski sažeci i "vizualna inteligencija" za identifikaciju elemenata na fotografijama i videozapisima ilustruju smjer kretanja proizvoda.

Kompanija kombinuje posvećenost vlastitoj umjetnoj inteligenciji s opcionalnim integracijama trećih strana (kao što je ChatGPT), stav koji je u skladu s njenim fokusom na privatnost i kontrolu korisničkog iskustva. U međuvremenu, prema izvorima, pojavili su se pregovori o akviziciji Perplexity AI, konverzacijske tražilice. Ako se finalizira, ovo bi moglo poboljšati Siri. Pojačajte Safari i ponuditi izvornu alternativu Googleu unutar ekosistema, usklađenu s transparentnošću rezultata.

S obzirom na to da je Apple Intelligence implementiran kao besplatna usluga na kompatibilnim uređajima, plan uključuje proširenje jezičke podrške, jačanje garancija za privatno računarstvo u oblaku (Private Cloud Compute) i transformaciju istraživanja - od fuzije senzora do procjene logičkog zaključivanja - u... opipljiva poboljšanja na iOS-u, iPadOS-u i macOS-u.

Apple je uveo eru u kojoj umjetna inteligencija, privatnost i dizajn proizvoda idu ruku pod ruku: obrada na uređaju gdje je to moguće, privatni oblak koji se može provjeravati za složene zadatke, integrirani alati za pisanje i kreativnost, korisniji i kontekstualno svjestan Siri, te istraživanje koje pomaže u razumijevanju i potencijalnih i trenutnih ograničenja modela. Sve ovo stvara sliku trezvenog i praktičnog pristupa, gdje tehnologija... postaje nevidljiv tako da je ono što radite s tim ono što je važno.

Performanse Apple Silicon M4 Max
Vezani članak:
Performanse Apple Silicon M4 Max: testovi, umjetna inteligencija i poređenje