Hobiji izdomā, kā AI ģenerētajos attēlos ievietot pielāgotus fontus

Pietuvināt / Mākslīgā intelekta ģenerēts piemērs Kiberpanks 2077 LoRA, kas ieviesta, izmantojot Flux dev.

Pagājušajā nedēļā kāds amatieris eksperimentēja ar jaunu Flux AI attēla sintēzes modeli Tas ir atklāts Viņi negaidīti labi spēj nodrošināt īpaši apmācītas fontu versijas. Lai gan gadu desmitiem ir bijušas efektīvākas datoru fontu renderēšanas metodes, jaunā tehnoloģija ir noderīga AI attēlu entuziastiem, jo ​​Flux spēj atveidot smalkas teksta vizualizācijas, un lietotāji tagad var ievietot vārdus, kas renderēti ar pielāgotiem fontiem, tieši AI attēlu paaudzēs. .

Kopš 80. gadiem (un 1970. gadiem pētniecībā) mums ir bijusi tehnoloģija, lai izveidotu precīzas, gludas, ar datoru zīmētas līnijas pielāgotās formās, tāpēc klonēta fonta izveide, izmantojot AI, pati par sevi nav nekas jauns. Taču jaunā tehnoloģija nozīmē, ka AI ģenerētos attēlos var redzēt konkrētu fontu, piemēram, ēdienkarti uz tāfeles reālā restorānā vai drukātu vizītkarti, ko tur robota lapsa.

Īsi pēc tam, kad AI fotomontāžas modeļi kļuva plaši izplatīti, piemēram, Stable Diffusion 2022. gadā, daži cilvēki sāka brīnāsKā es varu iekļaut savu produktu, apģērbu, personību vai stilu mākslīgā intelekta ģenerētā attēlā? Viena no atbildēm, kas radās, bija LoRA (zema līmeņa adaptācija), tehnika Tas ir atklāts 2021. gadā tika laists klajā mākslīgā intelekta bāzes modelis, kas lietotājiem ļauj papildināt zināšanas AI bāzes modelī ar īpaši apmācītiem etalonu paplašinājumiem.

Šie LoRA moduļi, kā tiek saukti moduļi, ļauj attēlu sintēzes modeļiem izveidot jaunas koncepcijas, kas sākotnēji nebija atrastas (vai ir slikti attēlotas) pamatā esošā modeļa apmācības datos. Praksē attēlu sintēzes entuziasti tos izmanto, lai nodrošinātu unikālus stilus (piem., viss, kas… Krīta māksla) vai tēmas (detalizēti attēli no Zirnekļcilvēks(Piemēram). Katrs LoRA ir īpaši jāapmāca, izmantojot lietotāja sniegtus piemērus.

READ  HTC prezentēja jauno Vive Pro 2 ar izšķirtspēju 5K un atsvaidzes intensitāti 120Hz

Pirms Flux vairums AI attēlu ģeneratoru nebija pārāk labi, lai attēlotu precīzu tekstu ainā. Ja lūdzat Stable Diffusion 1.5 parādīt atzīmi ar uzrakstu “siers”, tas parādīs muļķības. OpenAI DALL-E 3, kas tika izlaists pagājušajā gadā, bija pirmais lielais modelis, kas diezgan labi apstrādāja tekstu. Flux joprojām ik pa laikam pieļauj vārdu un burtu kļūdas, taču tas ir visspējīgākais “teksta pasaulē” (jūs to nosaucat) AI modelis, ko mēs vēl esam redzējuši.

Tā kā Flux ir atvērts modelis, kas pieejams lejupielādei un mikrokonversijai, pagājušajā mēnesī bija pirmā reize, kad LoRA līnijas apmācībai varētu būt jēga. Tas ir tieši tas Nesen atklāja AI entuziasts Vadims Fedenko (kurš līdz preses laikam nebija atbildējis uz intervijas pieprasījumu). “Esmu patiešām pārsteigts par to, kā tas izrādījās,” rakstīja Fedenko Kopīgojiet vietnē Reddit“Flux atpazīst, kā burti izskatās noteiktā stilā/fontā, ļaujot apmācīt Loras ar konkrētiem fontiem, stiliem utt. Drīzumā es tos apmācīšu vairāk.”

Pirmajam mēģinājumam Fedenko izvēlējās dzirkstošu dzērienu “Y2K” stila fonts Atgādinot tos, kas bija populāri 90. gadu beigās un 2000. gadu sākumā, iegūtais modelis tika publicēts platformā Civitai 20. augustā. Divas dienas vēlāk kāds Civitai lietotājs ar nosaukumu “AggravatingScree7189” ievietoja otru LoRA fontu, kas atveidoja fontu, kas līdzīgs tajā esošajam fontam. Kiberpanks 2077 Video spēle.

“Scenārijs bija tik slikts, pirms man ienāca prātā, ka jūs varētu to izdarīt.” grāmatas Reddit lietotājs sauca egg-benedryl, atbildot uz Fedenko ziņu par Y2K līniju. Vēl viens Reddit lietotājs grāmatas“Es nezināju, ka Y2K žurnāls ir viltots, līdz es to pietuvināju.”

READ  Vai Elder Scrolls 6 nāk uz PS5? Bethesda nes noslēpumainu atjauninājumu

Vai tas ir pārspīlēts?

مثال على <em>Kiberpanks 2077</em> LoRA, renderēts, izmantojot Flux dev.” src=”https://cdn.arstechnica.net/wp-content/uploads/2024/08/without_with_2-640×357.jpg” width=”640″ height=”357″ srcset= ” https://cdn.arstechnica.net/wp-content/uploads/2024/08/without_with_2.jpg 2x”/></a><figcaption class=
Pietuvināt / Konkrēts gadījums Kiberpanks 2077 LoRA, kas ieviesta, izmantojot Flux dev.

Tā ir taisnība, ka, izmantojot dziļi apmācītu neironu tīklu, lai sintezētu attēlus, lai parādītu vienkāršu līniju uz vienkārša fona, iespējams, ir pārspīlēti. Jūs, iespējams, nevēlaties izmantot šo metodi, lai aizstātu programmu Adobe Illustrator, veidojot dokumentu.

“Izklausās labi, taču ir diezgan smieklīgi, ka mēs no jauna izgudrojam fontu ideju ar 300 MB LoRA failiem,” grāmatas Reddit komentētājs pavedienā par Kiberpanks 2077 Fonts.

Ģeneratīvais AI bieži tiek kritizēts par tā ietekmi uz vidi, kas ir pamatotas bažas lieliem mākoņdatu centriem. Taču mēs atklājām, ka Flux var ievietot šīs līnijas AI ģenerētās ainās, lokāli darbojoties ar RTX 3060 Kvantitatīvs (Samazināts izmērs) (Pilnu izstrādes modeli var palaist ar RTX 3090). Tas ir līdzīgs elektroenerģijas patēriņš kā videospēļu spēlēšanai tajā pašā datorā. Tas pats attiecas uz LoRA:Constructor izveidi Kiberpanks 2077 Fonts treneris LoRA trīs stundās ar 3090 GPU.

Pastāv arī ētiskas problēmas, kas saistītas ar AI darbināmu attēlu ģeneratoru izmantošanu, piemēram, kā viņi tiek apmācīti par datiem, kas iegūti bez satura īpašnieka piekrišanas. Lai gan tehnoloģija dažu mākslinieku vidū šķeļ, liela cilvēku kopiena to izmanto katru dienu Kopīgojiet rezultātus tiešsaistē Izmantojot sociālo mediju platformas, piemēram, Reddit, radot jaunas tehnoloģijas lietojumprogrammas, piemēram, šī.

Šajā rakstīšanas brīdī ir tikai divas rindiņas, kas veltītas Flux LoRA, taču mēs jau esam dzirdējuši par plāniem izveidot vairāk, rakstot šīs rindas. Lai gan šī tehnoloģija joprojām ir agrīnā stadijā, tā var kļūt būtiska, ja nākotnē AI attēlu sintēze tiks ieviesta plašāk. Adobe ar saviem attēlu sintēzes modeļiem, visticamāk, tam sekos līdzi.

READ  Apple aprīko iPad Pro ar bezvadu uzlādi, jaunu iPad mini

Alexis Wells

"Televīzijas speciālists. Lepna kafijas duncis. Tieksme uz apātijas lēkmēm. Interneta eksperts. Ceļojumu nindzja." <pre id="tw-target-text" class="tw-data-text tw-text-large XcVN5d tw-ta" data-placeholder="Translation"></pre>

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *

Back to top