Opowiem o AI Picture Webui (stabilna popularność)
Dzisiaj poprowadzę cię witrynę, która rysuje zdjęcie za darmo z sztuczną inteligencją!
Możesz naprawdę łatwo narysować zdjęcie!
WebUi (stabilna popularność)
Stabilność AI, wydana 22 sierpnia 2022 r., Jest modelem AI, który przekształca tekst w obraz. Ten model jest dystrybuowany jako licencja open source, co pozwala różnorodnemu użytkownikom swobodne korzystanie z niego. Po wprowadzeniu tekstu AI stabilność tworzy obraz wysokiej jakości na podstawie tego tekstu.
Adres strony internetowej :
https://stability.ai/
Charakterystyka :
Stabilna dyfuzja jest głębokim uczeniem się sztucznej inteligencji opracowanej na podstawie „badań nad syntezą obrazu w wysokiej rozdzielczości” przez laboratorium Machine Vision & Learning Group (Compvis) na Uniwersytecie Monachium w Monachium w Niemczech. Został opracowany przy wsparciu stabilności sztucznej inteligencji i wybiegu ML.
Stabilność AI to brytyjska firma o nazwie Emad Mostaque, zapewniająca zasoby obliczeniowe dla stabilnej miłej, umożliwiając naukę bazy danych Laion-5B. W przeciwieństwie do modeli tekstu do obrazu, takich jak Dall-E 2 lub Imagen, ten model można również stosować na komputerach z VRAMS 4 GB lub mniej, poprzez znacznie zmniejszenie zasobów komputerowych.
Ponadto, nawet jeśli jest drogi, jest otwarty dla open source i może być używany przez ogół społeczeństwa. Otworzyło to wiek malarstwa AI, a funkcja usługi obrazu AI oparta na modelu stale rośnie.
Możesz użyć „Controlnet” wtyczki, aby wykonać pozę. Ponadto, stosując różne modele pomocnicze Controlnet, takie jak modelki pochodzące z OpenPose, dostosowuje uprawy obszaru ciała, aby pomóc szkicu poziomu linii.
Stabilna poproszenie składa się głównie z trzech sztucznych sieci neuronowych: klip, UNET i VAE (VAE). Gdy użytkownik wchodzi do tekstu, enkoder tekstu, klip, przekształca tekst w token, który UNET może zrozumieć. UNET tworzy obraz, usuwając losowo wygenerowany szum na podstawie tokenów. Powtarzanie procesu dinoizowania tworzy dokładny obraz, a VAE odgrywa rolę w przekształcaniu tych obrazów na piksele.
W przeciwieństwie do tradycyjnego modelu tworzenia obrazu prawdopodobieństwa dyfuzyjnego, stabilna poproszenie wprowadziła incoder OTTO przed i po rozwiązaniu problemu, że zużycie zasobów rośnie wraz ze wzrostem rozdzielczości. Pozwala to stworzyć stosunkowo dużą rozdzielczość obrazu poprzez manipulowanie szumem w niewielkim poziomie potencjalnej przestrzeni, a nie na całym obrazie, i nie wymagając wielu zasobów obliczeniowych. Dlatego stabilna różnica może być używana jako zasób kart graficznych używanych w ogólnych założeniach.
Licencja:
Stabilna sztuczna inteligencja wprowadziła licencję open source [4] na nowe uczenie maszynowe. Ta licencja ma inną funkcję niż zwykła licencja open source. Jeśli zapewniasz usługę przy użyciu stabilnej popierania, użytkownik musi wyraźnie przestrzegać tej licencji. Ponadto, podczas strojenia modelu PIN, powinien być używany tylko do konkretnego użycia określonego na licencji i nie powinien być używany do innych celów.
Jak używać :
Różne projekty typu open source zostały opracowane przy użyciu stabilnej popierania. Poniżej znajduje się opis każdego projektu:
1. Stabilny interfejs internetowy internetowy: projekt, który zapewnia interfejs użytkownika opartego na sieci, aby ułatwić korzystanie ze stabilnego modelu dyfuzji. Deweloperzy nadal aktualizują i dodają różnorodne funkcje, takie jak GFPGAN CORECTION, ESRGAN Upscaling i inwersja tekstowa oprócz funkcji front end stabilnej dyfuzji.
2. Oryginalny autor: Oryginalny projekt opublikowany przez Compvis. Użyteczność jest ograniczona, dzięki czemu można ją wykorzystać do celów referencyjnych.
3. Dyfuzory: Jest to ramka dla nowego modelu dyfuzji dostarczonej przez Herging Face, słynnego dostawcę frameworków uczenia maszynowego. Zapewnia sposób, aby łatwo uczynić finutuneng stabilnej dyfuzji. Obejmuje również ramy, takie jak transformatory lub zestawy danych.
4. Poprząd: Możesz uruchomić stabilną różnicę bezpośrednio z aplikacją dla komputerów Mac. Możliwe jest wprowadzenie tekstu i obrazów, a także obsługiwane w funkcjach związanych z malowaniem i przesyłaniem. Wersja Apple Silicon wykorzystuje silnik neuronowy wewnątrz krzemowego Apple, a wersja HQ wykorzystuje GPU do zwiększenia jakości, ale prędkość jest powolna. Obsługuje także Intel Mac i będzie obsługiwał system Windows w przyszłości.
5. Rysuj rzeczy: możesz uruchomić stabilną poplinie z aplikacjami na iOS, iPados i macOS. Obsługuje trzy tryby: CPU + GPU, CPU + Silnik neuronowy, CPU + GPU + Silnik neuronowy (All). Możesz użyć punktu kontrolnego, LORA, inwersji tekstowej itp., I oferować podobną funkcję do WebUi. Funkcja ekspansji nie jest obsługiwana, a ze względu na ograniczenia pojemności pamięci aplikacja może często kończyć się z powodu braku pamięci, jeśli działa więcej niż pewna rozdzielczość zarówno na starych, jak i nowych urządzeniach.
6. Riffuzja: Jest to przykład zastosowania go do kompozycji AI za pomocą spektrogramu.
7. Danie w galerii obrazów AI: Otworzyliśmy dedykowaną galerię, która może tworzyć obrazy AI za pomocą usługi Civitai.
Powyższe projekty wykorzystują stabilną dyfuzję do tworzenia obrazów AI w różnych funkcjach i środowiskach.
Komentarze
Prześlij komentarz