OpenAI wprowadziło Dall-E 3, który wykorzystuje ChatGPT, aby ułatwić tworzenie poleceń. Teraz możesz modyfikować dzieła sztuki, po prostu rozmawiając z chatbotem.
DALL-E 3 i CHATGPT
OPENAI OGŁASZA Dall-E 3, najnowsze narzędzie do tworzenia sztuki AI. Wykorzystuje ono przebojowy chatbot OpenAI, ChatGPT, aby pomóc w tworzeniu bardziej złożonych i starannie skomponowanych dzieł sztuki, automatycznie rozwijając polecenie w sposób, który dostarcza generatorowi bardziej szczegółowych i spójnych instrukcji.
Nowością w Dall-E 3 jest sposób, w jaki usuwa ono część złożoności związaną z doskonaleniem tekstu, który jest kierowany do programu – znanego jako „inżynieria poleceń” – oraz sposób, w jaki pozwala użytkownikom dokonywać udoskonaleń za pośrednictwem konwersacyjnego interfejsu ChatGPT. Nowe narzędzie może pomóc obniżyć poprzeczkę dla generowania wyrafinowanej sztuki AI i może pomóc OpenAI utrzymać przewagę nad konkurencją dzięki wyższym zdolnościom swojego chatbota.
Ten rodzaj dziwacznej sztuki generowanej przez AI stał się powszechny w mediach społecznościowych dzięki liczbie narzędzi, które zamieniają tekstowe polecenie w kompozycję wizualną. Ale ten został stworzony przy znacznym wsparciu artystycznym od ChatGPT, który zamienił krótkie polecenie w bardziej szczegółowe, zawierające instrukcje, jak je poprawnie skomponować.
Duży krok na przód w OPEN AI
To duży krok naprzód nie tylko dla Dall-E, ale także dla generatywnej sztuki AI jako całości. Dall-E, zbitka wyrazowa postaci z Pixara Wall-E i artysty Salvadora Dali, ogłoszona w 2021 roku i wprowadzona w 2022 roku, składa się z algorytmu, który jest karmiony ogromnymi ilościami oznakowanych obrazów pobranych z internetu i innych źródeł. Używa tzw. modelu dyfuzji do przewidywania, jak wyrenderować obraz dla danego polecenia. Przy wystarczająco ogromnych ilościach danych może to dać złożone, spójne i estetycznie przyjemne obrazy. Różnica z Dall-E 3 polega na sposobie interakcji między ludźmi a maszynami.
Dall-E 3 jest dostępny teraz za pośrednictwem ChatGPT Plus, płatnej wersji chatbota.
W 2022 roku pojawienie się licznych generatorów sztuki AI zapoczątkowało szerszy boom generatywnej AI. Wiele z wczesnych generatorów było prymitywnych i niezdolnych do udoskonalania lub modyfikowania obrazów. Oprócz OpenAI, startupy, w tym Midjourney, Stable Diffusion i Ideogram, przyciągnęły znaczące finansowanie i zainteresowanie publiczne. Ale wykorzystanie tych systemów sztuki AI wywołało również obawy, że profesjonalni artyści ludzie mogą zostać wyparci, oraz jak firmy AI wykorzystują materiały objęte prawami autorskimi do szkolenia swoich algorytmów.
Reagując na te kontrowersje, OpenAI ogłosiło również dzisiaj, że uruchomi sposób, aby artyści mogli usunąć swoje prace z przyszłych sesji treningowych. Dall-E 3 będzie również uniemożliwiać użytkownikom próbę wygenerowania dzieła sztuki w stylu znanego artysty, wykrywając, kiedy jest to zawarte w poleceniu.
Blokada treści erotycznych podobnie jak u konkurencji
OpenAI wprowadziło również zabezpieczenia, aby zablokować użytkownikom generowanie sztuki pornograficznej lub zawierającej drastyczne sceny przemocy, a także obrazów przedstawiających postacie publiczne. Sandhini Agarwal, badaczka ds. polityki w OpenAI, mówi, że nowa wersja Dall-E przeszła jeszcze bardziej zaawansowany proces „red teaming”, który polega na próbach złamania zabezpieczeń przez badaczy. „Bardzo wyraźna prośba o treści pikantne zostanie poddana klasyfikacji i zostanie odrzucona” – mówi Agarwal. Oczywiście niektórzy programiści stworzyli otwarte generatory obrazów, które nie mają żadnych ograniczeń.
Jednym z najbardziej zauważalnych rezultatów boomu na sztukę generowaną przez AI są surrealistyczne obrazy, które zalały media społecznościowe.