Nowy program Google Brain wprost z amerykańskich filmów

arstechnica.co.uk

arstechnica.co.uk

Nowa technologia Google Brain jest niczym wyjęta z amerykańskich filmów. Dzięki połączeniu dwóch sieci neuronowych, program odtwarza szczegółowe zdjęcie z niewyraźnych pikseli. Warto przyjrzeć się temu przełomowemu odkryciu.

Google Brain stworzył program wypełniający piksele, dzięki czemu przybliżony obraz staje się o wiele bardziej wyraźniejszy. Google przetestowało jego działanie skalując niewielkie fotografie do kwadratów o rozmiarze 64 pikseli. Oczywiście odtworzenie oryginalnego zdjęcia nie jest możliwe. Program nie tyle je wyostrza, co szacuje jak ewentualnie mogłoby wyglądać. Próbuje odgadnąć konkretne obiekty i w ten sposób wypełnia piksele.

Jak to działa?

Program w sprytny sposób łączy dwie sieci neuronowe. Po pierwsze przeszukuje podobne zdjęcia o dobrej rozdzielczości. Po znalezieniu obrazu, zmniejsza go do rozmiarów pliku wyjściowego. Następnie porównuje oraz definiuje znajdujące się na nim elementy. Program niejako próbuje dopasować piksele do tego co już „wie” na temat danej fotografii. Na przykład, brązowa kropka w górnej części może oznaczać brew, dlatego program identyfikuje go właśnie w taki sposób. Druga sieć neuronowa natomiast, zajmuje się tworzeniem obrazu o wyższej rozdzielczości. Wykorzystuje się tu implementację PixelCNN. Brakujące elementy są uzupełniane przez fragmenty lub poszczególne kolory, na podstawie danych dostarczonych przez pierwszą sieć neuronową.

arstechnica.co.uk

arstechnica.co.uk

Jak to wygląda?

W lewej kolumnie znajdują się piksele o wymiarach 8×8 zdjęć źródłowych. Środkowa zawiera obrazy stworzone przez Google Brain, które program był w stanie utworzyć ze zdjęć źródłowych. W prawej – rzeczywiste fotografie dla porównania. Jak zatem można zauważyć, program jest w stanie utworzyć niesamowitą liczbę szczegółów. Aby powstał wizerunek o lepszej rozdzielczości, oba neurony muszą się wzajemnie przenikać. Ważne jest, aby pamiętać, że stworzony przez Google Brain obraz, nie jest autentycznym odwzorowaniem pierwotnego zdjęcia – umożliwia jedynie dodanie szczegółów i jego wyostrzenie.

super-resolution-other-techniques

Efekty pracy Google Brain przypominają technologię z amerykańskich filmów kryminalnych. Chociaż program nie osiąga aż tak spektakularnych efektów, to i tak robi ogromne wrażenie. Być może w przyszłości filmowa technologia na stałe wkroczy do realnego świata.


Bądź na bieżąco!
Zapisz się na nasz bezpłatny newsletter.