Home » Deep fakes uproszczone przez sztuczną inteligencję: bliższe spojrzenie na FaceFusion.

Deep fakes uproszczone przez sztuczną inteligencję: bliższe spojrzenie na FaceFusion.

by v

W ostatnich latach w świecie mediów cyfrowych pojawił się termin „deep fakes”, który wydaje się pochodzić z science fiction: wykraczają one już daleko poza sferę animacji, takich jak kreskówka JibJab z 2004 roku. Technologia odtwarzania prawdziwych ludzi w formie dźwiękowej i wizualnej jest tak realistyczna, że coraz trudniej jest odróżnić fikcyjne treści od prawdziwych sekwencji.

Podobnie jak w przypadku korzystania z dowolnego narzędzia, kluczowe znaczenie ma intencja. Deepfakes są często wymieniane jako zagrożenie dla rządów, firm i celebrytów, ale zmiana twarzy wideo nie musi być złośliwa. To może być sztuka. Może być rozrywką.

Nie musi to być nawet łatwe. Na rynku dostępnych jest kilka narzędzi, ale większość z nich jest zbyt skomplikowana lub wyniki są mierne.

Tutaj właśnie wkracza FaceFusion. Narzędzie to może z łatwością zastąpić i odtworzyć twarze w filmie i wyróżnia się pod względem dostępności, szybkości i możliwości tworzenia realistycznych „głębokich podróbek”. Cyfrowi artyści nie muszą już ćwiczyć żmudnego mapowania, dopasowywania i zastępowania twarzy w każdym filmie – funkcja automatycznego rozpoznawania FaceFusion natychmiast zastępuje twarze i jest zarówno łatwa, jak i wydajna w użyciu.

Nie wierzysz? Obejrzyj wideo, które stworzyliśmy w ciągu zaledwie kilku minut i kilku kliknięć:

Postacie odgrywające twarz innej postaci były powszechną cechą opowiadania historii od wieków. „Głębokie podróbki” powstały u zarania kina i fotografii: od francuskiego filmu Les yeux sans visage z 1960 roku po film Face/Off z 1997 roku i serię Mission Impossible, techniki manipulacji obrazem i ruchome obrazy ewoluowały wraz z technologią.

Zwykle był to żmudny proces ręczny, a wczesne głębokie podróbki często miały słabe rysy twarzy lub oczywiste niespójności w oświetleniu i teksturach. Jednak wraz z wprowadzeniem sieci neuronowych i uczenia maszynowego technika ta wkroczyła w nową erę.

Termin „deep faking”, połączenie „deep learning” i „faking”, oddaje istotę tej techniki. Za pomocą algorytmów głębokiego uczenia się komputery nakładają obrazy i filmy na istniejące materiały.

Wraz z rozwojem technologii, deep fakes stały się bardziej realistyczne, a ich tworzenie łatwiejsze. Nowe narzędzia zdemokratyzowały proces twórczy i przeniosły tę możliwość z hollywoodzkich laboratoriów efektów specjalnych do domu i biura

Przegląd

FaceFusion

Zaprojektowany specjalnie do głębokiego udawania wideo, FaceFusion został opracowany, aby umożliwić przeciętnemu użytkownikowi komputera osiągnięcie rezultatów wcześniej zarezerwowanych dla osób z doskonałą mocą obliczeniową i doświadczeniem.

Kluczowe funkcje FaceFusion obejmują.

  • poprawiający ogólną jakość wideo.
    Elastyczne przetwarzanie z opcjami CPU lub GPU.
    Łatwy w obsłudze interfejs dla początkujących i zaawansowanych użytkowników.

Dokładność FaceFusion wynika w dużej mierze z biblioteki „insightface”, która automatycznie rozpoznaje i dokładnie zastępuje złożone rysy twarzy. (Osoby zaznajomione z deepfakes wiedzą, że insightface to technologia stojąca za Roop, niesamowitym narzędziem używanym do zastępowania twarzy na zdjęciach).

Jednym z pierwszych ograniczeń insightface była jego domyślna rozdzielczość 128×128. Doświadczeni użytkownicy ominęli jednak to ograniczenie i połączyli insightface z innymi algorytmami ulepszania twarzy, takimi jak GFPGan, Gpen i Codeformer. Deweloperzy FaceFusion zintegrowali również bibliotekę „opensfw”, która zapobiega generowaniu treści o charakterze jawnym. System został również zintegrowany z biblioteką „opensfw”, która zapobiega generowaniu treści o charakterze jednoznacznie seksualnym.

Wszystkie te elementy w połączeniu pozwalają użytkownikom udoskonalać wyniki i tworzyć wyraźne, ostre twarze. To nie tylko poprawia jakość, ale także znacznie skraca czas przetwarzania

Kreator instalacji

Wymagania sprzętowe:

Wymagany jest procesor graficzny z co najmniej 4 GB pamięci RAM. Zaleca się jednak 8 GB, aby uzyskać optymalne wyniki w rozsądnym czasie.

Instrukcja instalacji krok po kroku:

Instrukcja instalacji krok po kroku.
Najtrudniejszą częścią korzystania z FaceFusion jest instalacja. Obecnie nie ma graficznego interfejsu użytkownika, więc trzeba używać różnych poleceń terminala. Poniżej znajduje się podsumowanie z oficjalnego podręcznika.

Windows:

Przed instalacją FaceFusion zainstaluj Python 3.10, Git, Microsoft Visual C++ 2015 Redistributable i Microsoft Visual Studio 2022 Build Tools. Wykonaj następujące kroki:

    Wykonaj następujące polecenia jedno po drugim:
    winget install -e –id Python.Python.3.10
    python -m ensurepip
    winget install -e –id Git.
    winget install -e –id Gyan.FFmpeg
    close /r
    winget install -e –id Microsoft.VCRedist.2015+.x64
    winget install -e –id Microsoft.VisualStudio.2022.BuildTools –override „–wait –add Microsoft.VisualStudio.Workload.NativeDesktop — includeRecommended”. includeRecommended”.
    (Bardziej szczegółowe instrukcje można znaleźć w dołączonej dokumentacji).

Użytkownicy kart Nvidia powinni również zainstalować najnowszą wersję zestawu narzędzi CUDA z tego adresu URL oraz bibliotekę cuDNN z tego adresu URL.

    Aby zainstalować FaceFusion, przejdź do katalogu instalacyjnego FaceFusion i uruchom następujące polecenie terminala
    git clone https://github.com/facefusion/facefusion
  1. Po zainstalowaniu wymaganych komponentów należy utworzyć środowisko Python, w którym można bezpiecznie uruchomić FaceFusion. Kroki są następujące:
      Utwórz folder, w którym zostanie zainstalowany FaceFusion.
  2. Otwórz terminal w tej lokalizacji.
    Wykonaj kolejno następujące polecenia:

python -m venv
Aktywuj venv.
Następnie zainstaluj biblioteki Pythona wymagane dla FaceFusion:
python install.py
Teraz jesteś gotowy do pracy! Otwórz terminal w katalogu instalacyjnym i uruchom FaceFusion:
python run.py
Po zakończeniu uruchamiania terminal zwróci lokalny adres URL, np. http://127.0.0.1:7860/. Skopiuj go i otwórz w przeglądarce. Skopiuj ten adres URL i otwórz go w przeglądarce, aby uruchomić deepfake!

MacOS:

MacOS jest dostępny w dwóch wersjach: starszy model z procesorem Intela i nowszy model z krzemem M1 firmy Apple. Instalacja jest taka sama dla obu, a dostarczone skrypty poprowadzą Cię przez cały proces.

Podobnie jak w przypadku systemu Windows, użytkownicy komputerów Mac muszą zainstalować kilka komponentów przed użyciem FaceFusion:

    Po wyświetleniu monitu wybierz typ komputera Mac, na którym chcesz zainstalować zależność. Następnie uruchom następujące polecenie:
    Install: pip install -r requirements.txt.
  1. Aby uruchomić FaceFusion, upewnij się, że terminal znajduje się w folderze FaceFusion i uruchom następujące polecenie:
    python run.py.
  2. Pojawi się adres URL, na przykład http://127.0.0.1:7860/. Skopiuj i wklej ten adres URL do przeglądarki, aby rozpocząć generowanie głębokich podróbek.

Uwaga: Jeśli polecenia python lub pip nie działają, spróbuj użyć python3 lub pip3.

Podręcznik użytkownika

Wizualny interfejs użytkownika FaceFusion jest świeży i intuicyjny, w przeciwieństwie do instalacji z linii poleceń.
Źródło: FaceFusion

Źródło: FaceFusion

Jak korzystać z FaceFusion:

  1. Importuj żądane wideo: przeciągnij je do pola „TARGET” lub kliknij „TARGET”, aby wybrać je w wyskakującym okienku.
    Nowo utworzony film jest wyświetlany w sekcji „TARGET” i oznaczony jako „OUTPUT”. Użyj strzałek w prawym górnym rogu podglądu, aby zapisać.
    Rozpoznawanie twarzy: „Przeglądaj” zastępuje wyświetlaną twarz twarzą „źródłową”. „Wiele” rozpoznaje wszystkie twarze w filmie i zastępuje je twarzami ze „Źródła”, zapobiegając niepoprawnemu rozpoznawaniu przez model twarzy z różnych obrazów.

Wskazówki dla uzyskania najlepszych wyników:

  1. Używaj wysokiej jakości obrazów centralnych.
    Unikaj zdjęć z okularami, kapeluszami lub innymi przeszkodami.
  2. Unikaj zdjęć z przesadną mimiką twarzy.
    Unikaj głęboko udawanych filmów, które obejmują krzyk, szerokie otwieranie ust lub zakrywanie twarzy (dotykanie twarzy, noszenie okularów, picie czegoś).
    Pamiętaj, że to narzędzie potrzebuje czasu na przetworzenie każdej klatki filmu. Pamiętaj, że filmy mają od 24 do 60 klatek na sekundę lub więcej i powinieneś poeksperymentować z krótszymi filmami, zanim przejdziesz do dłuższych Filmy TikTok są dobrym punktem wyjścia i możesz również użyć tego narzędzia do stworzenia filmu, który ma więcej niż 24 klatki na sekundę, ale nie więcej niż 60 klatek na sekundę.

FaceFusion

App.
W świecie deepfake’ów FaceFusion wyraźnie się wyróżnia. Po licznych testach jest jasne, że FaceFusion zapewnia wyniki: wykorzystanie biblioteki insightface upraszcza zastępowanie twarzy, optymalizując wydajność i wrażenia użytkownika. Godne pochwały jest również etyczne zobowiązanie do niegenerowania treści NSFW. Warto również wspomnieć, że system nie generuje treści NSFW.

Z perspektywy użytkownika, możliwość pracy lokalnej jest nieoceniona. W czasach rosnących obaw o prywatność, niezależność od zasobów w chmurze jest mile widzianą funkcją. Przyszłe wersje powinny jednak zapewniać bardziej przyjazny dla użytkownika graficzny interfejs użytkownika, zwłaszcza podczas początkowej instalacji.

FaceFusion podniosło globalne oczekiwania wobec technologii deepfake i zdemokratyzowało proces rozwoju z zabezpieczeniami etycznymi.
Najważniejsze informacje:

    Zaawansowane funkcje: faceFusion jest prawdopodobnie najlepszym narzędziem na rynku do wewnętrznego deep fake’owania, przewyższając wielu swoich konkurentów dzięki innowacyjnym algorytmom i funkcjom.
    Funkcje lokalne.
    Skrócony czas szkolenia: w przeciwieństwie do wielu innych narzędzi, które wymagają długiego szkolenia, FaceFusion znacznie skraca wymagany czas.
    Środki bezpieczeństwa.

Słabe strony:

    Intuicyjność: pomimo zaawansowanych funkcji, FaceFusion może być onieśmielający dla nowych użytkowników; repozytorium Github ostrzega użytkowników, że „instalacja wymaga umiejętności technicznych i nie jest odpowiednia dla początkujących”.
    Komunikacja z deweloperami: przekierowywanie użytkowników z platform takich jak GitHub na Discord niekoniecznie jest preferowanym przez wszystkich rozwiązaniem komunikacyjnym.
    Brak interfejsu graficznego: graficzny interfejs instalacji sprawiłby, że proces ten byłby przyjemniejszy dla nowicjuszy i osób niezaznajomionych z wierszem poleceń.

Dlaczego nie powinieneś być superbohaterem lub supergwiazdą? Możesz nie być artystą CGI, ale z FaceFusion prawie możesz nim być

Related Posts

Leave a Comment