Home » Meta startet ein KI-Tool, das Gegenstände in Bildern identifizieren und trennen kann

Meta startet ein KI-Tool, das Gegenstände in Bildern identifizieren und trennen kann

by Tim

Nachdem die Metaverse-Ambitionen des Unternehmens in die Brüche gegangen sind, setzt Meta nun auf KI, um seine nächste Entwicklungsstufe voranzutreiben. Eines der neuesten Projekte von Meta, das der Social-Media-Riese am Mittwoch ankündigte, nennt sich Segment Anything Model.

Segment Anything hilft den Nutzern, mit ein paar Klicks bestimmte Elemente in einem Bild zu identifizieren. Während es sich noch im Demo-Modus befindet, kann Segment Anything nach Angaben des Unternehmens bereits ein Foto aufnehmen und die Pixel, aus denen sich alles auf dem Bild zusammensetzt, einzeln identifizieren, so dass ein oder mehrere Elemente vom Rest des Bildes getrennt werden können.

„Die Segmentierung – die Identifizierung von Bildpixeln, die zu einem Objekt gehören – ist eine Kernaufgabe der Computer Vision und wird in einer Vielzahl von Anwendungen eingesetzt, von der Analyse wissenschaftlicher Bilder bis hin zur Bearbeitung von Fotos“, schrieb Meta in einem Beitrag, in dem das neue Modell angekündigt wurde.

Meta sagte, dass die Erstellung eines genauen Segmentierungsmodells für bestimmte Aufgaben hochspezialisierte Arbeit von technischen Experten mit Zugang zu KI-Trainingsinfrastrukturen und großen Mengen sorgfältig kommentierter In-Domain-Daten erfordert.

„Wir erreichen eine größere Verallgemeinerung als frühere Ansätze, indem wir einen neuen Datensatz von noch nie dagewesener Größe sammeln.“ sagte Ross Girshick, Forscher bei Meta, in einer E-Mail an TCN. „Entscheidend ist, dass wir in diesem Datensatz die Arten von Objekten, die wir annotiert haben, nicht eingeschränkt haben.

„Dank des Umfangs der Daten und ihrer Allgemeinheit zeigt unser resultierendes Modell beeindruckende Fähigkeiten, mit Bildtypen umzugehen, die während des Trainings nicht gesehen wurden, wie egozentrische Bilder, Mikroskopie oder Unterwasserfotos“, fügte Girshick hinzu.

Generative künstliche Intelligenz ist ein KI-System, das Text, Bilder oder andere Medien als Reaktion auf Aufforderungen generiert. Einige der bekanntesten Beispiele für diese Technologie sind ChatGPT von OpenAI und die digitale Kunstplattform Midjourney.

Nach Angaben von Meta wurde das Segment Anything AI-System anhand von über 11 Millionen Bildern trainiert. Wie Girshick erläuterte, stellt Meta Segment Anything der Forschungsgemeinschaft unter einer freizügigen offenen Lizenz, Apache 2.0, zur Verfügung, auf die über Segment Anything Github zugegriffen werden kann.

„Ein zentraler Aspekt der Datenschutzgesetze ist, dass die Datenerfassung transparent und mit der vollen Zustimmung des Einzelnen erfolgen muss“, erklärte Lyle Solomon, Hauptanwalt der Oak View Law Group, gegenüber TCN. „Der Einsatz von KI für die Gesichtserkennung ohne ausdrückliche Zustimmung wirft Fragen zu möglichen Verstößen gegen das Datenschutzrecht auf. Darüber hinaus sollten Unternehmen es vermeiden, Gesichtsdaten an Dritte weiterzugeben, es sei denn, die betroffene Person hat zugestimmt, und jede Weitergabe muss den datenschutzrechtlichen Bestimmungen entsprechen.“

Girshick sagt, dass sich Segment Anything in der Forschungsphase befindet und nicht geplant ist, es in der Produktion einzusetzen. Dennoch gibt es Bedenken hinsichtlich des Datenschutzes bei der möglichen Nutzung künstlicher Intelligenz.

Im Februar schwenkte Meta von seinen Plänen, ein Metaverse zu lancieren, auf andere Produkte um, darunter künstliche Intelligenz, und kündigte die Schaffung einer neuen Produktgruppe an, die sich auf generative KI konzentriert. Diese Verschiebung erfolgte, nachdem das Unternehmen nach der Beendigung seines Instagram-NFT-Projekts mehr als 10.000 Mitarbeiter entlassen hatte.

Globale Politiker, die dem Vormarsch der künstlichen Intelligenz überdrüssig geworden sind, haben nach dem Start von ChatGPT von OpenAI Bedenken geäußert und Untersuchungen über die Technologie und ihre Auswirkungen auf die Privatsphäre und Sicherheit der Nutzer eingeleitet. Italien hat den beliebten Chatbot bereits verboten.

„Viele Nutzer verstehen nicht, wie dieser Prozess abläuft und welche Folgen es langfristig haben kann, wenn ihr Gesicht ohne ihre Zustimmung zum Trainieren eines maschinellen Lernmodells verwendet wird“, sagte Kristen Ruby, Präsidentin des Beratungsunternehmens für soziale Medien und KI Ruby Media Group, gegenüber TCN.

„Die größte Herausforderung für viele Unternehmen besteht darin, Zugang zu umfangreichen Trainingsdaten zu erhalten, und es gibt keine bessere Quelle für Trainingsdaten als die, die Menschen in sozialen Netzwerken bereitstellen“, sagte sie.

Ruby schlägt vor, zu prüfen, ob ein Unternehmen eine Klausel zum maschinellen Lernen aufgenommen hat, die die Nutzer darüber informiert, wie ihre Daten verwendet werden und ob sie sich von zukünftigen Trainingsmodellen abmelden können. Sie merkt an, dass viele Unternehmen derzeit eine Opt-in-Standardeinstellung haben, die sich aber in Zukunft in eine Opt-out-Einstellung ändern kann.

„Wir haben verschiedene Techniken zur Wahrung der Privatsphäre eingesetzt, wie z. B. das Unkenntlichmachen von Gesichtern und anderen persönlichen Informationen (z. B. Nummernschilder)“, so Girshick. „Nutzer können uns anstößige Inhalte melden, indem sie eine E-Mail mit der Kennung des Bildes an segment-anything@meta.com schicken, und wir werden sie aus dem Datensatz entfernen.

Related Posts

Leave a Comment