Home » Seznamte se s PassGPT, umělou inteligencí vycvičenou na milionech uniklých hesel

Seznamte se s PassGPT, umělou inteligencí vycvičenou na milionech uniklých hesel

by Tim

Výzkumníci z ETH Zürich, Swiss Data Science Center a SRI International v New Yorku využili výkon architektury GPT-2 OpenAI k vývoji PassGPT, modelu pro hádání hesel postaveného na velkém jazykovém modelu (LLM). A je vycvičen na souboru uniklých hesel z různých hackerských útoků a zneužití.

Hlavním záměrem PassGPT je dekódovat kryptické rysy zakořeněné v labyrintu hesel vytvořených člověkem, to vše s cílem poskytnout uživatelům silnější a složitější hesla k použití a detekovat pravděpodobná hesla podle sady vstupů. Inovativnost modelu spočívá nejen v jeho prediktivní schopnosti, ale také v jedinečném způsobu tvorby.

Na rozdíl od předchozích modelů, které vytvářely hesla jako ucelené entity, PassGPT zavádí inovativní strategii: postupné vzorkování. Tato metoda vytváří hesla znak po znaku, čímž zajišťuje pečlivou komplexnost hesla, a byla vyškolena na souboru milionů dříve uniklých hesel.

„PassGPT, vycvičený na úniku RockYou, dokáže uhodnout o 20 % více neznámých hesel než nejmodernější modely GAN,“ poznamenal tvůrce Javi Rando.

Představte si generativní adverzní sítě (GAN) jako zápas dvou sítí. Jedna z nich, Generátor, se snaží vytvořit obsah, který je natolik realistický, že dokáže oklamat druhou, Diskriminátor, jehož cílem je zjistit, kdy je mu předkládán umělý obsah. V každém kole tohoto zápasu se každá síť učí ze svých chyb a zlepšuje se. Celková kvalita modelu se zvyšuje, dokud nedosáhne bodu, kdy Diskriminátor jen stěží rozliší, co je skutečné a co vytvořil Generátor.

Rando také poukázal na jedinečnost hesel generovaných PassGPT, jak vysvětlil, jedná se o „explicitní generativní model, který nám umožňuje přistupovat k modelovanému rozdělení a vypočítat pravděpodobnost libovolného hesla podle tohoto modelu. Tuto schopnost využíváme k analýze zranitelnosti síly hesla.“

PassGPT má výrazný talent na odhalování vzorů, které jsou podle odhadů síly hesla považovány za silné, ale které lze poměrně snadno uhodnout pomocí generativních technik.

„Neanglická hesla jsou pro heuristiku založenou na slovníku obtížná, ale PassGPT se učí vzory v různých jazycích,“ vysvětlil Rando. Tato vícejazyčná znalost nastavuje nové měřítko ve výzkumu bezpečnosti hesel. Model také prokázal schopnost hádat nová hesla, která nejsou součástí jeho datového souboru.

Je pozoruhodné, že modely LLM, jako je PassGPT, lze přizpůsobit na míru s použitím různých datových sad pro konkrétní aplikace. Příkladem může být např: Google trénuje AI LLM na základě lékařských dat, zatímco další zajímavé výsledky se objevily z LLM trénovaných na různých tématech, jako je politicky nekorektní jazyk z 4Chan nebo nuance ve stylu řeči populárních youtuberů.

Zajímavé je, že úniky hesel nejsou jen výhodou pro hackery, kteří hledají přístup do systému. Poskytují také výzkumníkům příležitost prozkoumat skryté vzorce v heslech generovaných uživateli, což má potenciál vylepšit nástroje pro prolamování hesel. Na světlo se tak dostává paradoxní aspekt zabezpečení hesel.

Doména strojového učení (ML) se ukázala být nápomocná při získávání cenných poznatků z rozsáhlých úniků hesel. Tato extrakce pohání důležitý vývoj v oblasti hádání hesel a vyladění algoritmů pro odhad síly hesla.

Na tomto pozadí dosáhly velké jazykové modely (LLM) významného pokroku ve zpracování a porozumění přirozenému jazyku, v čele s modely typu generativního předtrénovaného transformátoru (GPT) – včetně PaLM a LLaMA.

Upozorňujeme, že ačkoli je tento PassGPT legitimním výtvorem, dříve se objevil aprílový žertík stejného jména – buďte tedy při vlastním výzkumu opatrní.

PassGPT je dalším důkazem toho, že stále častěji existuje umělá inteligence pro všechno. A s umělou inteligencí, jako je PassGPT, možná brzy zjistíte, že jméno vaší kočky v kombinaci s datem narození už není nerozluštitelnou pevností hesla, jak jste si kdysi mysleli.

Related Posts

Leave a Comment