Vad är LLM (Large Language Model)?

Stora språkmodeller (LLM) är en banbrytande utveckling inom NLP (Natural Language Processing) som är utformad för att förstå och generera mänskligt språk. LLM är avancerade AI-modeller som tränas på stora mängder textdata, vilket gör det möjligt för dem att känna igen språkliga mönster, förstå sammanhang och producera sammanhängande och kontextuellt relevanta svar. Medan NLP tillhandahåller de grundläggande teknikerna för att maskiner ska kunna hantera språk, representerar LLM en specialiserad metod som avsevärt har förbättrat maskinens förmåga att efterlikna mänsklig språkförståelse och generering…

Vilka LLM:er finns idag?

LLM representerar gränsen för bearbetning av naturligt språk, och flera modeller dominerar för närvarande utrymmet, inklusive Googles Gemini, Metas Galactica och

Llama, OpenAI:s GPT-serie och andra som Falcon 40B och Phi-1. Med varierande arkitektur och parameterstorlekar utmärker sig dessa modeller för uppgifter som sträcker sig från att svara på frågor till att generera sammanhängande och kontextuellt relevant text över långa passager.

BERT, som introducerades av Google, lade den grundläggande grunden med sin

transformator baserade arkitektur. Å andra sidan riktar sig Meta’s Galactica, en nykomling, uttryckligen till det vetenskapliga samfundet samtidigt som den granskas för att producera vilseledande ”hallucinationer” som kan ha djupgående konsekvenser inom det vetenskapliga området. Under tiden har OpenAI:s GPT-serie, särskilt GPT-3 och GPT-4, har varit banbrytande i sin kapacitet, där den senare ryktas innehålla över 170 biljoner parametrar och förmågan att bearbeta både text och bilder. Den här modellens

ledde till spekulationer om att närma sig artificiell allmän intelligens (AGI), en teoretisk maskinförmåga som är i nivå med eller överträffar mänsklig intelligens.

Utmaningarna kvarstår dock. Modellernas stora omfattning och komplexitet kan leda till oförutsägbara resultat, och de enorma utbildningsbehoven gör att oro för miljömässig hållbarhet och snedvridna resultat.

Men trots oron lovar utvecklingen av framsteg inom olika sektorer – från vardagliga uppgifter som förbättringar av webbsökningar till kritiska områden som medicinsk forskning och cybersäkerhet. I takt med att området utvecklas är balansen mellan potential och försiktighet fortfarande av största vikt.

Hur fungerar LLM:er

För att förstå och generera människoliknande språk använder det en kombination av neurala nätverk, stora träningsdataset och en arkitektur som kallas transformers.

Neurala nätverk

Kärnan i stora språkmodeller är neurala nätverk med flera lager, så kallade djupinlärningsmodeller. Dessa nätverk består av sammankopplade noder, eller neuroner, som lär sig att känna igen mönster i indata under träningsfasen. LLM:er tränas på en massiv textmassa som omfattar olika källor som webbplatser, böcker och artiklar, vilket gör att de kan lära sig grammatik, syntax, semantik och kontextuell information.

Med hjälp av algoritmer som är utformade för att känna igen mönster tolkar neurala nätverk sensoriska data genom en slags maskinell perception, märkning eller klustring av råa indata. Arkitekturen i neurala nätverk sträcker sig från enkla , där anslutningarna mellan noderna inte bildar en cykel, till komplexa strukturer med sofistikerade lager och flera återkopplingsslingor.

Konvolutionella neurala nätverk (CNN): Dessa är särskilt effektiva för att bearbeta data med en rutnätsliknande topologi. Exempel på detta är bilddata, som kan betraktas som ett 2D-rutnät av pixlar.
Återkommande neurala nätverk (RNN): Dessa lämpar sig för sekventiella data som text och Utdata vid varje steg beror på föregående

beräkningar och en viss typ av minne om vad som hittills har bearbetats.

Transformatorer

Transformatorarkitekturen är en kritisk komponent i LLM:er och introducerades av Vaswani et al. 2017. Transformatorer hanterar begränsningarna hos tidigare sekvensmodeller som RNNs och LSTMs, som kämpade med långdistansberoenden och parallellisering.

Transformers använder en mekanism som kallas självuppmärksamhet, som gör det möjligt för modellen att väga betydelsen av olika ord i inmatningskontexten och fånga relationer mellan dem, oavsett deras avstånd i sekvensen.

Tokenisering

Tokenisering är det första steget i bearbetningen av text med en . Den inmatade texten delas upp i mindre enheter som kallas tokens, som sedan konverteras till numeriska representationer (vektorer) som det neurala nätverket kan bearbeta. Under träningen lär sig modellen att generera kontextuellt lämpliga utdatatokens baserat på inmatningstokens och deras relationer.

Träningsprocessen innebär att man justerar vikterna i det neurala nätverket kopplingar genom en teknik som kallas backpropagation. Genom att minimera skillnaden mellan modellens förutsägelser och de faktiska målsymbolerna i träningsdata lär sig modellen att generera ett mer korrekt och sammanhängande språk.

När stora språkmodeller har tränats kan de finjusteras för specifika uppgifter eller domäner, t.ex. sentimentanalys, sammanfattning eller frågesvar, genom att modellen tränas under en kort period på ett mindre, uppgiftsspecifikt dataset. Denna process gör det möjligt LLM att anpassa sin generaliserade språkförståelse till nyanserna och kraven för den aktuella uppgiften.

Relaterad artikel: Artificiell intelligens förklarad

Fördelar med LLM

Stora språkmodeller erbjuder ett brett utbud av fördelar, bland annat:

Avancerad förståelse av naturligt språk: kan förstå sammanhang och nyanser i språket, vilket gör deras svar mer relevanta och människolika.
Mångsidighet: kan tillämpas på olika uppgifter, till exempel textgenerering, sammanfattning, översättning och frågesvar, utan att det krävs uppgiftsspecifik utbildning.
Översättning: LLM:er som är utbildade i flera språk kan effektivt översätta mellan Vissa teorier går ut på att de till och med kan härleda betydelser från okända eller förlorade språk baserat på mönster.
Automatisering av vardagliga uppgifter: kan utföra textrelaterade uppgifter som att sammanfatta, omformulera och generera innehåll, vilket kan vara särskilt användbart för företag och innehållsskapare.
Framväxande förmågor: På grund av den stora mängd data som tränas på kan de uppvisa oväntade men imponerande förmågor, som att räkna i flera steg, svara på komplexa frågor och generera
Felsökning och kodning: Inom cybersäkerhet kan hjälpa till att skriva och felsöka kod snabbare än med traditionella
Analys av hotmönster: Inom cybersäkerhet kan identifiera mönster relaterade till avancerade ihållande hot, vilket underlättar tillskrivning av incidenter ochb egränsning i realtid.
Automatisering av svar: I Security Operations Centers kan automatisera svar, generera skript och verktyg samt hjälpa till med rapportskrivning, vilket minskar den tid som säkerhetspersonal lägger på rutinuppgifter.

Trots dessa fördelar är viktigt att komma ihåg att utbildningen har nackdelar och etiska överväganden som måste hanteras.

Utmaningar med LLM

Även om det är lätt att fastna för de fördelar som en imponerande språkkunskaper ger, måste organisationerna också vara medvetna om och beredda att ta itu med de potentiella utmaningar som följer med dem.

Operativa utmaningar

Hallucinationer: kan ibland producera bisarra, osanna resultat eller ge ett intryck av känslighet. Dessa utdata är inte baserade på modellens träningsdata och kallas ”hallucinationer”.
Partiskhet: Om en tränas på partisk data kan dess resultat vara diskriminerande eller partisk mot vissa grupper, raser eller klasser. Även efter träning kan fördomar utvecklas baserat på användarinteraktioner. Microsofts Tay är ett ökänt exempel på hur fördomar kan manifesteras och eskalera.
Glitch Tokens eller Adversarial Examples: Dessa är specifika ingångar utformade för att få modellen att producera felaktiga eller vilseledande resultat, vilket i praktiken får modellen att ”fungera felaktigt”.

Bristande förklaringsförmåga: Det kan vara svårt att förstå hur LLM:er fattar vissa beslut eller genererar specifika resultat, vilket gör det svårt att felsöka eller förbättra dem.
Överdriven tillit: I takt med att LLM:erna blir mer integrerade i olika sektorer finns det en risk för överdriven tillit, vilket kan leda till att mänsklig expertis och intuition åsidosätts.

LLM-användningsfall och distributionsalternativ

LLM erbjuder organisationer ett antal valfria implementeringsmönster, vart och ett beroende av en annan uppsättning verktyg och relaterade säkerhetsimplikationer.

Användning av förtränade LLM:er

Molnleverantörer som OpenAI och Anthropic erbjuder API-åtkomst till kraftfulla som de hanterar och säkrar. Organisationer kan utnyttja dessa API:er för att införliva funktioner i sina applikationer utan att behöva hantera den underliggande infrastrukturen.

Alternativt kan med öppen källkod, som Metas LLaMa, köras på en organisationens egen infrastruktur, vilket ger mer kontroll och anpassningsmöjligheter. Nackdelen är att med öppen källkod kräver betydande beräkningsresurser och AI-expertis för att implementeras och underhållas på ett säkert sätt.

LLMs modeller för driftsättning

API-baserad SaaS: Infrastrukturen tillhandahålls och hanteras av LLM- utvecklaren (t.ex. OpenAI) och tillhandahålls via ett offentligt API.
Hanteras av CSP: distribueras på infrastruktur som tillhandahålls av molntjänstleverantören hyperscalers och kan köras i ett privat eller publika moln, till exempel Azure, OpenAI och Amazon Bedrock.

Självhanterad: LLM distribueras på företagets egen infrastruktur, vilket endast är relevant för modeller med öppen källkod eller egenutvecklade modeller.

Förutbildade LLM:er erbjuder olika funktioner – innehållsgenerering, chatbottar, sentimentanalys, språköversättning och kodassistenter. Ett e-handelsföretag kan använda en LLM för att generera produktbeskrivningar, medan ett programvaruföretag kan använda en LLM för att företag kan utnyttja en LLM-driven kodningsassistent för att öka programmerarnas produktivitet.

Säkerhetsimplikationer förknippade med förtränade LLM:er

Tillgången till lättillgängliga moln-API:er och modeller med öppen källkod har dramatiskt sänkt trösklarna för att lägga till avancerade AI-språkfunktioner i applikationer. Utvecklare kan nu plugga in LLM:er i sin programvara utan att behöva djup expertis inom AI och ML. Samtidigt som detta påskyndar innovation ökar det risken för skugg-AI-projekt som saknar ordentlig övervakning av säkerhet och efterlevnad.

Samtidigt kan utvecklingsteam experimentera med utan att fullt ut beakta frågor som rör datasekretess, modellstyrning och kontroll av utdata.

Finjustering och RAG (Retrieval-Augmented Generation)

För att anpassa till specifika applikationer kan organisationer finjustera dem på mindre dataset som är relaterade till den önskade uppgiften eller implementera RAG, vilket innebär att LLM:er integreras med kunskapsbaser för frågesvar och innehållssammanfattning.

Exempel på användningsområden för dessa är specialiserade AI-assistenter med tillgång till interna data (t.ex. för kundsupport, HR eller IT-helpdesk) och appar för frågor och svar (t.ex. för dokumentation),

kodarkiv eller utbildningsmaterial). Till exempel kan en telekommunikations företagets kundtjänstchattbot kan finjusteras med hjälp av produktdokumentation, vanliga frågor och svar eller tidigare supportinteraktioner för att bättre kunna hjälpa kunderna med tekniska frågor och kontohantering.

Säkerhetsimplikationer i samband med finjustering och RAG

Finjustering och RAG gör det möjligt för organisationer att anpassa till sin specifika domän och data, vilket möjliggör mer riktade och exakta resultat. Men denna anpassning

Processen innebär ofta att modellen exponeras för känslig intern information under utbildningen. Starka datastyrningsmetoder krävs för att säkerställa att endast auktoriserade data används för finjustering och att de resulterande modellerna är säkrade.

Maskininlärning (LM)

Vissa stora teknikföretag och forskningsinstitut väljer att investera i utbildning av sina egna . Även om detta är en mycket resurskrävande process som

kräver massiv datorkraft och stora datamängder, ger det organisationerna full kontroll över modellarkitekturen, träningsdata och optimeringsprocessen. Dessutom behåller organisationen fullständiga immateriella rättigheter till de resulterande modellerna.

Modellträning kan resultera i avancerade tillämpningar som läkemedelsupptäckt, materialvetenskap eller autonoma system. En sjukvårdsorganisation kan till exempel utveckla en modell som hjälper till att diagnostisera sjukdomar utifrån medicinska journaler och bilddata.

Säkerhetsimplikationer i samband med modellutbildning

Utbildning av anpassade väcker svåra frågor om hur man upprätthåller ansvarighet och granskningsbarhet för modellbeteende när man har att göra med komplexa blackbox-modeller. Själva utbildningsprocessen förbrukar enorma beräkningsresurser, vilket kräver stark isolering och åtkomstkontroller runt utbildningsmiljön för att förhindra missbruk eller störningar. Först måste organisationen bygga upp en infrastruktur för högpresterande databehandling och noggrant hantera stora datamängder, vilket kan medföra nya säkerhetsutmaningar.

LLM Säkerhetsfrågor

Ett av de största problemen med att använda stora språkmodeller i företagsmiljöer är att de kan innehålla känsliga uppgifter under utbildningen. När data väl har införlivats i dessa modeller blir det utmanande att urskilja exakt vilken information som matades in i dem. Denna brist på synlighet kan vara problematisk med tanke på de otaliga datakällor som används för utbildning och de olika individer som kan komma åt dessa data.

Att säkerställa insyn i datakällorna och upprätthålla strikt kontroll över vem som har tillgång till dem är avgörande för att förhindra oavsiktlig exponering av konfidentiell information.

Ett ytterligare problem är det potentiella missbruket av i cyberattacker. Skadliga aktörer kan använda LLM:er för att skapa övertygande phishing-meddelanden för lura individer och få obehörig tillgång till känsliga uppgifter. Den här metoden, som kallas social ingenjörskonst, har potential att skapa övertygande och vilseledande innehåll, vilket ökar utmaningarna med dataskydd.

Utan rigorösa åtkomstkontroller och skyddsåtgärder ökar risken för betydande dataintrång, och illasinnade aktörer får möjlighet att enkelt sprida felaktig information, propaganda eller annat skadligt innehåll.

Även om har nästan oändliga positiva tillämpningar, har de potential att skapa skadlig kod och kringgå konventionella filter för att förhindra sådana beteenden. Denna känslighet kan leda till en ny era av cyberhot där dataläckor inte bara handlar om att stjäla information utan även om att generera farligt innehåll och koder.

Om manipuleras kan de till exempel producera skadlig programvara, skript eller verktyg som kan äventyra hela system. Deras potential för ”belöningshackning” väcker oro inom cybersäkerhetsdomänen, vilket tyder på oavsiktliga metoder för att uppfylla deras

mål kan upptäckas, vilket kan leda till oavsiktlig åtkomst till eller insamling av känsliga uppgifter.

Eftersom vi förlitar oss mer på LLM-applikationer blir det absolut nödvändigt för organisationer och individer att vara vaksamma på dessa nya hot och alltid vara beredda att skydda data.

OWASP:s tio bästa: Säkerhetsrisker för LLM

Sårbarheter i konventionella applikationer utgör en ny typ av säkerhetsrisker inom LLM. Men OWASP levererade, sin trogen, OWASP Top Ten Security Risks i rätt tid och varnade utvecklare för nya mekanismer och behovet av att anpassa traditionella åtgärdsstrategier för sina applikationer som använder .

LLM01: Snabb injektion

Promptinjektion kan manipulera en stor språkmodell genom försåtliga inmatningar, vilket får LLM att utföra angriparens avsikter. Med direkta injektioner skriver den onda skådespelaren över systeminstruktioner. Med indirekta promptinjektioner kan angripare manipulera indata från externa källor. Båda metoderna kan leda till exfiltrering av data, social ingenjörskonst och andra problem.

LLM02: Osäker hantering av utdata

Osäker utdatahantering är en sårbarhet som uppstår när en LLM-utdata accepteras utan granskning, vilket exponerar backend-system. Det uppstår när en nedströmskomponent blint accepterar LLM-utdata utan effektiv granskning. Missbruk kan leda cross-site scripting (XSS) och cross-site request forgery (CSRF) i webbläsare, samt server-side request forgery (SSRF), privilegieeskalering och fjärrkörning av kod i backend-system.

LLM03: Förgiftning av träningsdata

Förgiftning av utbildningsdata inträffar när LLM-utbildningsdata manipuleras via Common Crawl, WebText, OpenWebText, böcker och andra källor. Manipuleringen introducerar bakdörrar, sårbarheter eller fördomar som äventyrar LLM:s säkerhet och resulterar i prestandaförsämring, utnyttjande av programvara i senare led och skada på anseendet.

Modell för vägran att tillhandahålla tjänster

Model Denial of Service inträffar när en angripare utnyttjar en LLM för att utlösa en resurskrävande drift, vilket leder till försämrad service och ökade kostnader.

Denna sårbarhet förstärks av LLM-programmens krävande karaktär och den oförutsägbara karaktären hos användarens inmatningar. I ett modellscenario för överbelastningsattack interagerar en angripare med en LLM på ett sätt som kräver en oproportionerligt stor mängd resurser, vilket leder till försämrad tjänstekvalitet för både angriparen och andra användare samtidigt som det potentiellt kan generera betydande resurskostnader.

Sårbarheter i leveranskedjan

Sårbarheter i leveranskedjan för LLM kan äventyra träningsdata, ML-modeller och distributionsplattformar och orsaka säkerhetsöverträdelser eller totala systemfel. Sårbara komponenter eller tjänster kan uppstå genom förgiftade träningsdata, osäkra plugins, föråldrad programvara eller känsliga förtränade modeller.

Utlämnande av känslig information

LLM-applikationer kan exponera känsliga data, konfidentiell information och proprietära algoritmer, vilket kan leda till obehörig åtkomst, stöld av immateriella rättigheter och dataintrång. För att minska dessa risker bör LLM-applikationer använda sig av datasanering, implementera lämpliga strikta användarpolicyer och begränsa de typer av data som returneras av LLM.

Osäker plugin-design

Plugins kan innehålla osäkra ingångar och otillräcklig åtkomstkontroll, vilket gör dem

kan utsättas för skadliga förfrågningar som kan leda till exfiltrering av data, exekvering

av fjärrkod och eskalering av privilegier. Utvecklare måste följa strikta riktlinjer för parametriserade indata och säker åtkomstkontroll för att förhindra utnyttjande.

Överdriven byrå

Överdrivet handlingsutrymme innebär att LLM-baserade system vidtar åtgärder som leder till oavsiktliga konsekvenser. Sårbarheten härrör från att LLM ges för mycket autonomi, överfunktionalitet eller överdrivna behörigheter. Utvecklare bör begränsa plugin-funktionalitet till vad som är absolut nödvändigt. De bör också spåra användarauktorisering, kräva mänskligt godkännande för alla åtgärder och implementera auktorisering i nedströms system.

Överdriven tillit

En LLM kan generera olämpligt innehåll när mänskliga användare eller system i alltför hög grad förlitar sig på LLM utan att tillhandahålla lämplig tillsyn. Potentiell konsekvenserna av LLM09 inkluderar felaktig information, säkerhetsproblem och juridiska frågor.

Stöld av modell

Stöld av LLM-modeller innebär obehörig åtkomst, kopiering eller exfiltrering av äganderättsligt skyddade LLM:er. Modellstöld resulterar i ekonomisk förlust och förlust av konkurrensfördelar, liksom ryktesskada och obehörig åtkomst till känsliga uppgifter. Organisationer måste vidta strikta säkerhetsåtgärder för att skydda sina egenutvecklade LLM:er.

Vanliga frågor om Large Model Language

Vilka är säkerhetsaspekterna för LLM?

För att skydda din LLM ska du implementera en mångfacetterad säkerhetsmetod som omfattar stark åtkomstkontroll, begränsning av åtkomst till nätverksresurser via nätverkssegmentering och säkra sandlådor, kontinuerlig resursövervakning och rutinmässig granskning av loggar och LLM-associerade aktiviteter.
Hur ser LLM-modellens struktur ut?
Hur börjar man skapa en LLM?
Vad är skillnaden mellan en NLP- och en LLM-utbildning?

NLP är ett delområde inom AI och lingvistik som fokuserar på att göra det möjligt för datorer att förstå, tolka och generera mänskligt språk. NLP omfattar ett brett spektrum av

NLP kan användas för en rad olika uppgifter, bland annat sentimentanalys, maskinöversättning, textsammanfattning och named entity recognition. NLP-tekniker involverar vanligtvis beräkningsalgoritmer, statistisk modellering och maskininlärning för att bearbeta och analysera textdata.

En LLM är en typ av djupinlärningsmodell, särskilt ett neuralt nätverk, som är utformad för att hantera NLP-uppgifter i stor skala. LLM:er, som GPT-3 och BERT, tränas på stora mängder textdata för att lära sig komplexa språkmönster, grammatik och semantik. Dessa modeller utnyttjar en teknik som kallas transformatorarkitektur, vilket gör det möjligt för dem att fånga långväga beroenden och kontextuell information i språket.

Den främsta skillnaden mellan NLP och LLM är att NLP är ett bredare område som omfattar olika tekniker och metoder för bearbetning av mänskligt språk, medan LLM är en specifik typ av neuronnätsmodell som är utformad för avancerade NLP-uppgifter.

LLM representerar en toppmodern metod inom NLP-domänen och erbjuder förbättrad prestanda och förmåga att förstå och generera människoliknande språk jämfört med traditionella NLP-metoder.
Vad är en utbildningsmodell?

En träningsmodell inom maskininlärning avser processen att utveckla en matematisk representation som kan göra förutsägelser eller fatta beslut baserat på indata. Genom att mata en modell med märkta träningsdata lär den sig att känna igen mönster, relationer och funktioner som gör det möjligt för den att generalisera och göra korrekta slutsatser om tidigare osedda data. Träningsprocessen innebär att man justerar modellens parametrar iterativt för att minimera fel och förbättra prestandan. När modellen har uppnått tillfredsställande noggrannhet och generaliseringsförmåga kan den användas för att lösa verkliga problem, t.ex. bildigenkänning, bearbetning av naturligt språk eller förutsägelse av kundbeteende.
Vad är artificiell intelligens (AI)?

Artificiell intelligens (AI) är en gren av datavetenskapen som fokuserar på att skapa intelligenta system som kan simulera mänskliga kognitiva förmågor, såsom problemlösning, mönsterigenkänning och beslutsfattande. Genom att utnyttja algoritmer, data och beräkningskraft kan AI-system lära sig av erfarenhet, anpassa sig till ny information och utföra uppgifter som vanligtvis kräver mänsklig intelligens.

Dessa system har tillämpningar inom olika branscher, inklusive hälso- och sjukvård, finans och tillverkning, vilket möjliggör automatisering, förbättrad produktivitet och innovativa lösningar.
Vad är maskininlärning (ML)?

Maskininlärning (ML) är ett delområde inom artificiell intelligens som handlar om att utveckla algoritmer som gör det möjligt för datorer att lära sig och förbättra sin prestanda på specifika uppgifter utan explicit programmering. Genom att bearbeta och analysera stora datamängder kan ML-modeller identifiera mönster, göra förutsägelser och generera insikter, vilket blir mer exakta och effektiva över tid i takt med att de får in mer data. ML-tekniker, såsom övervakad, oövervakad och förstärkt inlärning, har många tillämpningar, inklusive bearbetning av naturligt språk, bildigenkänning och rekommendationssystem.
Vad är generativ AI?

Generativ AI är en delmängd av artificiell intelligens som fokuserar på att skapa nytt innehåll, data eller mönster genom att lära sig av befintliga exempel.

Denna form av AI utnyttjar avancerade maskininlärningstekniker, såsom generativa adversariala nätverk (GAN) och variationella autoencoders (VAE), för att generera tidigare osedda utdata som liknar indata. Tillämpningar av generativ AI omfattar bildsyntes, textgenerering och dataförstärkning, vilket möjliggör innovativa lösningar inom områden som konst, design, underhållning och datavetenskap.
Vad är generativa adversariala nätverk (GAN)?

Generative adversarial networks (GAN) är en klass av maskininlärningsmodeller som är utformade för att generera nya dataprover som liknar en given dataset. GAN består av två neurala nätverk, en generator och en diskriminator, som tränas samtidigt på ett konkurrenskraftigt sätt. Generatorn skapar syntetiska prover, medan diskriminatorn utvärderar de genererade proverna och skiljer dem åt från verkliga data.

Generatorn förbättrar hela tiden sin förmåga att generera data genom att försöka lura diskriminatorn, som i sin tur förbättrar sin förmåga att skilja på verkliga och genererade prover. Denna kontradiktoriska process fortsätter tills de genererade proverna blir nästan omöjliga att skilja från verkliga data, vilket gör GAN:er särskilt användbara i tillämpningar som bildsyntes, dataförstärkning och stilöverföring.
Vad är variationella autoencoders (VAE)?

Variationsautokodare (VAE) är en typ av generativ modell som lär sig att representera komplexa datadistributioner genom att koda indata till en lägre dimensionellt latent utrymme och sedan rekonstruera data från denna komprimerade representation. VAE består av två neurala nätverk: en kodare som mappar inmatningsdata till en sannolikhetsfördelning i det latenta utrymmet och en avkodare som rekonstruerar data från utvalda punkter i denna fördelning.

VAE-modellen tränas för att minimera rekonstruktionsfelet och en regulariseringsterm som uppmuntrar den inlärda fördelningen att anpassa sig till en fördefinierad prioritetsfördelning. VAE-modeller kan generera nya dataprover genom att avkoda slumpmässiga punkter som samlats in från det latenta utrymmet, vilket gör dem lämpliga för tillämpningar som bildgenerering, data denoising och representationsinlärning.

Kontakta oss om du har frågor

Cornelia Jakobsson

info@optitech-sverige.se

+46 72 270 20 49