Djupinlärning (DL)

Fördjupande material

DL-modeller är utmärkta för ostrukturerad data (som bilder, ljud och fri text) och uppgifter som kräver att systemet självt "ser" eller "förstår" komplexa mönster.

Användningsområde Beskrivning Varför DL?
Bild- och Ansiktsigenkänning Identifierar objekt i bilder (t.ex. trafikskyltar) eller namnger personer i foton. DL (specifikt Convolutional Neural Networks – CNN) är bäst på att automatiskt extrahera visuella funktioner från råa pixlar (först kanter, sedan former, sedan hela objekt).
Självkörande Bilar Bearbetar realtidsdata från kameror, lidar och sensorer för att navigera och undvika hinder. Kräver extremt snabb och exakt analys av komplex visuell data (vägförhållanden, fotgängare, andra bilar). Den automatiska feature extraction förmågan är nödvändig här.
Naturlig Språkbehandling (NLP) System som ChatGPT, maskinöversättning (t.ex. Google Translate) och digitala assistenter. DL (specifikt Transformers och RNN/LSTM) kan förstå kontext och betydelse i meningar och paragrafer, vilket är omöjligt med enklare ML-modeller.
Taligenkänning Förvandlar talat ljud (t.ex. Siri, Alexa) till skriven text. Audio är ostrukturerad data. DL-nätverk kan upptäcka mönster i ljudvågorna och koppla dessa till språkets fonetik och syntax.