Învățarea supravegheată și nesupravegheată sunt două tipuri fundamentale de paradigme de învățare automată care servesc unor scopuri distincte pe baza naturii datelor și a obiectivelor sarcinii în cauză. Înțelegerea când să folosiți formarea supravegheată versus formarea nesupravegheată este crucială în proiectarea modelelor eficiente de învățare automată. Alegerea dintre aceste două abordări depinde de disponibilitatea datelor etichetate, de rezultatul dorit și de structura de bază a setului de date.
Învățarea supravegheată este un tip de învățare automată în care modelul este antrenat pe un set de date etichetat. În învățarea supravegheată, algoritmul învață să mapeze datele de intrare la ieșirea corectă prin prezentarea unor exemple de antrenament. Aceste exemple de antrenament constau din perechi intrare-ieșire, unde datele de intrare sunt însoțite de valoarea țintă sau de ieșire corectă corespunzătoare. Scopul învățării supravegheate este de a învăța o funcție de mapare de la variabilele de intrare la variabilele de ieșire, care pot fi apoi folosite pentru a face predicții asupra datelor nevăzute.
Învățarea supravegheată este de obicei utilizată atunci când rezultatul dorit este cunoscut și scopul este de a învăța relația dintre variabilele de intrare și de ieșire. Se aplică în mod obișnuit în sarcini precum clasificarea, unde scopul este de a prezice etichetele de clasă ale noilor instanțe și regresia, unde scopul este de a prezice o valoare continuă. De exemplu, într-un scenariu de învățare supravegheată, puteți antrena un model pentru a prezice dacă un e-mail este sau nu spam, pe baza conținutului e-mailului și a stării etichetate ca spam/non-spam a e-mailurilor anterioare.
Pe de altă parte, învățarea nesupravegheată este un tip de învățare automată în care modelul este antrenat pe un set de date neetichetat. În învățarea nesupravegheată, algoritmul învață modele și structuri din datele de intrare fără feedback explicit asupra rezultatului corect. Scopul învățării nesupravegheate este de a explora structura de bază a datelor, de a descoperi modele ascunse și de a extrage informații semnificative fără a fi nevoie de date etichetate.
Învățarea nesupravegheată este folosită în mod obișnuit atunci când scopul este de a explora datele, de a găsi modele ascunse și de a grupa puncte de date similare împreună. Este adesea aplicat în sarcini precum gruparea, unde scopul este de a grupa puncte de date similare în clustere pe baza caracteristicilor lor și reducerea dimensionalității, unde scopul este de a reduce numărul de caracteristici, păstrând în același timp informațiile esențiale din date. De exemplu, într-un scenariu de învățare nesupravegheat, puteți utiliza gruparea pentru a grupa clienții pe baza comportamentului lor de cumpărare fără cunoștințe prealabile despre segmentele de clienți.
Alegerea între învățarea supravegheată și nesupravegheată depinde de mai mulți factori. Dacă aveți un set de date etichetat și doriți să preziceți rezultate specifice, învățarea supravegheată este alegerea potrivită. Pe de altă parte, dacă aveți un set de date neetichetat și doriți să explorați structura datelor sau să găsiți modele ascunse, învățarea nesupravegheată este mai potrivită. În unele cazuri, o combinație de tehnici atât supravegheate, cât și nesupravegheate, cunoscută sub numele de învățare semi-supravegheată, poate fi utilizată pentru a valorifica beneficiile ambelor abordări.
Decizia de a folosi formarea supravegheată versus formarea nesupravegheată în învățarea automată depinde de disponibilitatea datelor etichetate, de natura sarcinii și de rezultatul dorit. Înțelegerea diferențelor dintre învățarea supravegheată și nesupravegheată este esențială pentru proiectarea modelelor eficiente de învățare automată care pot extrage perspective semnificative și pot face predicții precise din date.
Alte întrebări și răspunsuri recente cu privire la EITC/AI/GCML Google Cloud Machine Learning:
- Ce este textul în vorbire (TTS) și cum funcționează cu AI?
- Care sunt limitările în lucrul cu seturi mari de date în învățarea automată?
- Învățarea automată poate ajuta la dialog?
- Ce este locul de joacă TensorFlow?
- Ce înseamnă de fapt un set de date mai mare?
- Care sunt câteva exemple de hiperparametri ai algoritmului?
- Ce este învățarea prin ansamblu?
- Ce se întâmplă dacă un algoritm de învățare automată ales nu este potrivit și cum te poți asigura că îl selectezi pe cel potrivit?
- Un model de învățare automată are nevoie de supraveghere în timpul antrenamentului?
- Care sunt parametrii cheie utilizați în algoritmii bazați pe rețele neuronale?
Vedeți mai multe întrebări și răspunsuri în EITC/AI/GCML Google Cloud Machine Learning