Kategorinė kryžminė entropija yra praradimo funkcija, naudojama atliekant kelių klasių klasifikavimo užduotis. Tai užduotys, kai pavyzdys gali priklausyti tik vienai iš daugelio galimų kategorijų, o modelis turi nuspręsti, kuriai iš jų. Formaliai ji skirta kiekybiškai įvertinti skirtumą tarp dviejų tikimybių skirstinių.
Kodėl naudoti kryžminę entropiją, o ne MSE?
Pirma, kryžminė entropija (arba softmax nuostoliai, bet kryžminė entropija veikia geriau) yra geresnis klasifikavimo matas nei MSE, nes sprendimo riba klasifikavimo užduotyje yra didelė(palyginti su regresija). … Regresijos problemoms spręsti beveik visada turėtumėte naudoti MSE.
Kuo skiriasi reta kryžminė entropija ir kategoriška kryžminė entropija?
Vienintelis skirtumas tarp negausios kategoriškos kryžminės entropijos ir kategoriškos kryžminės entropijos yra tikrųjų etikečių formatas. Kai susiduriame su vienos etiketės, kelių klasių klasifikavimo problema, kiekvieno duomenų etiketės yra tarpusavyje nesuderinamos, o tai reiškia, kad kiekvienas duomenų įrašas gali priklausyti tik vienai klasei.
Kaip interpretuojate kategorinį kryžminės entropijos praradimą?
Kryžminė entropija didėja, kai numatoma mėginio tikimybė skiriasi nuo tikrosios vertės. Todėl numatant 0,05 tikimybę, kai tikroji etiketė yra 1, padidina kryžminės entropijos praradimą. reiškia numatomą to imties tikimybę nuo 0 iki 1.
Kodėl kryžminė entropija yra gera?
Apskritai, kaip matome, kryžminė entropija yra tiesiog būdas išmatuoti modelio tikimybę. Kryžminė entropija yra naudinga, nes ji gali apibūdinti modelio tikimybę ir kiekvieno duomenų taško klaidos funkciją. Jis taip pat gali būti naudojamas apibūdinti numatomą rezultatą, palyginti su tikruoju rezultatu.