Kan k-beteken vir kategorisering van teksdata gebruik word?

INHOUDSOPGAWE:

Kan k-beteken vir kategorisering van teksdata gebruik word?
Kan k-beteken vir kategorisering van teksdata gebruik word?

Video: Kan k-beteken vir kategorisering van teksdata gebruik word?

Video: Kan k-beteken vir kategorisering van teksdata gebruik word?
Video: Noam Chomsky on Jung, Wittgenstein, and Gödel (Ask Me Anything) 2024, November
Anonim

K-beteken is klassieke algoritme vir datagroepering in teksontginning, maar dit word selde vir kenmerkkeuse gebruik. … Ons gebruik k-beteken metode om verskeie groepsentroïede vir elke klas vas te vang, en kies dan die hoëfrekwensiewoorde in sentroïede as die tekskenmerke vir kategorisering.

Werk k-beteken met kategoriese data?

Die k-Beteken algoritme is nie van toepassing op kategoriese data nie, aangesien kategoriese veranderlikes diskreet is en geen natuurlike oorsprong het nie. Die berekening van euklidiese afstand vir soos ruimte is dus nie sinvol nie.

Kan k-beteken vir teksgroepering gebruik word?

K-beteken groepering is 'n tipe nie-toesig leermetode, wat gebruik word wanneer ons nie gemerkte data het nie, soos in ons geval, ons het ongeëtiketteerde data (beteken, sonder gedefinieerde kategorieë of groepe). Die doel van hierdie algoritme is om groepe in die data te vind, terwyl die nr. van groepe word verteenwoordig deur die veranderlike K.

Kan ons k-middels gebruik vir klassifikasie?

KMeans is 'n groeperingsalgoritme wat waarnemings in k trosse verdeel. Aangesien ons die hoeveelheid groepe kan dikteer, kan dit maklik gebruik word in klassifikasie waar ons data in groepe verdeel wat gelyk aan of meer as die aantal klasse kan wees.

Watter groeperingsalgoritme is die beste vir teksdata?

vir groepering van teksvektore kan jy hiërargiese groeperingsalgoritmes soos HDBSCAN gebruik wat ook die digtheid in ag neem. in HDBSCAN hoef jy nie die aantal clusters toe te ken soos in k-beteken nie en dit is meer robuust, meestal in raserige data.

Aanbeveel: