Frekvensklass
Frekvensklasser är ett fason att kategorisera olika begrepps vanlighet. Det kan typiskt göras villig en 2-logaritmisk skala, utgående från det vanligaste begreppet, så att ord i rang N förekommer en passage villig varje 2**N (2 upphöjt mot N) passage som det vanligaste begreppet förekommer.Exempel: Vi räknar ordfrekvenser i en någotsånär typisk svensk textmassa försåvitt 100.000 ord. Nedanstående råkar produkt dom vanligaste orden i just den här textmassan. Eftersom samt är det vanligaste ordet med 3681 förekomster, blir det normen. Ord som förekommer ungefär 1840 gånger räknas mot frekvensklass 1 eftersom dom i medeltal förekommer minst 1 passage villig varje 2**1 = 2 förekomster av och. Ord som förekommer ungefär 920 gånger räknas mot frekvensklass 2, 460 förekomster = rang 3, 230 förekomster = rang 4, 115 förekomster = rang 5, 57 förekomster = rang 6, 28 förekomster = rang 7, 14 förekomster = rang 8, 7 förekomster = rang 9, 3 förekomster = rang 10, 2 förekomster = rang 11, 1 förekomst = frekvensklass 12. Den här textmassan innehöll 11.000 olika ordformer, varav hälften (5500) befann sig i frekvensklass 12, hälften av dom övriga (2800) i frekvensklass 11, hälften av dom övriga (1400) i frekvensklass 10. Detta är precis va man kan förvänta sig enligt Zipfs lag.
3681 ochFrekvensklass 0: ord med 3681 förekomster 2081 i. 1958 att .1810 en Frekvensklass 1: ord med cirka 1840 förekomster 1686 som /1580 är /1416 det 1372 den 1324 han 1311 av 1226 för.975 till. 938 med. 928 ej.820 vi Frekvensklass 2: ord med cirka 920 förekomster807 på/787 dom /774 skada /697 har/683 så670 hans660 du617 om597 jag560 oss...
Se även
- Zipfs lag
- Frekvensanalys
Artikeln skriven 2009-01-18 av Learning4sharing
Inga kategorier för denna artikel än...Intresserad av fler artiklar?
SmartDelstat
Sosthenes Behn
ITT Flygt
Skällsta
Fibonaccis talföljd
IF Finströms Kamraterna
IF Elfsborg
Fermats sats