Fizika, matek, informatika érettségi

Home Fizika Excel Access A weboldalról

55. Szövegelés 2.

5. szint

A szoveg2.txt állományban kb. 50 oldal szöveg található, ami nem tartalmaz ékezetes karaktereket és írásjeleket, minden karakter nagybetűs formában szerepel és a szavakat szóköz vagy új sor választja el. A fájlban található szöveg alapján válaszolj az alábbi kérdésekre!

a) Hányszor fordul elő a szövegben leggyakrabban előforduló mássalhangzó?

b) Melyik az a legalább 6 karakterből álló szó, amely a leggyakrabban szerepel a szövegben? Ha egy szó ragozott és ragozatlan formában is szerepel, azt tekintsd különbözőnek!

c) Hányszor fordul elő a szövegben a leggyakrabban előforduló, legalább 6 karakterből álló szó? Ha egy szó ragozott és ragozatlan formában is szerepel, azt tekintsd különbözőnek! Letöltés: szoveg2.txt

Minta:
a) 7158
b) FELELTE (vagy felelte)
c) 53

(Az a) megoldása karakterenként számolva 7158, ha a TY betűt külön számolva: 7109)


fajl = open('szoveg2.txt')
forras = fajl.read()
fajl.close()
massalhangzok = ['Q','W','R','T','Z','P','S','D','F','G','H','J','K','L','Y','X','C','V','B','N','M']
szamuk = [forras.count(betu) for betu in massalhangzok]
print('2. a)',max(szamuk))

szavak = forras.split(' ')
joszok = [szo for szo in szavak if len(szo)>5]
vanszo = list(set(joszok)) # a szavak halmaza
hanyszor = [joszok.count(szo) for szo in vanszo] # melyik szó hányszor fordul elő
legtobb = max(hanyszor)
legtobb_index = hanyszor.index(legtobb)
print('2. b)',vanszo[legtobb_index])
print('2. c)',legtobb)


Megjegyzés: Érdemes lehet megoldani úgy is, hogy készítünk egy függvényt, ami egy számról eldönti, hogy prím-e, és ezt használjuk.