Python - amatersko pitanje/zamolba glede uređivanja/iteriranja teksta

volimcvijece · November 16, 2011, 10:48pm

pozdrav ljudi!
guglanjem python korisnika sam došao do ovog foruma koji mi se čini najaktivniji po tom pitanju. e sad, znam da pitanja početnika znaju biti dosadna, ali eto, ja sam početnik, učim python na faksu (kao obradu teksta) i malo sa strane u vezi winsound librarya, ali eto, poprilično sam zapeo sa onim što bi trebalo biti lakše, obradom jezika. zadatak kreće ovako. imamo UTF-8 tekstualnu datoteku, nazovimo je maštovito “fajl”, i u njoj su nabacani imena učenika, sa dva broja poslije, što predstavlja broj grupe i broj dolaska, poput
"Ivo Ivić 2 1" sa tim da u pythonu izbacuje i simbol nalik kvadratu (nešto poput []), kojeg ne mogu c/pat, pretpostavljam da se radi o nekoj vrsti tabulatora. u datoteci su ta imena sa brojčanim vrijednostima samo poslagana jedna za drugom. i sada, treba proći kroz datoteku i napraviti određene stvari, poput 1) stvaranja nove txt datoteke u kojoj će biti samo ime i prezime, sa time da svako ime i prezime bude u svom redu , 2)izračunati broj iz druge grupe (tj, prva brojčana vrijednost nakon imena) i 3) za svako ime i prezime napraviti novi zapis na način da uzmemo samo prvo slovo imena i do 7 slova prezimena i izmijenimo dijakritičke znakove.
znam da će te mi reći “potrudi se sam” itd, ali kako ne mogu na predavanja radi posla, do sad sam sve uspio guglanjem, ali proceduru za ovakve tekstualne primjere ne mogu nigdje pronaći, i samim time ni naučiti nadam se da vam predstavlja barem neki mali izazov da riješite sa razlogom icon_biggrin svejedno hvala!

volimcvijece · November 16, 2011, 10:49pm

(pod 2) mislim na broj osoba koji imaju brojčanu vrijednost “2” nakon imena i prezimena ><)

volimcvijece · November 16, 2011, 10:54pm

(ne trebate riješavati, bio bi zahvalan na nekom hintu! :D)

adis · November 17, 2011, 10:51am

Za početak, uvjeri se da je ta datoteka stvarno UTF-8, otvori je u tekst editoru. Ne bi trebalo biti čudnih znakova.

Provjeri encoding source koda, te kod s kojim otvaraš datoteke, evo uputstava:
http://docs.python.org/howto/unicode.html/
(obrati pažnju na “Reading and Writing Unicode Data”)

volimcvijece · November 17, 2011, 5:35pm

hvala na linku! provjerio, datoteka je utf-8. u tekst editoru je sve u redu, osim tih “kvadrata” što je vjerojatno ekvivalent u notepadu za \n, kako ga izbacuje u pythonu. inače, nakon
import codecs
f = codecs.open(‘primjer2.txt’, encoding=‘utf-8’, mode=‘r’)
g=f.readlines()
print g

u pythonu dođe [u’Ivan\tAd\u017eaga\t1\t1\n’, …ostatak sadržaja iste forme… ]
sada, iteriranje mi je najteži dio

volimcvijece · November 18, 2011, 12:15am

probao, ali ne ide, pa ipak trebam apelirat pri pomoć za kodu za 1) stvaranje nove txt datoteke u kojoj će biti samo ime i prezime, sa time da svako ime i prezime bude u svom redu , 2)izračunati broj iz druge grupe (tj, prva brojčana vrijednost nakon imena) i 3) za svako ime i prezime napraviti novi zapis na način da uzmemo samo prvo slovo imena i do 7 slova prezimena i izmijenimo dijakritičke znakove.
hvala na eventualnoj pomoći, frustrirajuće je kad ni sa googleom ne možeš doći do riješenja

volimcvijece · November 19, 2011, 12:09am

očito ništa
nema veze, fala ljudi, izvinjavam se na gnjavaži. možete slobodno lockat topic, do nedjelje moram predat rad, i rado bi poslije postao riješenje da mogu doći do njega

trip0d · November 19, 2011, 7:20pm

evo hint:
file = open(“file.txt”)
for red in file.readlines():
info = red.split()
ime = info[0]
prezime = info[1]
broj1 = info[2]
broj2 = info[3]
print ime, prezime, broj1, broj2
print ime[0]+prezime[:7]

Eto iteracija, a sa podacima dalje radi sta ti volja…(brojeve prije sabiranja moras konvertovati jer su podaci u fajlu stringovi, a isto tako prije snimanja u fajl, moras konvertovati u string) i imas vremena jos do sutra da doradis…
Google ti nece dovesti do rjesenja, nego do dijelova slagalice, a ti trebas da sklopis sve sto ti treba!!

Pozz