Spellcheck projekat

Svima koji bi željeli da se uključe u projekat spellcheckinga!

Projekat je trenutno u fazi dovršavanja wordliste. Dakle, naši vrijedni kontributori su skenirali Halilovićev Pravopis, ispravili greške i napravili datoteke sa listama riječi za pojedina slova u KWord formatu. Ja sam te datoteke spojio i napravio wordlist.txt (u UTF-8 ) i wordlist-iso.txt (u ISO-8559-2).

Sve ovo se može naći na http://cvs.lugbih.org/cgi-bin/cvsweb.cgi/l10n/spell/

Ono što preostaje da se uradi:

  • Slovo F - prekucano je i sređeno ali nema naših slova. Datoteka je u OpenOffice.org Writer formatu.
  • Slovo G
  • Slovo M
  • Slovo P
    Posljednja tri slova su sirovi OCRovani sken. Treba popraviti greške, pobrisati sve osim same riječi (pogledajte wordlist.txt za primjer), popraviti naša slova. Datoteke su u RTF (Rich Text Format) kojeg mogu otvoriti većina word procesora. Pošto ima puno sitnih datoteka, napravljene su tar.gz arhive.

Ako želite isprobati spellchecking, sva detaljnija uputstva su na adresi http://provjera-pravopisa.lugze.org/ .

Želim sve obavijestiti da treba mnogo više zainteresovanih, da bi se ovaj projekat završio, ali je i trenutno funkcionalan. Ja ga svakodnevno koristim. Podesio sam u KControl da mi default jezik za spellchecking Bosnian, i super odradjuje svoj posao. Provjera pravopisa, je prisutna u svim KDE aplikacijama.

Pošto imamo poteškoća sa LugZe serverom, trenutni URL projekta je:

http://www.lugze.org/index.php?ime=provjera-pravopisa

Također, veoma važna činjenica - aff datoteka je definisana tako da govori ispell programu da je hash datoteka, kodirana u ISO-8559-2, tako ako budete pravili hash datoteku, iz wordliste koja nije ISO-8559-2, onda možete zaključiti koliko će provjera biti funkcionalna.

Pozdrav,

Sa obzirom da je slovo P kao pola pravopisa a ja imam još sedam slobodnih dana ja ću preuzeti to slovo. Nadam se da ćiu ga završiti do početka važnih obaveza…

Radi lakše navigacije, i porasta interesovanja za sam projekat, uradio sam update stranice http://www.lugze.org/provjera-pravopisa .

Završeno je slovo G.

Završio sam i sa ostatkom slova: M i P, i trebali bi uskoro biti na CVS-u. Ova slova nemaju naših slova, što predstavlja sljedeću fazu projekta. A vrijeme je, da nam narod postane pismeniji…:wink:

Postovanje,

trazi se koordinator za ovaj projekat, ja nemam vremena. Ako je ko zainteresovan neka se javi.

Preuzeću ga ja kada završim neke druge stvari (možda krajem godine).

Mislim da nam je spelcheck bio jedina mana nakon izlaska BHLD-a i OO na bosanskom jeziku prema tekstovima u INFO magazinu.

Može li neko skenirati te tekstove i poslati?

BTW čuj mana!? To je isto da ti neko da džaba auto, a ti mu kažeš “eto super ali nije turbo-dizel, to mu je mana”.

Mana jer ga nije bilo - niko Vedrane neće reći hvala na OO na bosanskom jeziku. Jednostavno živimo u takvom okruženju.

Ja takodjer mislim, prije nego sto se OO poceo prevoditi i tolika silna kampanja i napor ulozili u realizaciju tog projekta, da su se prvo trebali udariti dobro temelji za to - SpellCheck. Na taj nacin, neko ko bi probao OOo na Bosanskom bi ostao da ga koristi radi pravopisa. A i pored toga bi imali veliku bazu rijeci koje bi mogli koristiti za rjecnik i dalje prevode. I sada predlazem, ne prvi put, da se napravi neka skripta koja bi .pot fajlove sama prevodila koristeci spellcheck bazu. Pozdrav zajednici.

Pa jeste, nije malo jezika koji imaju spellcheck a nisu ni prevodili interfejs. Ali lakše je organizovati maraton nego napraviti dobar set pravila za spelling :slight_smile: da ne govorimo da nema propisnog rječnika bosanskog jezika koji bi se mogao koristiti za wordlist (Halilović nije rječnik nego gramatika, ne sadrži sve riječi)

ekskjuzes…ekskjuzes…wozdra.ba

Kakvo je trenutno stanje?
Postoji li gdje koja verzija za test?

Postoji, moze se testirati, veceras cu otvoriti ponovo sajt projekta, pa cu postaviti linkove.

Nedim