Clipboard ne kopira č,ć,đ !

Kada hoću da kopiram tekst iz nekog pdf dokumenta i Libre office ili bilo gde, samo mi č,ć i đ neče da kopira, a sve ostala slova hoće bez problema. Probao sam da otvorim preko Ocular, i iz nujega da kopiram, al jok. Probao da konvertujem preko Calibre, al opet jok. Calibre čak neće ni da konvertuje dokument, samo izbacio grešku da nije uspeo.

Da li ima neko ko bi znao šta mi valja činiti ?

Сад чувени одговор, Мени све ради. :slight_smile: Него јел ти то мислиш искључиво на пдф фајл који отвараш различитим програмима или на сваки текстуални фајл који садржи та слова

Konkretno mislim na taj odredjen pdf fajl koji otvaram razlicitim programima. Probao sam i u Windowsu, isti problem. Da li je moguce da je pdf ne kompitabilno napravljen ili tako nesto, sto se tice karaktera i njihovog prepoznavanja izmedju sistema?

Nemam pojma, mozda nemas slicnog fonta, vise nema acroridera. Okaci file ovd tj. iseci parce u novi pdf pa da vidimo. Da nisi koristio kojekakve bivse kodne rasporede za nasa slova
pa je od toga napravljen pdf.

Nisam ja pravio taj pdf, tako da zaista ne znam nista o tome vezano za kodne rasporede. U pitanju je pdf sa posla, clanovi zakona. Evo i linka:

https://www.box.com/s/juj7trc73oippza80zxx

Upravo sam probao i neki drugi pdf, ista prica i na kompu na poslu i ovaj kod kuce. Kad predjem preko reci gde imaju pomenuta slova, jednostavno tu stavi prazan prostor ili onaj mali pravougaonil=k.

Ajd probaj ovaj pdf uz poruku…

Ako je u redu kao što mislim, i kao što sam kod mene isprobao, onda je problem do kreatora zakona :wink:

Idioti ne znaju za opciju “embeded fonts” prilikom kreiranja pdf-a

[ATTACH]1012.IPB[/ATTACH]

[ATTACH]1013.IPB[/ATTACH]

Da, da ovaj lagano radi. Znaci ipak je do .pdf i koriscenih fontova koji nisu kombitabilni sa svakom platformom?

@Djomlatan

Problem je što prilikom kreiranja pdf-a nije korišćena opcija “embeded fonts”, koja služi upravo za ovu namenu, da primalac pdf-a može da kopira/prenosi text pravilno, bez obzira koje fontove ima instalirane…

U open/libre ofisu, kada radiš export u pdf, opcija za “embeded fonts” je File/Export as PDF/ pa u prozoru za izbor opcija koji se otvori, štikliraš opciju PDF/A-1a… slika bolje objašnjava :slight_smile:

[ATTACH]1014.IPB[/ATTACH]

Da. Hvala na objasnjenju, ovo zaista nisam znao.
Kontam da ljudi koji su pravili ovaj pdf fajl su koristili windows, predpostavljam XP sp2, pitanje je da li su uopste u upoznati za tom mogucnoscu.

Pa dobro, ima li nekog konkretnog resenja kada se ovako nesto pojavi? Sem sto sam im vec poslao mail da mi posalju taj tekst u word dokumentu. :slight_smile:

Originalan txt je najbolje rešenje :slight_smile:
Međutim, pošto to nije baš uvek moguće, probaću da smislim nešto upotrebljivo…opcija Find&Replace je moćna, ali su problem praznine umesto slova, znači treba pokušati prepraviti prvo pdf direktno…

to je u ovom slucaju isuvise uzaludan posao :slight_smile: Najbolje je lepo kreatora obavestiti i da posalje kako valja.

Jeste najbolje, ali problem nastaje kada ne znaš kreatora :slight_smile:

U međuvremenu, malo sam kopao i pronašao rešenje…verovatno nije baš najelegantnije na svetu, ali (može da) završi posao :slight_smile:

Prvo, instaliraj

sudo apt-get install python-pdfminer

Zatim otvori terminal u direktorijumu gde ti se nalazi pdf koji hoćeš da obradiš (kod mene sam sve prebacio na desktop, zbog slika), i zadaj komandu

pdf2txt -o fajl.txt fajl.pdf

dobićeš txt fajl sa problematičnim slovima koja više nisu praznine, nego su označena kodovima… (cid:255) je malo “đ”, (cid:253) veliko “Č” itd

Sada dobijeni txt otvoriš u Open/Libre ofisu, ideš na Edit/ Find&Replace, i u prozorčetu koje se otvori, u Search polje ukucaš željeni kod, u replace polje slovo koje će ga zameniti, klikkneš na Replace All i za sekundu su kodovi zamenjeni ispravnim slovima…ovu operaciju ponoviš onoliko puta koliko ima nedostajućih naših slova (mislim da ih je bilo ukupno 4)

U prilogu je skrinšot koji bolje od mene objašnjava kako se šta radi, kao i problematični zakon :slight_smile:

Jedini problem, koji ne umem za sada da rešim, je formatiranje, koje moraš ručno da odradiš u ofisu, ali i to je za nijansu bolje od ručne zamene svih nedostajućih slova u fajlu :slight_smile:

Srećno :slight_smile:

[ATTACH]1015.IPB[/ATTACH]

[ATTACH]1016.IPB[/ATTACH]

Neizmerno hvala na ovome tutorijalu. Ja se cimao sa raznim mogucnostima preko nekih programa sa copy paste varijantom, pa gledao da li mi fontovi fale…
Mada sam odradio ja i pre to konvertovanje u txt fajl, i preko libre office i preko Calibre, ali ne setih se toga, zamene karaktera.
Sto se tice formatiranja tice, to nije problem, vazno je da iscitava karaktere, to posle ide u html, pa se tamo formatira.
Hvala jos jednom puno!!! :drinks:

@Djomlatan

:drinks: