Recomandare soft pdf to excel

Discutii despre orice are macar putina legatura cu domeniul IT
IPP
Moderator
Moderator
Mesaje: 3857
Membru din: Mie Iul 29, 2009 7:26 am
Localitate: Cluj-Napoca

Recomandare soft pdf to excel

Mesaj de IPP » Joi Mar 14, 2019 2:37 pm

Buna ziua

As dori sa stiu daca imi poate recomanda cineva un soft (inclusiv care necesita achizitionarea licentei, mai putin licenta Adobe de mii de euro, doar denumirea) care sa poata sa faca o conversie 100% corecta a informatiei utile dintr-un pdf intr-un fisier excel (.xls*). Ma refer la ceva chiar folosit in mod curent cu rezultate pe deplin corecte pentru ca diverse servicii online am mai testat si noi si rezultatele au fost de la imposibilitatea de a converti tot fisierul la convertiri incomplete sau chiar gresite a informatiei utile. Si nu ajuta pe nimeni sa obtii o conversie in cateva secunde si apoi sa stai cateva ore sa verifici si sa corectezi informatia pentru a ajunge sa o poti prelucra in excel mai departe.

Din ce stiam, Adobe e creatorul formatului pdf si teoretic tot ei ar trebui sa ofere si tool-ul necesar cel mai bun. Acum, facand abstractie de preturile softului Adobe (ca ma indoiesc ca se poate cumpara exclusiv doar acel tool de conversie), nu am mai apucat sa vad ce au inbunatatit, stiu doar ca acum aproximativ 6 ani am gasit intr-un astfel de soft (licentiat, legal) posibilitatea de export pdf to excel ca optiune nativa insa rezultatul exportului/conversiei a fost, cel putin in acel caz, dezamagitor. Sau mai pe scurt, informatia a ajuns in excel dar intr-o forma inutilizabila.

Multumesc,
IP

Dr.Windows
Site Admin
Site Admin
Mesaje: 4564
Membru din: Vin Iul 31, 2009 7:32 am

Re: Recomandare soft pdf to excel

Mesaj de Dr.Windows » Joi Mar 21, 2019 9:46 am

Salut IPP,

Din pacate nu cred ca exista un raspuns multumitor pentru acest tip de conversie.

Adobe Reader (nu e nevoie de Acrobat PRO) ofera in setul de instrumente un "Export PDF" care se poate achizitiona ca serviciu. Pretul pentru simplu export catre Word, Excel incepe de la cca 2 euro pe luna, mai multe detalii aici.

Doar ca nu trebuie sa te astepti la "minuni", pentru ca daca de la PDF la Word ai sanse 99% sa iti iasa... de la PDF la Excel nu stiu daca ai sanse mai mari de 90% pentru ca orice element grafic din PDF va incurca foarte mult si va distruge orice structura tabelara.

Singura sansa ar fi cu multa rabdare, dupa ce extragi tot textul din acel pdf (gen CTRL+C, CTRL+V in Word\Excel\Notepad) sa cauti "regulile" dupa care te poti ghida ca sa poti aseza informatia corect in Excel. Daca PDF-urile vin din aceeasi "sursa" sunt sanse sa obtii o informatie utilizabila... dar daca vin din surse diferite... putin probabil.

O zi excelenta!

mariusc
Mesaje: 269
Membru din: Vin Sep 28, 2012 6:24 pm

Re: Recomandare soft pdf to excel

Mesaj de mariusc » Vin Apr 12, 2019 4:12 pm

Salutare,
Candva foloseam pentru OCR softul Abbyy Fine Reader. Au si preturi afisate.
https://www.abbyy.com/en-eu/finereader/features/
https://www.abbyy.com/en-eu/finereader/tech-specs/
Spor

Catalin B.
Moderator
Moderator
Mesaje: 762
Membru din: Vin Sep 09, 2011 4:05 pm
Localitate: Iaşi

Re: Recomandare soft pdf to excel

Mesaj de Catalin B. » Sâm Apr 20, 2019 6:23 am

Exista si o solutie mai noua, free.
In Power BI a aparut de ceva vreme o versiune beta de import from PDF. Dupa import si procesare cu Power Query (in Power BI evironment), se poate exporta rezultatul cu Transform->Run R Script (se utilizeaza limbajul R integrat), cu un cod simplu:
write.csv(dataset,"e:\\test.csv")
Pentru export in xlsx, trebuie instalat pachetul openxlsx in R GUI , codul pentu export este simplu:

Cod: Selectaţi tot

require(openxlsx)
write.xlsx(dataset,"e:\\test.xlsx")
Mai mult, exista optiunea ca rezultatul sa fie exportat intr-un tabel definit:

Cod: Selectaţi tot

require(openxlsx)
write.xlsx(dataset,"e:\\test.xlsx", asTable = TRUE)
Sper sa fie adaugata functiunea asta si in Excel Power Query dupa ce iese din stadiul de beta.
Exista ceva probleme, de exemplu nu proceseaza fisierele PDF ce contin xfa forms (create cu live cycle designer), poate va fi mai bine in versiunile urmatoare.

Din pacate, nu exista un convertor care sa poata afirma ca are acuratete de 100%. Nici Adobe Acrobat nu face o conversie decenta, am folosit Acrobat 8 si 10. E o imbunatatire semnificativa la versiunea 10 fata de 8, dar tot Abby Fine Reader face o conversie mai buna. Avantajul Abby este ca are o interfata de conversie, in care poti sa selectezi elementele din pagina pe care le vrei, poti alege inclusiv formatul pentru acea selectie: imagine, text, tabel, se poate seta si limba folosita la conversie (are si romana, recunoaste caracterele romanesti).
Nici Abby nu face o conversie 100% precisa, desi este cel mai avansat convertor cu care am lucrat. Totul depinde de calitatea fisierului PDF, la un document scanat de exemplu vor fi probleme.
Nu aveţi permisiunea de a vizualiza fişierele ataşate acestui mesaj.
Probleme să fie, că soluţii se găsesc...

Catalin B.
Moderator
Moderator
Mesaje: 762
Membru din: Vin Sep 09, 2011 4:05 pm
Localitate: Iaşi

Re: Recomandare soft pdf to excel

Mesaj de Catalin B. » Sâm Apr 20, 2019 8:47 pm

Ca sa completez raspunsul anterior, anexez si un fisier pdf, impreuna cu conversiile facute de Acrobat 10, Abbyy, si Power BI.
Ca sa functioneze R scripts in Power BI, trebuie instalat: https://mran.revolutionanalytics.com/download
Desi fisierul PDF este "aparent" perfect, de fapt pretul are 2 coloane. Structura depinde de modul in care a fost creat acel pdf. Cel mai probabil, a fost creat din Word sau Excel, utilizatorul a introdus simbolul "$" intr-o coloana iar pretul in alta coloana, apoi a imprimat acel sheet ca PDF. Deci lipsa de cunostinte de baza in utilizare office duce la crearea unor structuri incorecte in PDF, chiar daca vizual pagina arata acceptabil.
Desi Acrobat si Abbyy au recunoscut corect formatarile de contur tabel si au efectuat corectii de structura, Power BI a identificat structura asa cum a fost ea creata si a produs 4 coloane, in loc de 3.
Pentru ca structurile "ciudate" pot fi extrem de diverse, cu coloane/randuri ascunse, casete imbinate, e practic imposibila o conversie precisa.
Nu aveţi permisiunea de a vizualiza fişierele ataşate acestui mesaj.
Probleme să fie, că soluţii se găsesc...

Scrie răspuns

Înapoi la “Discutii libere (Cafenea)”