1import tabula
2# Extaer los datos del pdf al DataFrame
3df = tabula.read_pdf("inforatge.pdf")
4# lo convierte en un csv llamdo out.csv codificado con utf-8
5df.to_csv('out.csv', sep='\t', encoding='utf-8')
6
1# import packages needed
2import glob
3import tabula
4
5# transform the pdfs into excel files
6for filepath in glob.iglob('C:/Users/myfolderwithpdfs/*.pdf'):
7 tabula.convert_into(filepath, output_format="xlsx")