Hoje enquanto planeja um sistema procurei alguns recursos que pudessem automatizar alguns processos e dentre elas encontrei uma biblioteca para extrair os textos de um arquivo PDF, achei muito interessante e resolvi compartilhar aqui:
https://github.com/smalot/pdfparser
https://packagist.org/packages/smalot/pdfparser